您现在的位置是:首页 >学无止境 >【Linux】进程的概念网站首页学无止境

【Linux】进程的概念

yy_上上谦 2023-06-02 08:00:03
简介【Linux】进程的概念

📖 前言

在前面我们学习了Liunx的基本指令和权限相关知识,还有基本工具的使用,有了以上的基础知识我们本章将正式接触操作系统,搬好小板凳要开讲了🙋🙋🙋……


1. 冯·诺依曼体系结构

我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系。

在这里插入图片描述

  • 输入设备: 键盘,话筒,摄像头,磁盘,网卡……
  • 输出设备: 显示器,音响,磁盘,网卡,显卡……
  • (运算器 + 控制器)[CPU]: 算数计算 + 逻辑计算
  • 存储器: 就是内存,不是磁盘!

出了内存之外剩下的就是外设了~

1.1 内存存在的意义:

为什么要有内存?

  • a. 技术角度:
    • 存储速度的差别: cpu的运算速度 > 寄存器的速度 > L1 ~ L3Cache(各种缓存Cache) > 内存>> 外设(磁盘)>> 光盘磁带
  • b. 数据角度:
    • 外设不和CPU直接交互,而是和内存交互,CPU也是如此。
  • c. 成本角度:
    • 造价: 寄存器 >> 内存 >> 磁盘(外设)

如果冯诺依曼体系结构中没有内存的话:

  • 那么整个体系的效率是很低下,因为是由最慢的设备决定的。
  • 计算CPU速度够快,但是还是要等外设,这既是著名的木桶原理

当整个体系结构加上内存之后:

  • 因为中央处理器只和内存做数据交互,输入设备也和内存做交互。
  • 所以整个体系的效率就以内存为主要衡量标准。
  • 不以外设为标准,引入了存储器的设备,可以让整体效率以存储器为标准。
  • 内存的意义:
  • 有存储器的存在让软件的存在具有了更大的意义。开机的时候就是将操作系统加载到存储器当中。
  • 内存对应的最大意义:使用较低的钱的成本,能够获得较高的性能!

补充:

  • 中央处理器CPU也会和外说有交互,协调数据流向。
  • 中央处理器CPU只是个具有运算和控制能力的提现木偶,真正让中央处理器去完成计算和某些控制的是整个计算机的大脑,叫做软件,最具有代表性的就是操作系统,是操作系统来控制CPU的。

1.2 程序加载到内存的意义:

  • 在我们之前学习编程语言例如:C/C++时,我们都听过这样一句话:
  • 自己写的软件/程序,编译好之后,要运行,必须先加载到内存。

为什么???

  • 答案就是由体系结构(冯·诺依曼体系结构)决定的。

具体解释:

  • C/C+编译好的程序就必须从磁盘加载到内存要让CPU能够读取。
  • 我们编译好的程序是个文件是在磁盘上(外设),CPU读取数据,必须通过存储器读取,所以也就要求要运行程序,就必须将程序先加载到内存,因为CPU只会从内存当中读取指令代码和数据。

1.3 程序的预加载:

  • 几乎所有的硬件,只能被动的完成某种功能,不能主动的完成某种功能,一般都是要配合软件完成的(OS + CPU)
  • 开机等待本质是将操作系统加载到内存当中,因为体系结构规定,CPU要执行代码,执行的可不仅仅是我们写的代码,还有操作系统的代码所以必须先把操作系统加载到内存,这就是预加载。
  • 当启动时还没有执行,此时数据已经被预加载到了内存,CPU可能在进行某种其他的计算,这样就能把加载的过程和CPU运算的过程并行起来。
  • 操作系统一旦被加载之后,在软件层面上,就可以预先把将来要访问的数据或文件也可以提前加载到内存当中。

数据在流动的时候,从输入到内存,从内存到CPU,CPU计算处理完,将结果写回内存,然后定期再刷新到外设。

补充:

内存的存在可以去适配外设和CPU之间速度不匹配的问题,因为内存的存在可以去预先装载一些常见的内存管理软件,数据管理软件,就可以将数据以预加载的方式提前放在存储器当中,以提高中央处理器读取效率,就可以让我们以较高的效率完成计算和存储的任务。


2. 认识进程

2.1 如何理解管理:

  • 管理的本质是:对数据的管理。
  • 管理的本质:不是对被管理对象进行直接管理,而是只要拿到被管理对象的所有的相关数据,我们对数据的管理,就可以体现对对象的管理。
  • 管理的核心理念:先描述,再组织。
  • 当我们要管理的对象数目巨大,例如一个学校的学生,而每个学生身上又有大量的属性的时候,例如:每个学生都有自己的个人信息,身高、体重、年龄……
  • 大量的数据堆在一起很显然是不好管理的,我们可以先将每个对象描述起来,例如将每个学生描述为一个结构体,结构体内有学生的各种属性,然后再将这些结构体组织起来。
  • 组织起来的方式有很多,这就是我们之前学的数据结构啊。

先描述再组织,用C语言或C++描述,用数据结构组织数据。管理的本质对数据做管理 --> 对数据的管理 --> 对某种数据结构的管理 --> 对数据结构的各种操作,增删查改。

重点:

其实操作系统是一款软件,是一款专门搞管理的软件,软件可以管理软件,就像人可以管理人一样~


2.2 什么叫是进程:(初步理解)

进程是一个运行起来的程序。

一般书上都会那么说,真的让人理解起来一头雾水,脑子里一篇空白😓😓😓,进程和程序的区别是什么?一个跑一个没跑,这是用形容词描述的,用名词怎么描述??

下面我们来慢慢讲🙋🙋🙋……

  • 首先我们要知道,程序是个文件,是存在磁盘上的,然后不能简单的认为,将程序从磁盘加载到内存,这个程序就是进程了,就像随便一个人进入学校不能够称之为学生一样。

  • 再者我们要知道,操作系统里面可能同时存在大量的进程!

  • 操作系统要不要将所有的进程管理起来呢?答案是肯定的!

  • 对进程的管理,本质是不是就是对进程数据的管理?答案是肯定的!

那我们对进程的管理,核心是不是:先描述,再组织呢?答案是肯定的!

PCB(proccess ctrl block):

  • 描述进程的结构体我们叫做PCB
  • 也叫做进程控制块
  • Linux中的task_struct是一款具体的PCB

当一个程序加载到内存时候,不仅仅是将代码和数据加载到内存,操作系统还要为了管理该进程创建对应的数据结构。
在这里插入图片描述

  • 初步认识进程的概念:(重点)
  • 我们把一个进程的task struct结构和对应的可执行程序合起来才叫一个进程。
  • 进程 = 可执行程序 + 该进程对应的内核数据结构

有大量的进程就必须把进程先描述再组织起来,把进程组织起来实际上是把描述进程的进程控制块组织起来。

那我们学习进程到底学的是什么呢?

  • 我们学习的是进程控制块里面有什么属性!

第一阶段对进程的理解总结:

  • 当一个程序从磁盘加载到内存,将代码和数据加载到内存只是第一步,第二步,操作系统为了管理这个进程,需要为该进程创建对应的描述该进程的进程控制块PCB,Liunx 下叫task struct。
  • 只要在内存当中被操作系统管理,操作系统实际管的根本不是代码和数据,而是管的则是进程的PCB结构体。
  • 第一阶段进程的理解:程序加载到内存之后的代码和数据,以及操作系统为了管理进程,所生成的描述进程的进程控制块PCB结构体(内核数据结构 + 代码和数据,这二者合起来,叫做进程)。
  • 一个进程有一个PCB描述起来了,系统中有大量的PCB,只需要将系统中的PCB用数据结构组织起来,对应的对进程的管理就变成了对数据结构的增删查改。

3. 简单认识操作系统

在这里插入图片描述

3.1 操作系统如何提供服务:

计算机和OS设计出来就是为了给人们服务的,那么是如何给我们提供服务的呢?

我们调用printf函数向显示器打印,显示器是硬件,所谓的打印,本质就是将数据写到硬件上,那我们写的C语言能直接访问硬件吗?

  • 答案是不能!!打印不是直接写到硬件上,而是通过间接的方式。
  • 所有的应用程序都没有资格直接访问硬件,因为硬件的管理者是操作系统。
  • 操作系统是不相信任何人的!不会直接暴露自己的任何数据结构,代码逻辑,其他数据相关的细节!!
  • 因为我们普通人写的代码或者软件没有资格直接访问硬件,需要计算机提供对应的服务。

操作系统是不相信任何人的要防止少数人,又要给多数人提供服务,所以操作系统是通过给用户提供接口的方式为用户提供服务的~

  • Linux操作系统是用C语言写的,这里所谓的“接口”,本质就是C函数!

  • 我们学习系统编程本质就是在学习这里的系统接口。

我们如何调用系统调用接口:
在这里插入图片描述

  • 要是小白的话,我们可以通过图形化界面或者是命令行指令来调用系统接口,在我们日常的生活中,安装卸载软件、本质就将各种资源拷贝到本地磁盘目录下,下载还用了网卡。我们只是用了图形化界面点击了一下,这就是管理操作。

  • 要是初级工程师,就像正在学习的我们,会调用C语言的printf函数来将内容打印到显示器上,但是我们并没有自己实现printf函数,但是我们清楚地知道:

    • 链接就是将库里面的代码和我们的代码合起来,库中的方法里面一定有对应的方法,底层一定有调用系统调用接口,只是我们平时不知道而已。

此时上层用中就可以做管理工作,开发工作,命令行操作。

补充:

  • 一门语言跨平台可移植,在Windows和Linux下都能选择其对应的接口,上层提供的都是printf(),原因标准库中用了多态,同个接口在不同的平台下实现同一个或者不同的功能。

4. 查看进程

  • 我们自己写的代码,编译成为可执行程序,启动之后就是一个进程!
  • 那么别人写的呢??启动之后是不是进程呢??肯定算!!

那么我们之前学习的各种指令,执行指令也是进程。

4.1 第一种查看进程的方式:

在这里插入图片描述

  • a:all
  • j:jobs
  • x:以特定格式显示

通过ps指令,后面的axj几个选项的顺序无所谓,这是显示所有的进程。

我们写一个简单的死循环然他一直在跑,我们来查看一下它的进程~

结合我们之前学的指令,我们可以查看指定的进程:

在这里插入图片描述
我们调用了grep指令,所以这里查看进程的时候也是能显示grep进程的。

显示出前五行:
在这里插入图片描述

只显示要查看的进程:

在这里插入图片描述
只要匹配到-v后面的关键字一律不显示。

Windows下是通过双击打开一个进程, 而Linux则是通过./启动,在系统中找到可执行程序启动,这两者在系统层面上一模一样~


4.2 第二种查看进程的方式:

Linux的根目录下有个proc目录里面放的就是实时的进程:
在这里插入图片描述
proc:process,内存文件系统,里面放的是当前系统实时的进程信息。

查看进程的ID:
在这里插入图片描述
既然proc里面存的是实时的进程,那么我们就可以查到当前正在跑的进程:

在这里插入图片描述


当我们将刚刚的进程结束掉之后,再次执行以下mytest这个可执行程序,我们发现进程的ID发生了变化:

在这里插入图片描述
所以重启之后就是一个新的进程了。

我们在proc中打开这个进程,可以查看它的详细属性:

在这里插入图片描述


5. 对当前路径的理解

在我们之前学习C / C++语言的时候,我们就只是肤浅的理解当路径就是源文件所在的路径。

事实真的是这样吗??

答案并不是!!!

我们用ls -al选项来在proce目录中对应的进程中看一下它的更详细的属性:

在这里插入图片描述
我们可以看到进程当前的工作路径,和进程所对应的可执行程序在磁盘上所对应的位置。

我们在源文件代码中加一个新建文件的语句,目的就是看看当前路径到底是指的什么:

同时我们还将可执行文件移出当前路径:

在这里插入图片描述
我们再将程序跑起来:

在这里插入图片描述

  • 其实我们发现了,cwd和exe都已经在了test这个路径下,并不是源文件的路径。
  • 更重要的是,我们代码中创建的文本文件此时也是创建在了test这个路径下。
  • 这就充分说明了,当前路径并不是源文件所在的路径,而是进程工作的路径。
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。