进程基本概念
- 冯诺依曼体系系统
- 操作系统
- 总结
- 系统调用和库函数概念
- 进程
- 基本概念
- 描述进程 PCB
- task_struct
- task_struct内容分类
- 前台进程
- 删掉后台进程
- 组织进程
- 查看进程
- 通过系统调用获取进程标识符
- 通过系统调用创建进程-fork初识
- 进程状态
- 进程状态查看
- Z(zombie):僵尸进程
- echo $?
- 僵尸进程的危害
- 孤儿进程
- 进程优先级
- 查看系统进程
- PRI和NI
- 查看进程优先级的命令
- 其他概念
冯诺依曼体系系统
我们常见的计算机,服务器大部分都遵循冯诺依曼体系
目前为止,计算机都是由一个个硬件组成
- 输入单元:键盘,鼠标,扫描仪,话筒,摄像头,网卡,硬盘等
- 中央处理器(CPU):运算器,控制器等
- 输出单元:显示器,打印机,音响,网卡,硬盘等
总结:
1、站在硬件角度&&在数据层面上,CPU只和内存打交道,外设只和内存打交道
2、数据要处理,必须预装载到内存中,局部性原理,由操作系统完成预装
程序要运行之前必须得先加载到内存中,为什么?
答:可执行程序 (文件)是在硬盘上(外设)
操作系统
概念:任何计算机系统都包含一个基本的程序集合,称为操作系统(OS),笼统的理解,操作系统包括:
-
内核(进程管理,内存管理,文件管理,驱动管理)
-
其它程序(函数库,shell程序等)
设计OS的目的 -
与硬件交互,管理所有的软硬件资源
-
为用户程序(应用程序)提供一个良好的执行环境
总结
计算机管理软件
- 1、描述,用struct 结构体
- 2、组织,用链表或其他高效的数据结构
系统调用和库函数概念
- 在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用
- 系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以开发者对部分系统调用进行封装,从而形成库,有了库,就更有利于开发者进行二次开发
进程
基本概念
- 概念:程序的一个执行实例,正在执行的程序等
- 内核观点:担当分配系统资源(CPU时间,内存)的实体
描述进程 PCB
- 进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合
- PCB(process control block),Linux下task_struct是PCB的一种
task_struct
- 在Linux中描述的进程结构体叫 task_struct
- task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程信息
task_struct内容分类
- 标示符:描述本进程唯一的标示符,用来区别其他进程 pid ppid
- 状态:任务状态,退出代码,推出信号等 STAT:S+:休眠 R+:运行 R:后台运行
- 优先级:相对于其他进程的优先级
- 程序计数器:程序中即将被执行的下一条指令的地址PC/EIP
- 内存指针:包括程序代码和进程相关数据的指针,还有其他进程共享的内存块指针
- 上下文数据:进程执行时处理器的寄存器中的数据
- I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表
- 记账信息:可能包括处理时间的总和,使用的时钟数的总和,时间限制,记账号等
问什么要有优先级?
答:CPU资源是有限的,进程可以有多个,进程需要进行优先级设置
如何理解进程排队?
答:PCB结构体排队
PCB以双链表的形式链接,所谓管理进程-》对链表的增删查改
前台进程
在Linux命令行中,只能有一个前台进程。
想要把前台进程变成后台进程:程序+&
删掉后台进程
$ kill -9 +pid的值
组织进程
可以在内核源代码里找到它,所有运行在系统里的进程都以task_struct链表的形式存在内核里
查看进程
进程的信息可以通过/proc系统文件夹查看
大多数进程信息同样可以使用top和ps这些用户级工具来获取
1、找所有进程列表
$ ps aux
2、找指定文件的进程
$ ps aux | grep '文件名'
3、找出某个文件的n行进程
$ ps aux | head -n && ps aux | grep '文件名'
通过系统调用获取进程标识符
- 进程id(PID)
- 父进程id(PPID)
通过系统调用创建进程-fork初识
fork创建子进程,fork之前的代码被父进程执行。fork之后的代码默认被父子都可以执行
- 运行 man fork 认识 fork
- fork 有两个返回值 给父进程返回子进程的pid,给子进程返回0
- 父子进程代码共享,数据各自开辟空间,私有一份(采用写时拷贝)
- fork之后通常要用if 进行分流
父子进程分流,“同时进行”
进程状态
一个进程可以有几个状态(在Linux内核里,进程有时候也叫任务)
-
R 运行状态(Running):进程不一定在运行中,它表明进程要么是在运行中要么在运行队列里
-
S 睡眠状态(Sleeping):进程在等待事件完成(睡眠有时候也叫可中断睡眠),随时可以被唤醒/杀掉
-
D 磁盘休眠状态(Disk Sleep):有时候也叫不可中断睡眠,在这个状态的进程通常会等到IO的结束,不会被杀掉,即使是操作系统;自动唤醒,才可以恢复
-
T 停止状态(stopped):可以通过发送 SIGSTOP信号给进程来停止(T)进程。这个被暂停的进程可以通过发送SIGCONT让进程继续运行
-
X 死亡状态(dead):这个状态只是一个返回状态,不会在任务列表里看到
进程状态查看
$ ps aux /ps axj
Z(zombie):僵尸进程
- 僵死状态(zombie):当进程退出并且父进程(使用wait()系统调用)没有读取到子进程退出的返回代码时就会产生僵死进程
- 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码
只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态
进程退出,在系统层面,曾经申请的资源并不是被立即释放,而是要暂存一段时间,供OS(父进程)进行读取
echo $?
- 命令行中,最近一次进程退出时候的退出码
进程退出的信息(退出码),会暂时保存(task_struct),如果没人读取,此时,该task_struct相关数据不会被释放
$ while :; do ps aux | head -1 && ps aux | grep myproc;echo"##############"; sleep 1 ; done
僵尸进程的危害
- 进程的退出状态必须被维持下去,因为需要告诉父进程状态。如果父进程一直不读取,那子进程一直处于Z状态
- 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_sturct(PCB)中,Z状态一直不退出,PCB一直需要维护
- 父进程创建子进程,不回收就会造成内存资源的浪费。因为数据结构对象本身就要占用内存
- 会造成内存泄漏
孤儿进程
- 父进程如果提前退出,子进程就称为"孤儿进程"
进程优先级
- CPU资源分配的先后顺序,就是指进程的优先权
- 优先权高的进程有优先执行的权力。配置进程优先权对多任务环境的Linux很有用,可以改善系统性能
- 可以把进程运行到指定的CPU上,这样可把不重要的进程安排到某个CPU,可以改善系统整体性能
查看系统进程
在Linux和Unix系统中,用 ps -l 命令(只能查看当前Xshell登录的进程)
- UID:代表执行者的身份
- PID:代表这个进程的代号
- PPID:代表这个进程的父进程的代号
- PRI:代表这个进程可被执行的优先级,其值越小越早被执行
- NI:代表进程的nice值
PRI和NI
- PRI是进程的优先级,或是程序被CPU执行的先后顺序,值越小,优先级越高
- NI:nice值,表示进程可被执行的优先级的修正数
- PRI越小越先执行,加入nice值后,PRI(new)=PRI(old)+nice
- nice 为负时,优先级值变小,优先级变高,会被越快执行
- nice取值范围是 -20~19
Linux下,调整进程优先级,就是调整nice值
查看进程优先级的命令
用top命令更改已存在的进程
- top
- 按r->输入进程PID->输入nice值
其他概念
- 竞争性:系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争性的。为了高效完成任务,更合理竞争相关资源,便有了优先级
- 独立性:多个进程运行,需要独享各种资源,多进程运行期间互不干扰
- 并行:多个进程在多个CPU下分别,同时运行,这称之为并行
- 并发:多个进程在一个CPU下采用进程切换的方式,在一段时间内,让多个进程得以推进,称之为并发