page contents

每个PHP程序员都应该知道的进程知识

作为一个工作多年的老程序员,你是否对进程、线程依然理解理解的不够透彻?你是否在工作中使用到进程管理?你是否知道进程间通信方式有几种?

attachments-2020-08-rSKROKCp5f446f834d541.png



作为一个工作多年的老程序员,你是否对进程、线程依然理解理解的不够透彻?你是否在工作中使用到进程管理?你是否知道进程间通信方式有几种?

本文将讲述如下几个问题:

①进程和线程介绍

②进程间通信方式

③Swoole中进程管理介绍


一、进程和线程介绍

先说说进程和线程,进程是操作系统资源分配的最小单元,是程序执行的一个实例。在程序运行时系统就会创建一个进程,并为它分配资源,然后把该进程放入进程的就绪队列,这样进程调度器选中它的时候就会为它分配CPU时间片。

进程的状态有:新建态、就绪态、运行态、阻塞态、退出态,状态之间可以进行转换:就绪->运行,运行->就绪,运行->阻塞,阻塞->就绪

attachments-2020-08-gjtB5r6b5f446fc1e911d.png

①新建态新建态进程刚创建的时候的状态。创建进程时,首先由进程申请一个空白的进程控制块(即PCB),并向PCB中填写用于控制和管理进程的信息;然后为给这个进程分配运行时需要的资源;最后把该进程转入就绪状态并插入到就绪队列中。

②就绪态就绪态是指有等待执行的进程,有执行资格,还没有执行权限。有执行资格是指已经分配到除了CPU之外的所有必要的资源,没有执行权限是因为还没有获得CPU。

③运行态运行态的进程是指进程获得了CPU,既有执行资格,又有执行权力,处在正在运行的状态。在单处理机(即CPU)系统中,同一时刻只能有一个进程处于运行态。在多处理机系统中,同一时刻可以有多个进程处于运行态。

④阻塞态阻塞态是指进程执行的过程中遇到阻塞暂时无法继续运行,就会转向阻塞态。进程阻塞的原因有I/O请求、时间片用完、遇到一些错误等。

⑤退出态即进程停止运行。进程到退出态的原因有:程序执行完成、调用退出函数、遇到错误、接收到终止的信号、进程被操作系统杀掉等。进程退出时,操作系统会将进程的PCB清零,并将PCB空间返还给系统。进入终止态的进程以后不能在再执行,但是操作系统中任然保留了一个记录,其中保存状态码和一些计时统计数据,供其他进程进行收集。一旦其他进程完成了对其信息的提取之后,操作系统将删除其进程,即将其PCB清零,并将该空白的PCB返回给系统。

说完进程再说说线程,线程是CPU调度的最小单位,同时线程也是一个有限的系统资源。一个进程可以由多个线程组成,线程之间共享进程的所有资源,每个线程有自己的堆栈和局部变量。线程由CPU独立调度执行,在多CPU环境下就允许多个线程同时运行。同样,多线程也可以实现并发操作,每个请求分配一个线程来处理。

线程的状态和进程类似,一个进程可以运行多个线程,多个线程可以共享数据。只不过线程之前切换消耗的CPU资源比进程切换要小。

与进程不同的是同类的多个线程共享进程的堆和方法区资源,但每个线程有自己的程序计数器、虚拟机栈和本地方法栈,所以系统在产生一个线程,或是在各个线程之间作切换工作时,负担要比进程小得多,也正因为如此,线程也被称为轻量级进程。

attachments-2020-08-upMssWpe5f446fe3b5651.jpg


进程和线程之间有什么区别呢?

本质区别:进程是操作系统资源分配的基本单位,而线程是CPU任务调度和执行的基本单位。

空间和资源:进程之间相互独立,统一进程内的线程之间可以共享资源。不同进程中的线程相互独立。

切换开销:进程之间有自己独立的代码段和数据空间(程序上下文),进程之间的切换需要保存上下文、寄存器等数据,会有较大的开销;同一个进程中的线程共享代码段和数据空间,每个线程都有自己独立的运行栈和程序计数器(PC),线程之间切换的开销小。

相互关系:进程崩溃后,在保护模式下不会对其他进程产生影响,但是一个线程崩溃整个进程都会挂掉。

执行顺序:进程有自己的程序运行的入口、顺序执行序列和程序出口。但是线程不能独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制,两者均可并发执行。


二、进程间通信方式

介绍进程之间通信之前先介绍一个概念:用户态内核态

当一个进程在执行自己的代码时处于用户态,当这个进程因为系统调用陷入内核代码中执行时处于内核态。执行的内核代码会使用当前进程的内核栈,每个进程都有自己的内核栈。

当用户运行一个程序时,该程序创建的进程开始时运行自己的代码,处于用户态。如果要执行文件操作、网络数据发送等操作必须通过write、send等系统调用,这些系统调用会调用内核的代码。进程会进入内核地址空间去执行内核代码来完成相应的操作,内核态的进程执行完后又会回到用户态。这样,用户态的程序就不能随意操作内核地址空间,具有一定的安全保护作用,保证进程间的地址空间不会互相冲突,一个进程的操作不会修改另一个进程地址空间中的数据。

进程从用户态切换到内核态常见的有三种方式:系统调用(如fork调用)、异常(如缺页异常)、外围设备中断。


面说说进程间通信,即IPC,全称是InterProcess Communication。不同进程之间可以相互通信、交换数据。进程之间通信方式有:管道(包括无名管道和命名管道)、消息队列、信号量、共享内存、Socket、Streams。

①管道:管道又分无名管道和有名管道,无名管道是单向的,只允许单向通信。如果需要双向通信,就需要开启两个单向管道。有名管道是在文件系统目录中存在一个管道文件。管道文件仅仅是文件系统中的标示,并不在磁盘上占据空间。在使用时,在内存上开辟空间,作为两个进程数据交互的通道。

②消息队列:消息队列是由消息的链表存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。

③信号量:信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。

④共享内存:共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号量,配合使用,来实现进程间的同步和通信。

⑤SocketSocket 也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同及其间的进程通信。


三、Swoole中进程管理介绍

下面我们用Swoole中的Process模块来加深一下对进程的理解。在Swoole中通过swoole_process 类来创建子进程,构造函数原型如下:

attachments-2020-08-RtT3W58V5f44703458017.png

$function 是一个回调函数,子进程创建成功后执行此回调函

$redirect_stdin_stdout 参数可以重定向子进程的标准输入和输出

$pipe_type 为管道类型


具体参数含义可以参考Swoole官方文档,下面我们将在一个进程中创建子进程,并进行进程间通信。

attachments-2020-08-JmLvPl025f447069b4b44.png


在命令行执行 php process.php,运行后的结果如下:

attachments-2020-08-btgglOkS5f44707750517.png

这就是进程之间通过管道通信的例子,创建子进程,并设定回调函数。

Event::add 将管道文件描述符 $process->pipe 加入到事件循环中。第一行输出的hello world 是回调函数输出的,而 read:aaaaaa 是事件循环执行时从管道里读出的数据。

关于Swoole中进程间通信还有其他方式,在此不一一列举。以上内容,如有错误,欢迎指正!


attachments-2020-08-4K0Q9DpO5f447085cfe7b.jpg

  • 发表于 2020-08-25 09:50
  • 阅读 ( 552 )
  • 分类:中间件

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
Pack
Pack

1135 篇文章

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 1478 文章
  3. Pack 1135 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章