PHP的多样化执行方式(parallel PHP多线程实现,原生协程实现,多进程实现,ZTS、NTS、TS又是什么)
进程、线程、协程
- 进程:应用程序的启动实例,运行起的代码叫进程,有独立的内存空间,类比工厂的P个(P=1单进程,P>1多进程)车间。
- 线程:线程是CPU调度的最小单位,是进程内的执行单元,多个线程共享所属进程的资源。类比车间内的T个员工(T=1单线程,T>1多线程)车间。
- 协程:类似线程,协程是用户态(CPU受限执行用户程序指令),线程是内核态(CPU任意可在操作系统中任意执行任何指令)。通常在函数内部运行,并且可以在函数的不同部分之间暂停和恢复执行(最明显的特点就是协程不一定会跟着函数的return而结束,下次调用时能保留上调用时的状态)。
多进程、多线程怎么选?
做PHP的是几乎不用考虑的,毕竟不是C/C++这种偏底层适合做C/S或单Client的应用,PHP大多都是LAMP或LNMP的架构,结合Windows Server用IIS多线程的从来还没有遇见过。
- 多进程适用场景:
- CPU密集型任务:对于需要大量计算的任务,多进程可以充分利用多核处理器的优势,提高整体处理速度。
- 独立性要求高:如果任务之间需要完全独立的内存空间和资源,避免相互影响,多进程是更好的选择。
- 故障隔离:多进程能够提供更好的故障隔离性,一个进程崩溃不会影响其他进程,提高了系统的可靠性。
- 跨平台兼容性:多进程在跨平台兼容性方面表现更好,因为不同操作系统有不同的线程实现,而进程模型更为统一。
- 多线程适用场景:
- I/O密集型任务:对于需要频繁进行I/O操作的任务,多线程能够更好地利用等待时间,提高系统的响应速度。
- 资源共享:多线程适用于需要共享数据或资源的场景,能够更轻松地实现数据共享和通信。
- 实时性要求高:多线程能够更快速地响应事件和处理任务,适合需要实时性的应用场景。
- 内存消耗较低:线程间共享同一进程的内存空间,相比多进程消耗的内存较少。
- GUI编程:图形界面程序通常需要不同的线程处理用户交互和界面更新,多线程能够提高界面的响应性和流畅性。
多线程实现
- parallel:是适用于 PHP ≥ 7.2.0 的并行并发扩展。
- 要求:自 parallel 1.2.0 起,要求 PHP ≥ 8.0.0,必须用ZTS版本(./configure时PHP7需要加--enable-maintainer-zts,PHP>=8需要加--enable-zts)。
- Github地址:https://github.com/krakjoe/parallel
- 使用说明:https://www.php.net/manual/zh/intro.parallel.php
- 下载地址:https://pecl.php.net/package/parallel
- 应用场景:
- 并行数据处理:对大量数据进行并行处理,如图像处理、视频处理、大规模数据分析等。
- 网络请求并行处理:同时发送多个网络请求,例如同时请求多个API或网页数据,以提高数据获取速度。
- 并行计算:执行需要大量计算的任务,如数值计算、科学计算等。
- 并行爬虫:爬取网页数据时,可以利用并行处理提高爬取效率,加快数据采集速度。
- 多任务调度:在需要同时执行多个任务的场景,可利用此扩展进行任务调度和执行,提高系统的并发处理能力。
- 实操
cd /test
wget https://pecl.php.net/get/parallel-1.2.1.tgz
tar zxf parallel-1.2.1.tgz
cd parallel-1.2.1/
/usr/local/php8.1/bin/phpize
make
make install
vim /usr/local/php/etc/php.ini
extension=parallel
常规测试,输出@@@%%%,说明程序是从上到下依次执行的。
vim /test/a.php
<?php
for($i = 0; $i < 3; $i ++) {
echo '@';
}
for($j = 6; $j < 9; $j ++) {
echo '%';
}
使用扩展执行
<?php
$runtime = new \parallel\Runtime();
$future = $runtime->run(function(){
for ($i = 0; $i < 25; $i ++)
echo "@";
return "result";
});
for ($j = 0; $j < 25; $j ++) {
echo "%";
}
print_r($future->value());
多次执行,效果是这样的,可见是多个线程交替执行。
%%%%%%%%%%%%%%%%%%%%%%%%%@@@@@@@@@@@@@@@@@@@@@@@@@result[root@localhost test]# php a.php
@%%%%%%%%%%%%%%%%%%%%%%%%%@@@@@@@@@@@@@@@@@@@@@@@@result[root@localhost test]# php a.php
%%%%%%%%%%%%%%%%%%%%%%%%%@@@@@@@@@@@@@@@@@@@@@@@@@result[root@localhost test]# php a.php
%%%%%%%%%%%%%%%%%%%%@%@@@@@@@@@@@@@@@%%@@@@@@@@@%%result[root@localhost test]# php a.php
%%%%%%%%%%%%%%%%%%%%%%%%%@@@@@@@@@@@@@@@@@@@@@@@@@result[root@localhost test]# php a.php
%%%%%%%%%%%%%%%%%%%%%%%%%@@@@@@@@@@@@@@@@@@@@@@@@@result[root@localhost test]# php a.php
%%%%%%%%%%%%%%%%%%%%%%%%@%@@@@@@@@@@@@@@@@@@@@@@@@result[root@localhost test]# php a.php
原生协程实现
- 说明:之前的文章就有用到,把9.7GB的文本数据,按照一行一条数据的方式导入数据库,如果一次性加载,内存过载会报错。
所以就需要协程来帮忙,PHP的协程使用yield关键字来实现
,在导入过程中,就用到了,协程不一定会跟着函数的return而结束,下次调用时能保留上调用时的状态的特点 - 协程适用场景之一:万字详解PHP+Sphinx中文亿级数据全文检索实战(实测亿级数据0.1秒搜索耗时)
- 示例:
- 代码不多,就可以实现,就例如大名鼎鼎的单例模式,也没几行就能实现,概念指定的代码不在多少,在于解决的问题。
- 如下:yield相当于return的返回之意,且不会中断,还能记住上次迭代的位置,所以输出的结果是0123456789。
<?php
function func() {
$i = 0;
while ($i < 10) {
yield $i;
$i ++;
}
}
$func = func();
foreach($func as $v) {
echo $v;
}
多进程方式
- 说明:最常见的执行方式,大部分企业都这种架构,不必过多演示。configure时需要添加--enable-fpm --with-fpm-user=www --with-fpm-group=www。与Nginx通信,通常使用php-fpm(php进程管理器)去实现多个进程。
- 解决问题:
- 提高并发量:请求量一上来,一个进程扛不住,就多个进程一起抗。
- 进程隔离:PHP-FPM 可以实现进程隔离,一个进程的崩溃不会影响到其他进程,提高了系统的稳定性和可靠性。
- 提高资源利用率:PHP-FPM 可以根据实际情况调整进程池的大小,以适应服务器负载的变化,从而更好地利用服务器资源,避免资源浪费。
ps aux | grep php
root 3511 0.0 0.3 172232 5936 ? Ss Mar17 1:20 php-fpm: master process (/usr/local/php/etc/php-fpm.conf)
www 4554 0.0 0.7 178812 14516 ? S 15:13 0:01 php-fpm: pool www
www 4555 0.0 0.7 178812 14444 ? S 15:13 0:01 php-fpm: pool www
www 4556 0.0 0.7 178812 14500 ? S 15:13 0:01 php-fpm: pool www
www 4596 0.0 0.7 178812 14496 ? S 15:14 0:01 php-fpm: pool www
www 4597 0.0 0.7 178812 14556 ? S 15:14 0:01 php-fpm: pool www
ZTS、NTS、TS版本的区别
-
ZTS:指的是 PHP 的线程安全版本。PHP ZTS 版本中的核心功能被修改和重新编写,以确保在多线程环境下能够安全地运行。这样,开发人员就可以在需要在多线程环境中运行 PHP 脚本时,选择使用 PHP ZTS 版本来提高线程安全性和稳定性。
总的来说,PHP ZTS(Zend Thread Safety)是 PHP 的线程安全版本,专门设计用于在多线程环境下提供更好的线程安全性和稳定性。 -
TS:多线程访问时,采用了加锁机制,当一个线程访问某些数据时进行保护,其它线程不能进行访问,直到该线程读取完,其它线程才可使用。主要是针对windows系统iis运行的情况,如果是使用ISAPI的方式来运行PHP就必须用Thread Safe(线程安全)的版本。因为windows申请进程开销较大,所以windows主要以多线程方式运行PHP,这时候需要线程安全的版本。
-
NTS:linux下,PHP使用多进程方式运行,所以可以选择nts版本。
ISAPI全称Internet Server Application Programming Interface,是一种微软Windows平台下的Web服务器扩展技术。它允许开发者编写动态网页应用程序并直接运行在Web服务器上,可以与Web服务器(如IIS)直接交互,提供更高效的性能和更灵活的功能扩展。通过ISAPI,开发者可以使用C++、Delphi等语言编写高性能的Web应用程序。 -
如果要开多线程:ZTS优于TS优于NTS。