浅谈并发处理PHP进程间通信之外部介质

 更新时间:2021年05月26日 11:02:08   作者:枕边书  
进程间通信(IPC,Inter-Process Communication),多进程开发中,进程间通信是一个永远也绕不开的问题。在 web开发中,我们经常遇到的并发请求问题,本质上也可以作为进程间通信来处理。

进程间通信

进程间通信,指至少两个进程或线程间传送数据或信号的一些技术或方法。进程是计算机系统分配资源的最小单位(严格说来是线程)。每个进程都有自己的一部分独立的系统资源,彼此是隔离的。为了能使不同的进程互相访问资源并进行协调工作,才有了进程间通信。

根据定义可知,要进行进程间通信,我们需要解决两个问题:

  • 互相访问:消息传输和暂时存储介质选择问题;
  • 协调工作:消息的存取冲突问题;

文章介绍的中心就是围绕着这么两点来说的, 为了更使文章更简明,这边以之前在公司做的一个需求为例:

需要一个循环ID生成器,循环生成从 Min 到 Max 的数字ID,在ID递增到 Max 后,返回到 Min 重新开始递增;必须能保证多个进程并发请求时生成的ID不同。

此需求要解决的问题恰好为我们要解决的进程间通信需要解决的两个问题:

  • 需要一个消息传输通道来传输和存储当前的递增值。这个比较容易解决,我们常用的文件、数据库、session、缓存等都能做到。
  • 需要解决多进程同时访问生成器生成相同ID的问题。要满足这个需要就必须要用到锁了,而且为了保证多个进程读取的数据是不同的,需要互斥锁,另外为了能保证调用成功率,锁的获取最好能实现自旋。

本文通过此需求的不同实现,来介绍通过外部介质进行的进程间通信的方式。另外,不只PHP语言,其他语言也能使用这些方法。

文件

flock

文件是最基本的存储介质,它当然可以作为消息的传输通道来使用。文件的存取各种语言都有各自的多种方案,问题点是多进程并发时的冲突问题。

解决存取冲突问题我们使用PHP的flock()函数:

bool flock ( resource $handle , int $operation [, int &$wouldblock ] )

$handler 是 使用fopen($path_to_file)获取到的文件句柄;

$operation 是 对文件加锁的方式,有以下值可选:

LOCK_SH (获取共享锁) / LOCK_EX (获取互斥锁) / LOCK_UN (解锁)

这里我们选用互斥锁,一个进程获取到互斥锁后,其他进程在尝试获取锁会被阻塞,直到锁被释放,即实现了自旋;

此外,还有一个参数 LOCK_NB,flock 在获取不到锁时,默认会阻塞住直到锁被其他进程释放,传入 LOCK_NB 与 LOCK_SH 或 LOCK_EX 进行或运算结果(LOCK_EX | LOCK_NB),flock 在锁被其他进程占有时,不会阻塞,而是直接返回 false,这里仅作介绍,我们并不使用它。

$wouldblock 参数是一个引用值,在获取不到锁,且不阻塞模式时,$wouldblock 会被设置为 true;(手册中说阻塞时才会被设置为 true。其实我也奇怪这个变量名的。不知道是不是 bug,我的PHP版本是 5.4.5,有知道的烦请解惑)

代码实现

下面是循环ID生成器代码,说明在注释中:

function getCycleIdFromFile($max, $min = 0) {
    $handler = fopen('/tmp/cycle_id_generator.txt', 'c+');
    if (!flock($handler, LOCK_EX)) {
        throw new Exception('error_get_file_lock!');
    }
    
    $cycle_id = trim(fread($handler, 9));
    $cycle_id++;

    if ($cycle_id > $max) {
        $cycle_id = $min;
    }

    // 文件指针返回到文件头,并向文件内写入新的cycle_id
    rewind($handler);
    fwrite($handler, $cycle_id);

    // 多写入一些空格为了防止数值升到多位后,突然置为少位后面的数字仍保留
    fwrite($handler, str_repeat(' ', 9));

    flock($handler, LOCK_UN);

    return $cycle_id;
}

mysql

select for update

我们常用的 mysql 也可以被当作中间介质来实现进程间的通信,我们规定好某一个数据表内的某一行数据作为消息交换的中转站,使用 mysql 自带的锁来协调多个进程的存取冲突。

事务的设计目的就是为了解决多进程并发查询时数据冲突的问题,可是我们常用的事务只能保证数据冲突时会被回滚,数据不会出现错误,并不能实现请求的并行化。对一些数据冲突回滚的请求,需要我们在外层添加逻辑重试。

这里介绍 mysql 的一种语法: select for update,会给固定数据加上互斥锁,且另一个请求在获取锁失败时,会阻塞至获取锁成功,mysql 帮我们实现了自旋;

用法如下:

1.关闭 mysql 的自动提交,自动提交默认打开,除非使用 transition 语句显示开启事务,默认会将每一条 sql 作为一个事务直接提交执行,这里关闭。 set autocommit=0;

2.使用select for update 语句给数据添加互斥锁。注意:需求 mysql 的 innodb 引擎支持;

3.进行数据更新和处理操作;

4.主动提交事务,并将 自动提交恢复;commit; set autocommit=1;

代码实现

然后是代码实现:

// 数据库连接实现各有不同,demo 可以自己修改一下。
function getCycleIdFromMysql($max, $min = 0){
    Db::db()->execute('set autocommit = 0');
    $res = Db::db()->qsqlone('SELECT cycle_id FROM cycle_id_generator WHERE id = 1 FOR UPDATE');

    $cycle_id = $res['cycle_id'] + 1;
    if($cycle_id > $max){
        $cycle_id = $min;
    }

    Db::db()->execute("UPDATE cycle_id_generator SET cycle_id = {$cycle_id} WHERE id = 1");

    Db::db()->execute('commit');
    Db::db()->execute('set autocommit = 1');

    return $cycle_id;
}

redis

incr

redis 是我们常用的缓存服务器,由于其使用内存存储数据,性能很高。我们使用一个固定的普通键来作为消息中转站,然后利用其incr命令的原子性和其执行结果(递增后的值),实现 cycle_id 的递增。

incr(key) 若 key 不存在,redis 会先将值设置为0,然后执行递增操作;

递增没有问题,可是我们还有个需求是在要其值达到 max 时,再将其置为 min,这时就可能会出现进程A在更新值为 min 时,另一个进程B也检测到值大于了 max,然后将值置为 min,可是这时的值已经不是 max,即发生了值重复更新,那么返回的值必然会有重复;

这时,我们就需要自己来实现锁了。

SETNX

redis 的 SETNX 命令检测某一个 key 是否存在,若不存在,则将 key 的值设置为 value,并返回结果1; 若 key 已存在,则设置失败,返回值0。

SETNX key value

它能实现锁是因为它是一个原子命令,即 检测 key 是否存在和设置 key 值在一个事务内,不会出现同时两个进程都检测到 key 不存在,然后同时去设置 key 的情况。

我们以另一个值的存在与否,来表示 cycle_id 是否正在被另一个进程修改。

代码实现

 function getCycleIdFromRedis($max, $min = 0) {
    $redis = new Redis();
    $redis->connect('127.0.0.1', 6379);
    $key_id = 'cycle_id_generator';

    $cycle_id = $redis->incr($key_id);
    
    if ($cycle_id > $max) {
        // 设置"锁键"的结果 = 获取互斥结果
        $key_lock = 'cycle_id_lock';
        if (!$redis->setnx($key_lock, 1)) {
            return null;
        }

        $cycle_id = $min;
        $redis->set($key_id, $cycle_id);

        // 最后别忘记释放互斥锁
        $redis->delete($key_lock);
    }

    $redis->close();

    return $cycle_id;
}

注意:由于 redis 里没有能实现自旋锁的命令,如果需求最高的获取成功率,我们在检测到 cycle_id 已经是最大值,且试图修改获取锁失败时,退出重试,在外层进行重试。

function getCycleId($max, $min = 0) {
    $cycle_id = getCycleIdFromRedis($max, $min);
    if (!is_null($cycle_id)) {
        return $cycle_id;
    }
    // 稍微等待下正在更改的进程
    usleep(500);
    // 这里使用递归,直至获取成功  并发很高,cycle_id重置很频繁时慎用.
    return getCycleId($max, $min);
}

优化

审查代码我们会发现,如果 max-min 的值很小的话,redis 会需要经常重置 key 的值,也就经常需要加锁,重试也就很多。这里,我提供一个优化方法:

我们将其 max 设置为一个很大的值(要能被 max-min 整除),返回值时稍做处理,返回 $current % ($max - $min) + $min;。这样,key 需要递增到一个很大的值才会被重置,加锁逻辑和外层逻辑会很少执行到,达到提升效率的目的。

总结

这里简单的评价一下上面所说的三种方法:

性能上没有测试,而且 redis 的性能跟 ID 的大小差值相关,不过猜测在ID大小差值大的情况下 redis 应该更好一点。

代码上非常直观,使用 mysql 非常简洁,而且 redis 要自己实现自旋,比较恶心。

实现上,当然是文件最为方便,无任何添加。

以上就是浅谈并发处理PHP进程间通信之外部介质的详细内容,更多关于并发处理PHP进程间通信之外部介质的资料请关注脚本之家其它相关文章!

相关文章

  • php设计模式 Proxy (代理模式)

    php设计模式 Proxy (代理模式)

    为其他对象提供一个代理以控制这个对象的访问
    2011-06-06
  • PHP 单引号与双引号的区别

    PHP 单引号与双引号的区别

    看好多代码有时候用单引号或双引号实现包含字符串的内容,其实简单个概括下双引号中的变量可以解析,单引号就是绝对的字符串。
    2009-11-11
  • PHP类的反射用法实例

    PHP类的反射用法实例

    这篇文章主要介绍了PHP类的反射用法,实例讲述了反射类的常用操作,具有一定的参考借鉴价值,需要的朋友可以参考下
    2014-11-11
  • shell脚本作为保证PHP脚本不挂掉的守护进程实例分享

    shell脚本作为保证PHP脚本不挂掉的守护进程实例分享

    以下是对用shell脚本作为保证PHP脚本不挂掉的守护进程实例进行了分析介绍,需要的朋友可以参考下
    2013-07-07
  • php中的三元运算符使用说明

    php中的三元运算符使用说明

    今天一个网友在群里发了个题目不难,但是可能会错,大家可以看看啊。
    2011-07-07
  • PHP解析RSS的方法

    PHP解析RSS的方法

    这篇文章主要介绍了PHP解析RSS的方法,实例分析了php解析RSS的原理与XML文件的操作技巧,需要的朋友可以参考下
    2015-03-03
  • PHP实现网络请求的方法总结

    PHP实现网络请求的方法总结

    对于php发送网络请求,我们最常用的请求就是curl,有时我们也会用到file_get_contents函数发送网络请求。本文为大家总结了php实现网络请求的方法及函数,感兴趣的可以学习一下
    2022-06-06
  • 简单的方法让你的后台登录更加安全(php中加session验证)

    简单的方法让你的后台登录更加安全(php中加session验证)

    通过特定文件为后台入口注册session,否则失败退出。即直接使用原后台地址将无法登录后台。这样一来,入口文件名的多样性、可变更性将为你的后台登录提供更加安全的环境
    2012-08-08
  • PHP中常用的转义函数

    PHP中常用的转义函数

    这篇文章主要介绍了PHP中常用的转义函数、安全函数,使用这些函数可以过滤大部份常见的攻击手段,如SQL注入,需要的朋友可以参考下
    2014-02-02
  • PHP+Apache实现二级域名之间共享cookie的方法

    PHP+Apache实现二级域名之间共享cookie的方法

    这篇文章主要介绍了PHP+Apache实现二级域名之间共享cookie的方法,涉及Apache的配置、hosts修改及php cookie操作相关实现技巧,需要的朋友可以参考下
    2019-07-07

最新评论