探索 PHP 如何生成全局唯一的 id

探索开始

1. 基于时间+随机码生成id

php提供了一个生成唯一值生成函数uniqid($prefix,$more_entropy),这是一个基于毫秒级时间生成id的函数,不带参数执行输出13位字符随机码,$prefix返回随机码的前缀,$more_entropy设为true时为加熵,返回字符会变为23位(不包括$prefix)。编辑代码如下:

  • 单进程版代码
        $start_time = microtime(true);
        $container = [];
        $all_count = 1000000; //生成id总数量(一百万个)
        for ($i = 0; $i < $all_count; $i++) {
            //生成随机id
            $random = uniqid();  //长这样子:5e1401c70b7db
            $container[$random] = $i; //去掉重复id
        }
        $waste_time = bcsub(microtime(true), $start_time, 4);//计算时间
        $conclusion = '耗时:' . $waste_time . 's,共生成id个数:' . $all_count . ',重复id个数:' . ($all_count - count($container));
        dump($conclusion);

执行代码,返回

探索 PHP 如何生成全局唯一的 id

多次重复执行,发现重复id都是0,耗时都在60秒以上,平均每秒可以生成一两万个id,感觉uniqid()不加参数也不错嘛,但是这是幻觉而已,坏得很,经不起考验的。

  • 多进程版代码
        $start_time = microtime(true);
        $process_count = 50; //进程数量
        $all_count = 1000000; //生成id总数量(一百万个)
        $per_process_count = floor($all_count / $process_count); //每个进程生成id总数量
        for ($i = 0; $i < $process_count; $i++) {
            //开多进程模拟真实场景
            MultiProcessHelper::instance($process_count)->multiProcessTask(function () use ($per_process_count, $i) {
                //生成随机id
                $container = [];
                for ($j = 0; $j < $per_process_count; $j++) {
                    $random = uniqid(); //长这样子:5e1401c70b7db
                    $container[] = $random;
                }
                //把生成的id放到缓存里面
                Cache::set($i, $container);
            });
        }

        MultiProcessHelper::recycleProcess();//回收子进程
        //以下是整理多个并发进程生成id的重复情况
        $container = [];
        for ($i = 0; $i < $process_count; $i++) {
            $res = Cache::get($i);
            foreach ($res as $v) {
                $container[$v] = 0; //去掉重复id
            }
        }
        $waste_time = bcsub(microtime(true), $start_time, 4);//计算时间
        $conclusion = '耗时:' . $waste_time . 's,共生成id个数:' . $all_count . ',重复id个数:' . ($all_count - count($container));
        dump($conclusion);

执行代码,返回

探索 PHP 如何生成全局唯一的 id

结果发现时间变短了,平均每秒生成的id数量达到了10万个。但是别忘了,异步执行任务的进程是50个,榨干了cpu了。再看,重复个数不再为0,而是有10万个之多,大概1/10都重复了,所以不加熵使用uniqid不能保证生成唯一id。

如果设置$prefix为mt_rand(),mt_rand()会生成0到最大随机数数(21亿左右)的随机整数,$more_entropy=true,那样将返回更加随机的id,利用这一点设计随机码生成规则。编辑代码如下:

$random = uniqid(mt_rand(), true);  //长这样子:21083019475e14021cdceb11.02999582
  • 单进程版执行结果

探索 PHP 如何生成全局唯一的 id

这个超强了,每秒可以生成百万级别的id(加熵之后,使用的算法不一样了,总之加熵时uniqid更快了),重复率为0

  • 多进程版执行结果

探索 PHP 如何生成全局唯一的 id

重复率为0,可以断定一该方式生成唯一id可行,性能和重复概率表现很好,唯一不足就是id无序

2. 使用session_create_id()

该函数是php7.1之后提供的,是php用来生成session_id使用的,php使用它来生成每个请求会话,应该唯一是相当好的,不然呢!测试一波:

$random = session_create_id(); //长这样子:6khfg75a13khre330nqu1t84ab
  • 单进程版执行结果

探索 PHP 如何生成全局唯一的 id

  • 多进程版执行结果

探索 PHP 如何生成全局唯一的 id

由上可见,session_create_id性能和重复率都表现不错,值得信赖

3. 使用uuid

uuid已经形成的国际规范,目前出来的版本有四五个,最常用的是由时间戳+顺序号+机器标识+进程标识规则生成的id,与此相关的composer包很多了,不造重车轮是最大的生产力,直接选用 https://packagist.org/packages/ramsey/uuid 包,测验一下:

$random = Uuid::uuid1()->toString(); //长这样子:480dac52-3102-11ea-89e3-525400cae48b
  • 单进程版执行结果

探索 PHP 如何生成全局唯一的 id

  • 多进程版执行结果

探索 PHP 如何生成全局唯一的 id

结果令人意外,uuid生成速度还行,但是多进程异步生成时,并不能保证高标准的唯一性,出现了8个重复的,虽然很少,但是很意外,说好的全球唯一呢,有点虚,哈哈!总的来说还是不错的,重复率已经做到相当低了。

4. 使用雪花算法

以上三种都是只会生成无序的随机字符,但是我们有些时候需要依靠唯一id对数据库进行排序的,比如我们要生成全库唯一id时,我们就需要id满足顺序性、整数类型(提高索引效率),而由雪花算法生成的id可以满足这一点(雪花id有时间顺序)。雪花算法原理图如下:

探索 PHP 如何生成全局唯一的 id

安装composer包:https://packagist.org/packages/godruoyi/ph... 来使用

$snowflake=new Snowflake(); 
//可以添加机器码,可设置1024个,以增强随机性,但1024太小治标不治本,当集群进程数超于这个时,加上多机器时间戳的不靠谱了,还是会出现问题,这里只做简单使用
$random = $snowflake->id(); //长这样子:55141599398592512
  • 单进程版执行结果

探索 PHP 如何生成全局唯一的 id

  • 多进程版执行结果

探索 PHP 如何生成全局唯一的 id

分析结果,单进程使用雪花算法生成id,可以保持十几万个每秒的生成速度,且重复率保持为0,但是去到并发生成时,问题出现了,重复了很多,重复率1/2,恐怖,可断,雪花算法如上面那样简单使用的话,是难以适合高并发场景的!

5.id计算器生成id

id计算器生成id就是的首要工作就是要设置一个公共变量,该变量增量为1,每次进程从这里申请一次id,id的值都会加一,这样一直累加下去,就保证了全局唯一性,且都是整数。这方面,Redis很能胜任,一是性能很好,二是跨机器,另外Redis提供的原子性函数incr,简直天造地设了。来,操作一波:

$random = Cache::inc('id');  //长这样子:1,2,3,4,5,...
  • 单进程版执行结果

探索 PHP 如何生成全局唯一的 id

  • 多进程版执行结果

探索 PHP 如何生成全局唯一的 id

这种方式生成的id,能够保持很好的id递增性,即保证的顺序性,由于incr是原子操作,重复率几乎为0,产生速率,有赖于Redis的软件性能、网络等等因素,也算是了比较好方案了。

总结

以上各种id生成方式,各有各的优缺点,不能一概而论。要哪一种更好,还是要看具体需求,适合就是最好的。但总的来说,唯一性、性能是绝对高尚的。
除了上述几种方式之外,还有很多生成唯一id的方案,也可以奇技淫巧一下(猥琐发育),在上面几种方式为基础打造新的更加高效和可靠的生成方式




原创不易,分享快乐,渴望动力

浅谈并发加锁

本作品采用《CC 协议》,转载必须注明作者和本文链接

我只想看看蓝天

本帖由系统于 4个月前 自动加精
《L01 基础入门》
我们将带你从零开发一个项目并部署到线上,本课程教授 Web 开发中专业、实用的技能,如 Git 工作流、Laravel Mix 前端工作流等。
《L02 从零构建论坛系统》
以构建论坛项目 LaraBBS 为线索,展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。
讨论数量: 8

雪花算法多进程要设置不同的机器id才行的,不然生成id算法就重复了 :joy:

4个月前 评论
luler (楼主) 4个月前
dengminfeng (作者) 4个月前
luler (楼主) 4个月前
godruoyi

上面提到的雪花算法生成唯一 ID 的 Package,已内置了 Redis 的支持,即使在多线程环境下,也不会生成重复的ID:

// 在 Laravel 中,你可以这样使用
$snowflake = (new Snowflake())->setSequenceResolver(
    new LaravelSequenceResolver($this->app->get('cache')->store())
);

$snowflake->id();

底层是基于 redis psetex 实现的并发锁,保证同一时间、同一机器中心 ID、同一 workID 下生成的 ID 不重复。

$lua = "return redis.call('exists',KEYS[1])<1 and redis.call('psetex',KEYS[1],ARGV[2],ARGV[1])";
if ($store->connection()->eval($lua, 1, $key = $currentTime, 1, 1000)) {
    return 0;
}
return $store->connection()->incrby($key, 1);
4个月前 评论
luler (楼主) 4个月前

学习到了,好文章,简单易懂

4个月前 评论

一个疑问, uniqid() 在多机器集群的时候,会有多少重复呢?

4个月前 评论
luler (楼主) 4个月前

看来用这个session_create_id()挺好的。

4个月前 评论
luler (楼主) 4个月前

提供两个方法:

  1. microtime().random(100000,999999)
  2. shuffle([1,2,3,等64个随机字符]) 获取16 或者 32
4个月前 评论
luler (楼主) 4个月前
swing07 (作者) 4个月前
followyounger

说明session_create_id 还是不错的么,这个就算是奇淫益术了

2个月前 评论

echo uniqid(php_uname('n').getmypid(), true)

2个月前 评论

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!