唯一ID生成原理与phper的深度思考

date: 2017-01-03 13:14

唯一ID引发的血案

写这篇 blog 原因是业务中遇到 生成唯一ID的场景 却没有按照需求生成唯一ID,由此引发了一番 乱炖,业务中目前使用的方案:

// mysql 自增ID + 事务 + 时间 + 随机数
public function generateTradeNumber()
{
    $tradeTime = date('YmdHi', time());

    $lastTrade     = TradeNumber::findBySql('SELECT * FROM `Trade` ORDER BY id DESC LIMIT 1 FOR UPDATE');
    $lastTradeTime = '';
    if (!empty($lastTrade)) {
        $lastTradeNumber = $lastTrade->getTradeNumber();
        $lastTradeTime   = substr($lastTradeNumber, 0, 12);
        $lastTradeSerial = substr($lastTradeNumber, 12);
        if ($tradeTime == $lastTradeTime) {
            return $lastTradeTime . ($lastTradeSerial >= 99999 ? $lastTradeSerial + 1 : '0' . ($lastTradeSerial + 1));
        }
    }

    $initSerialNumber = rand(10000, 99999);
    return $tradeTime . '0' . $initSerialNumber;
}

简单解释一下:

  • 唯一 TradeNumber 由 2 部分组成:当前时间 12 位 + 6 位数字
  • 时间粒度到 date('YmdHi', time())
  • 每次生成时,先锁死最后一条 Trade,当前分钟第一个进来的 Trade 会分配 rand(10000, 99999)(这样做是为了保持长度一致,以及防止被人找出规律来),之后的 Trade 在此基础上 +1

然而实际上并没有达到 唯一ID 的目的,查询数据库发现还是有重复 TradeNumber 存在

php uniqid() 分析

php manual uniqid()

详细的分析当然是直接看源码最清楚了,不过 php manual 已经说了:based on the current time in microseconds。并且 php manual 中已经详细说明了这个问题,详细可以查看 php manual note 中的内容,note 中提供了另外一种方案:

function uniqidReal($lenght = 13) {
     // uniqid gives 13 chars, but you could adjust it to your needs.
     if (function_exists("random_bytes")) {
         $bytes = random_bytes(ceil($lenght / 2));
     } elseif (function_exists("openssl_random_pseudo_bytes")) {
         $bytes = openssl_random_pseudo_bytes(ceil($lenght / 2));
     } else {
         throw new Exception("no cryptographically secure random function available");
     }
     return substr(bin2hex($bytes), 0, $lenght);
 }

这种方案的原理:随机数。当然这个随机数概率就比 rand(10000, 99999) 小多了,毕竟加入了英文字母。那么,回到我们的主题,随机数 === 唯一ID ?显然,无论概率怎么小,还是存在重复的可能(-_-)。

唯一ID原理

Linux多线程与同步:http://www.cnblogs.com/vamei/archive/2012/10/09/2715393.html
《高性能linux服务器编程》- 高性能 io - 进程相关部分
唯一ID生成原理与PHP实现:http://mp.weixin.qq.com/s/bagOgzdwLyZv_ITNVnYfoQ / https://github.com/liexusong/atom

其实非常的简单,只要保证从同一个地方产生,并按照不重复的规律生成。联想一下 mysql 的自增ID,就是 同一张表,依次递增。所以,自增ID真正的难点:同一个地方生成。但是,在多进程、多线程的场景下,这个 地方 就会成为 竞态资源。要了解race condition, mutex和condition variable的概念,请参考上面的博文 -- Linux多线程与同步。

多线程同步方式:

  • 互斥锁(mutex):一个线程申请了互斥锁,然后进行 原子操作,其他进程必须要等待此线程释放互斥锁,才能成功申请。
  • 条件变量(condition variable):配合互斥锁一起使用,在 多个线程等待某个条件发生 时的场景下使用
  • 读写锁(reader-writer lock):和互斥锁类似,锁有 3 种状态 -- R、W、unlock。如果资源上 R 锁,其他线程可以继续申请 R 锁;如果需要申请 W 锁,必须等待其他进程都释放 R 锁;如果资源上 W 锁,其他线程必须等待其释放

多进程的同步方式:

  • 管道
  • 共享内存

是不是有点峰回路转,怎么突然跑到操作系统层面了?whatever,你曾经学的操作系统原理,就是这么有用。

再来简单的剖析一下 唯一ID生成原理与PHP实现 这篇博文中提到的 snowflake算法:

  • 唯一ID组成:64bit, 1bit(不用)+ 41bit(时间戳)+ 10bit(机器id)+ 12bit(序列号)
  • 时间毫秒级(可以用2082年),每毫秒最多 2^12=4096 个请求,如果超过了,就分配到下一毫秒
  • 为什么分机器ID:达到分布式计算,避免不同机器间同步带来的性能损耗

代码就不贴了,大家自己看,挺简单的。

唯一ID的php实现

韩天峰(Rango) - 从零开始编写第一个PHP扩展:http://wiki.swoole.com/wiki/page/238.html
淘宝信海龙 php 扩展开发:http://www.bo56.com/category/programming-language/php-programming-language
唯一ID生成原理与PHP实现:http://mp.weixin.qq.com/s/bagOgzdwLyZv_ITNVnYfoQ / https://github.com/liexusong/atom
韩天峰(Rango) Yii/Yaf/Swoole3个框架的压测性能对比:http://rango.swoole.com/archives/254

由于 php-fpm 是基于进程管理,每个pfm子进程都是相互独立的,想要实现 同一个地方生成,就需要依靠扩展。而php扩展开发,不少业内大牛都贴了教程,无耻引用几个。

推荐学习次序:

  • 韩天峰(Rango) - 从零开始编写第一个PHP扩展
  • 淘宝信海龙 php 扩展开发系列教程
  • 查看 https://github.com/liexusong/atom 源码:github 上的文档只提到了 2 个函数,还是直接读源码吧,主要是 atom.c

测试:

  • cli 下的测试
// php test
for ($i=0; $i < 20; $i++) {
    $id = atom_next_id(); // different
    $info = atom_explain($id); // the same
    echo $id . "\t" . date('YmdHis', $info['timestamp']) . "\t" . $info['datacenter'] . "\t" . $info['worker'] . "\n";
}

// ext atom source code
retval = ((current - context->twepoch) << context->timestamp_left_shift)
    | (context->datacenter_id << context->datacenter_id_shift)
    | (context->worker_id << context->worker_id_shift)
    | context->sequence;

写在最后

《高性能mysql》
MOOC - 《linux操作系统原理与应用》
swoole官方教程和 rango 的博客
我的 docker 环境:https://coding.net/u/daydaygo/p/docker/git
《Just for Fun》linus 自传

由于本身的技术局限,对 mysql 中 这套 SELECT FOR UPDATE 不太熟悉,这个点有待提高,推荐《高性能mysql》。

操作系统原理到底有没有用?如果看到 进程、线程、共享内存、管道 等等名词感觉不太熟悉(熟悉名词和知道怎么用还隔着好远呢),最好还是多了解一点。

  • 推荐《linux操作系统原理与应用》:这个是大学教材,找个MOOC网看看在线视频,网易公开课、中国大学MOOC、学堂在线 等等
  • 《高性能linux服务器编程》:还有鼎鼎大名的《Unix Network Programing》,就是实在是太厚了
  • swoole官方教程和 rango 的博客:c10k问题、时间循环、swoole/nginx/go/nodejs 实现原理对比、线程/进程/协程 对比 等等

当然,还有一个问题需要解决:说了这么半天,程序还是得要在 linux 下面跑,我的 windows 怎么办,给自己打一下广告,我的 docker 环境:https://coding.net/u/daydaygo/p/docker/git

最后的最后,写在这个没有出去浪的元旦假期:

  • 且将新火试新茶,诗酒趁年华
  • Just for Fun
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容

  • 1. Nginx的模块与工作原理 Nginx由内核和模块组成,其中,内核的设计非常微小和简洁,完成的工作也非常简单...
    rosekissyou阅读 10,190评论 5 124
  • 从三月份找实习到现在,面了一些公司,挂了不少,但最终还是拿到小米、百度、阿里、京东、新浪、CVTE、乐视家的研发岗...
    时芥蓝阅读 42,182评论 11 349
  • 经过稍微整理下过去的notes,结果工作经历和自学。综合如下为涉及的主要技术领域,接下来将按照这个来进行文章整理。...
    DeleiGuo阅读 568评论 0 49
  • 一开始刚玩微信时也发朋友圈也看朋友圈,但随着微商的崛起,大量的转发,好久也同事居多,公司有点事情就是刷屏的节奏,...
    sixrain阅读 220评论 0 0
  • 说鸡圈里五只鸡,三黑俩白。那三儿找时间就啄着这俩满鸡圈躲。后来就不见了一只白鸡;再后来发现,鸡圈石头缝里夹了那鸡的...
    晓拙阅读 146评论 0 0