04 Lambda 和 Kappa 架构

这篇总结来自极客时间专栏《大规模数据处理实践》的 10-11 节。

关于第八节 CAP 的内容可以参考之前总结的另一篇文章 分布式系统的一致性协议之 2PC 和 3PC,这里就不再详述了。

关于 Lambda 架构和 Kappa 架构可以参考我之前总结的这篇文章 第一章 Streaming 101(里面有过简单的介绍).

Lambda 架构

Lambda 架构算是第一代大数据处理架构,提出之后在工业届得到广泛应用,其大概的架构如下所示:

Lambda 架构,图片来自极客时间

Lambda 架构分为三层:

  1. Batch Layer:批处理层,存储管理主数据集(不可变的数据集)和预先批处理计算好的视图,批处理层使用可处理大量数据的分布式处理系统预先计算结果。它通过处理所有的已有历史数据来实现数据的准确性。这意味着它是基于完整的数据集来重新计算的,能够修复任何错误,然后更新现有的数据视图(准确性有保证);
  2. Speed Layer:速度处理层,主要是提供最新数据来减少延迟(偏实时/准实时计算);
  3. Serving Layer:用于响应查询的服务层,所有在前面两层处理的数据都会存储在服务层,服务层向外部提供查询服务。

Lambda 架构可以做到实时分析,又能通过批计算保证过去数据的正确性,在实时计算还不很准确的时代,这种架构非常受欢迎。

Lambda 架构的问题是什么呢?

  • 最主要的就是要维护两套系统,当业务变得非常复杂时,这个维护成本是非常高的;

个人看法:就 Lambda 架构本身而言,其对业内的影响无疑是成功的,这种架构直到现在依然在广泛应用,这种架构的提出也跟其特殊历史背景有关。
Lambda 提出的时代,一说到流计算,大家的第一印象就是不准确、估计值等,当时 DataFlow 模型还没出现,如果没算错,Spark Streaming 应该也没出现,这时候业务既想通过 storm 去做实时分析又想使用批处理去做数据校准/或者是预分析历史数据,Lambda 在那个时代给业内带来了一个全新的思路,在大数据处理历史上有跨时代的意义。

Kappa 架构

Kappa 架构是 Jay Kreps(Kafka 和 Samza 的作者之一)提出的一个种架构思想,架构框图如下:

Kappa 架构,图片来自极客时间

Kappa 架构思想主要是:让速度处理层也可以做之前批处理层做的事情,这样就不需要去维护两套系统了。

那么,Kappa 的问题是什么?

  1. Kappa 架构只保留了速度层而缺少批处理层,在速度层上处理大规模数据可能会有数据更新出错的情况发生(数据出错的问题是非常难排查的);
  2. Kappa 架构的批处理和流处理都放在了速度层上,这导致了这种架构是使用同一套代码来处理算法逻辑的,所以 Kappa 架构并不适用于批处理和流处理代码逻辑不一致的场景。

个人看法:Kappa 思想其实可以再进一步,就现在经常说的【批流统一】,批其实只是流的其中一种形态,这个就是后来 DataFlow 的主要思想。这些架构思想对业内的影响很大,基本上决定了这个领域的发展,不过比较可惜的是,这些牛逼的思路和想法现在还都是硅谷在引领,希望有一天国内能引领某些领域的发展。

有兴趣的同学,可以通过下面的链接购买,会有一些优惠

二维码扫描购买有一定优惠
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容