Spark Streaming 容错机制

一 Spark中的一致性

1 Spark RDD的基本容错语义

RDD是不可变的，确定的，可以被重新计算的分布式数据集。每个RDD都记录了已经确定的操作先后关系。
如果由于任何一个节点的错误导致RDD的任何一个分区丢失，该分区都可以从原始的数据集中通过操作的先后关系重新计算出来。
所有的RDD转换都是明确的，那么在最终转换后的RDD的数据总是相关的，与Spark cluster的错误无关。

可以看到Spark RDD已经为我们提供了比较好的容错能力。Spark进行数据的操作在可容错的文件系统中，如HDFS或者S3。因此从容错数据中生成的所有RDD也是容错的。为了所有的生成的RDD达到相同的容错性，RDD的数据会在集群中工作节点上多个executor中创建副本（默认复制因子是2）。

2 系统异常的场景

1.工作节点错误(Failure of a Worker Node ) 任何执行executor的worker node都可能失败，这些节点上的内存数据会丢失。任何运行在一个失败节点上的receivers，都会丢失缓存数据(buffered data)。
2.Driver节点错误(Failure of the Driver Node) 如果运行Spark Streaming 应用的driver node失败，显然SparkContext丢失，那么所有executor的内存数据都会丢失。

3 Spark Streaming中的容错语义

在理想的情况下，一个系统能够提供的三种类型的一致性

At most once: 每个record 要么被处理一次或者不会被处理
At least once: 每个record会被处理一次或者多次。这个比at-most once一致性要强，因为它保证了没有数据会丢失。但是可能会有很多重复的数据。
Exactly once: 每个record都会被处理有且一次。没有数据会丢失，并且也没有数据会被处理多次。这个显然是三者中一致性最强的。

4 Exactly once的讨论

如果要做到Exactly once ，就需要在整个数据处理的过程中都做到，包括：

Receiving the data: 数据的接收过程
Transforming the data: 数据的处理转换过程。Spark Streaming中使用DStream 和 RDD 的转换。由于RDD的机制，Spark的处理保证了exactly once。
Pushing out the data: 数据的输出最终转换的数据输出到外部的系统中，比如文件系统，数据库等。默认的输出操作保证了at-least once语义，但是基于输出操作和下游的系统（是否支持事务等）。但是用户可以实现自己的事务机制，以达到exactly-once 语义。
在数据输出层面，为了达到exactly-once，有两种方式：

Idempotent updates: 幂等更新多次写总是写相同的数据。例如saveAs***Files 总是将相同的数据写入到文件中。这里比较典型的情况是输出基于key-value的数据库，即使在at-most-once的情况下，有些数据可能会出现多次，但是会多次写对于最终的输出正确性也不会有正确性的影响。
Transactional updates: 所以的更新都是基于事务的，所以所有的更新都是exactly-once.
一种基于事务的达到exactly-once方式如下：
使用foreachRDD中的batch time和RDD的分区索引(partition index)创建一个标识符。这个标识符唯一标记了streaming 应用中的数据。
通过事务更新这部分数据到外部存储中，如果该标识符没有提交，那么原子的提交分区数据和标识符。

二 Spark Streaming 与Kafka集成的一致性讨论

将Kafka作为Spark Streaming的数据输入端，与Kafka集成的旧API通过基于Receiver的机制来从数据源中获得数据，有很多相关的讨论如何来达到可靠性以及高性能。新的API通过Kafka Direct API保证了从Kafka接收的数据是exactly once。旧的Kafka API使用起来需要考虑的问题比较多，推荐使用新的Kafka Direct API。下面也主要围绕新的API讨论。

val directKafkaStream = KafkaUtils.createDirectStream

在该版本中，创建出的directKafkaStream的offset只会在该stream内存中存储,并不会存储到zookeeper中。根据上述的讨论，为了实现exactly-once，我们有两种方式：1 在一个事务中，提交数据和offset到存储中。2 在幂等操作的输出后，存储offset。

对于存储offset 有三个选择：
1 Checkpoints
启用kafka的Checkpoints机制。offset会自动的存储到checkpoint中。启用Checkpoints的问题也很明显：如果提交的spark应用的代码发生了变化之后，不能从checkpoint中进行恢复。另外，为了达到exactly-once 需要输出的存储是幂等的。
2 Kafka中
在Kafka broker version 0.10.0的API中，默认会自动的提交offset到kafka中（实际是写入到了zookeeper中kafka相关的路径中）。但是默认的自动提交的时间我们并不知道，这些数据是否写入的存储中并不确定。所以应当enable.auto.commit置为false。当数据写入到存储中时，我们应当通过commitAsync API来提交offset到kafka中。由于kafka不是事务性的，所以为了exactly-once，输出需要是幂等的。
Kafka broker version 0.8.2.1
在该版本中，并不会提交offset。需要我们自行实现保存offset到zookeeper的功能。实际上 Kafka broker version 0.10.0所使用的提交offset所用到的类是KafkaCluster，在该版本中存在，只是相关代码没有作为API公开出来。我们可以直接从源码中提取该类的代码直接使用。
3 自定义的存储
能够存储offset和结果数据在同一个事务中。需要我们自己检测跳过还是采用offset以避免使数据重复或者丢失数据。

exactly-once听起来非常美好，但是在很多应用场景下实现成本较高。
在对数据可靠性要求不高的场景下，甚至at-least-once都可以作为一个选项，尤其对于数据实时性要求更高的场景下。而在工程实践中，代码版本的更新迭代是不可避免的，一旦旧版本中出现了bug导致服务不能正常运行，数据将不能恢复，所以并不建议使用checkpoint。

参考
http://spark.apache.org/docs/latest/streaming-programming-guide.html#fault-tolerance-semantics
http://spark.apache.org/docs/latest/streaming-kafka-0-10-integration.html
http://spark.apache.org/docs/latest/streaming-kafka-0-8-integration.html

最后编辑于：2017.12.06 01:50:18

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,214评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,307评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,543评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,221评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,224评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,007评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,313评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,956评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,441评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,925评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,018评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,685评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,234评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,240评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,464评论 1赞 261
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,467评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,762评论 2赞 345