数据来源
1)数据来源
离线计算:HDFS 历史数据等,一般数据规模比较大
实时计算:一般来自于消息队列(kafka等),实时地新增、修改记录过来的某一笔数据。
2)处理过程
离线计算:MR:MAP + REDUCE SPARK:SPARK SQL
实时计算:SPARK Streaming、SS、Flink、Strom
3)处理速度
离线计算:速度慢
实时:速度快
4)进程角度
离线计算:进程经过启动和销毁
实时计算:线程一直启动,等待数据进入进行处理
1)数据来源
离线计算:HDFS 历史数据等,一般数据规模比较大
实时计算:一般来自于消息队列(kafka等),实时地新增、修改记录过来的某一笔数据。
2)处理过程
离线计算:MR:MAP + REDUCE SPARK:SPARK SQL
实时计算:SPARK Streaming、SS、Flink、Strom
3)处理速度
离线计算:速度慢
实时:速度快
4)进程角度
离线计算:进程经过启动和销毁
实时计算:线程一直启动,等待数据进入进行处理