第2章 安装kafka 本章介绍Apache Kafka broker的入门知识,包括如何搭建Apache ZooKeeper集群, Kafka...
理想情况下,在Kubernetes上部署应用程序的开发人员不需要知道集群提供了什么存储技术,就像他们不需要知道用于运行pod的物理服务器的特征一...
译者有话说 这是一本非常适合数据架构师或准数据架构师阅读的书!当前IT行业,越来越多的数据仓库基于云环境创建,越来越多的数据仓库要求实时性,越来...
管道概念与设计 什么是管道? 管道描述了从源头系统到目标系统的数据流,并定义了在此过程中如何转换数据。 可以使用单个origin(初始)阶段表示...
Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块,目前市面上最好...
Spark The Definitive Guide(Spark权威指南) 中文版。本书详细介绍了Spark2.x版本的各个模块,目前市面上最好...
15.3 使用UDAFs构建自定义聚合 在前面的小节中,您快速回顾了聚合数据,在简单数据集上执行了聚合操作,并最终处理了真实的数据。在这些操作中...
Streamsets简介及概述 StreamSets Data Collector是一个功能强大的企业级流处理平台,可以使用该平台来接入数据,处...
关注公众号:登峰大数据,阅读Spark实战第二版(完整中文版),系统学习Spark3.0大数据框架! 如果您觉得作者翻译的内容有帮助,请分享给更...