正义的米卡塔

发简信

正义的米卡塔

2
关注
2
粉丝
9
文章
3362

字数
2

收获喜欢
4

总资产

IP属地：江苏

海洋小企鹅

thrift+zk实现服务的注册，发现，调用
本文基于实际生产环境中的Thrift+zookeeper实现的rpc调用总结，大致有以下几个部分：1: 服务端将服务注册在zk中1.1 解析服务端的网卡IP；1.2 获取zo...

2692 0 6
wishReborn

kafka-kafka+sparkstreaming不丢数据的方案
一、从kafka读数据保证不丢失的方案 0.8版本 lines对象里面有偏移量,但是凡事代码对这个对象做了任何算子的操作(比如map),偏移量就丢失了.所以调用了creat...

252 0 1
森林和海洋

sparkstreaming读取kafka数据源流程解析(0.10版本)
针对0.10及以上版本的kafka, spark推出了更简洁的模式进行数据读取, jar包名称为spark-streaming-kafka-0-10_2.12. 这种方式可...

219 0 1
ZFH__ZJ

131、Spark核心编程进阶之yarn模式运行spark作业
前提如果想要让spark作业可以运行在yarn上面，那么首先就必须在spark-env.sh文件中，配置HADOOP_CONF_DIR或者YARN_CONF_DIR属性，值...

376 0 3
w1992wishes

【Spark】Spark 运行架构--YARN-Client
本篇结构： YARN-Client 工作流程图 YARN-Client 工作流程 YARN-Client 模式启动类图 YARN-Client 实现原理 YARN-Clien...

724 0 1
w1992wishes

【Spark】Spark 运行架构--YARN 运行模式
本篇结构：运行架构组成运行模式介绍两个重要类 TaskScheduler 和 SchedulerBackend yarn 运行模式 YARN-Client 和 YARN...

969 0 1
jackyan163

大数据之Hadoop-HDFS
第1章 HDFS概述 1.1 HDFS产出背景及定义 1.1.1 HDFS产生背景随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中...

333 0 1
那些年搬过的砖

Hadoop集群搭建
1. 集群环境规划 2. 新建用户及用户组 3. 修改master(172...6)主机名 4. 配置ip与主机名映射 4. 配置免密登录 3. 解压并配置环境变量 4. h...

115 0 2
那些年搬过的砖

Spark从入门到入土(四)：SparkStreaming集成kafka
一、SparkStreaming概念 SparkStreaming是一个准实时的数据处理框架，支持对实时数据流进行可扩展、高吞吐量、容错的流处理，SparkStreaming...

402 1 3