240 发简信
IP属地:广东
  • Resize,w 360,h 240
    Kafka 的认证机制

    Kafka 认证机制 自 0.9.0.0 版本开始,Kafka 正式引入了认证机制,用于实现基础的安全用户认证,这是将 Kafka 上云或进行多...

  • Flume Taildir Source源码修改---监听目录

    一、需求 flume taildir源码只支持监控一级目录下的文件,能不能支持监听子目录下的所有文件flume版本:1.9.0 二、思路 源码中...

  • CDH 6.3.1 rpm+http安装部署

    一、准备工作 1.离线部署主要分为三块: a.MySQL离线部署 b.CM离线部署 c.Parcel⽂件离线源部署 2.规划 3.下载源 支持的...

  • Spark Streaming 状态管理算子的选择比较

    一、updateStateByKey 官方原话: 也即是说它会统计全局的key的状态,就算没有数据输入,它也会在每一个批次的时候返回之前的key...

  • Spark Streaming 从指定时间戳开始消费 kafka 数据

    一、需求 从指定时间戳(比如 2 小时前)开始消费 Kafka 数据 二、思路 我们知道通过 Kafka 的 API 可以得到指定时间戳对应数据...

  • CDK &CDS 安装

    一、下载安装包 http://archive.cloudera.com/kafka/parcels/4.1.0/ http://archive....

  • kafka单机安装部署

    一、环境准备 kafka-2.2.1-kafka4.1.0.tar.gz 已经安装好zookeeper环境 kafka-eagle-bin-1....

  • hadoop,spark中使用lzo

    一、环境准备 hadoop-2.6.0-cdh5.15.1并支持压缩(参考:hadoop安装文档) lzo jar包(下载地址:lzo jar下...

  • Resize,w 360,h 240
    Azkaban安装部署及使用

    一、介绍 Azkaban是LinkedIn开源的任务调度框架,类似于JavaEE中的JBPM和Activiti工作流框架.如ETL的过程,Sqo...