Avatar notebook default
19篇文章 · 39705字 · 4人关注
  • Resize,w 360,h 240
    17. Apache Kafka

    1. Kafka重要概念和技术架构: 1.实时数据分析中的Kakfa 在实时数据分析应用,Kafka的位置非常重要。首先通过Flume将Ngin...

  • 19. Storm Topology开发

    一. wordCount Topology开发: 1.spout数据收集器(SentenceSpout类): 有两种方法来开发spout类,第...

  • Resize,w 360,h 240
    18. Storm基础

    1. Storm介绍: Storm是实时流计算框架。企业中典型实时分析框架搭建模式: Flume + Kafka + Storm + Hbase...

  • Resize,w 360,h 240
    16. HBase高级应用

    1. HBase存储中的3个核心机制 1.flush机制:当MemStore达到阈值之后,会flush成一个StoreFile (也就是内存中的...

  • Resize,w 360,h 240
    15.HBase基础

    1. HBase介绍,Hbase是什么? HBase -- Hadoop Database ,是一个高可靠、高性能、面向列、可伸缩的分布式存储系...

    0.6 3728 1 36
  • 重要记录

    CDH版本下载地址:http://archive.cloudera.com/cdh5/cdh/5/

  • Resize,w 360,h 240
    13. Oozie介绍

    1. Hadoop常见调度框架: (1)Linux Crontab:Linux自带的任务调度计划,在任务比较少的情况下,可以使用这种方式,直接执...

  • Resize,w 360,h 240
    12.Flume介绍

    1. Flume简介 Apache Flume是一个分布式的、可靠的、可用的,从多种不同的源收集、聚集、移动大量日志数据到集中数据存储的系统。 ...

  • Resize,w 360,h 240
    11.Hive压缩,文件格式及优化

    1. 日志文件加载案例: 需求描述:在日志文件目录中,按天建文件夹,并且在每个天文件夹中,每小时有一个日志文件。程序自动每天将这些文件load到...

文集作者