Hadoop离线数据分析平台实战——520项目总结

Hadoop离线数据分析平台实战——520项目总结

到这里本次项目也就介绍完了,不过在项目最后简单的介绍一些数字以及项目优化、扩展等情况
通过本次课程的学习,希望同学们对离线数据分析这一块有一个初步的了解,
希望同学们在学习完本课程后,对如何在工作中使用离线数据分析有一个初步的了解。
在本次课程中,我主要目标是放到了如何产生用户浏览数据以及如何解析数据,
对应解析后的数据结果展示,讲解的不是特别的详细,
所以希望同学们在学习之余,自己想想如何能够更好的显示解析后的数据,
最后祝同学们能够有一个好的开始。

实际工作中常见的数字:

如果只有launch和pageview事件,一千万的数据一般文件大小为7G左右。
单台的Nginx+Flume基本可以支持数据的传输操作,
但是最好使用两台机器做负载均衡/容错机制。
如果IP解析采用我们项目中介绍的这种,在集群规模为3+8(3台机器为NN+RM, 8台机器为DN+NM)的情况下,所有的mr和hive程序运行时间在一个小时以内。

优化:

MR程序:

    进行hadoop、hbase等参数调优,使用多个reducer等。

Hive程序:

    指定使用多个reducer、设置hive执行mr时候的内存参数、调整HQL语句结构等

数据展示:

    对应api的产生可以通过添加cache的方式减少查询数据的次数等。

扩展:

数据收集

    可以通过Nginx的负载均衡机制动态的根据项目的需要添加Nginx+Flume的数据传输机器,
    需要注意的是在采用负载均衡的时候,flume配置中最后在文件产生格式中添加一个编号来分别表示不同的机器产生的日志记录。

数据解析:

    利用hadoop的本身优势,可以动态的添加datanode节点,增大数据的执行能力。

数据展示:

    可以利用Nginx的负载均衡机制,在nginx服务器之后提供多台tomcat的服务器来提供实际应用。
    (和其他的java web程序类似)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容

  • Hadoop离线数据分析平台实战——230项目数据存储结构设计 数据存储设计 在本次项目中设计到数据存储的有三个地...
    Albert陈凯阅读 550评论 0 1
  • 话说:目标是鞭策自我的一种束缚……试问有几个能恒心去做到 今天,公司只有(20个)工人上班…… 今天,钳工师傅的生...
    爱的转圈圈阅读 487评论 3 1
  • 一、读书目标: 书是我们人类智慧的结晶,是我们的好朋友,是我们人类进步的阶梯,是打开知识和理想大门的金钥匙!为了更...
    洮北1227白建东阅读 148评论 0 0
  • 老那今天有些烦,冰雨连绵这出个门就跟进了溜冰场一样,狗狗那明死活不愿意穿鞋套。而自己必须要穿上带钉子的防滑鞋套。出...
    我是空谷阅读 259评论 0 0
  • 昨天是意想不到。大家都分享了最近几天的美好的事情。这些事情虽然都是一些小事,但是美好的事情和美好的人,都能让大家有...
    你站在桥上看风景_2ae1阅读 153评论 0 0