快乐大数据第12课 数据平台实战

#数据平台实战

#1配置maven,tomcat,cbord的过程略

#2.在node01 启动mysql

mysql -h192.168.183.101 -uhive -phive123

creat database bi;

在cboard中配置数据源

  数据源类型

  新建数据源名称  bi_mysql

  驱动类  bi_mysql

连接串 jdbc:mysql://192.168.183.101:3306/bi

  数据库用户名 hive

  数据库名 hive123

#3在kafka上创建实时日志

在node03上

cd /home/hadoop/apps/kafka_2.11-0.10.2.1

bin/kafka-topics.sh --create --zookeeper 192.168.183.101:2181 --replication-factor 1 --partitions 3 --topic userlog2

bin/kafka-topics.sh --list --zookeeper 192.168.183.101:2181

#使用kafka自带的消费者客户端脚本

bin/kafka-console-consumer.sh --zookeeper 192.168.183.101:2181 --from-beginning --topic userlog2

#在node01上

mkdir ~/apps/userlog

hadoop fs -mkdir /data/userlog

新建一个flume的日志文件 logagent.cnf 注意该IP

在node02上 修改collectagent101.cnf

先启动后端的collector

再启动前端日志收集的flume

在node02上启动flume

bin/flume-ng agent --conf conf --conf-file conf/collectagent101.conf --name collectagent -Dflume.root.logger=INFO,console

再在node01上启动flume

bin/flume-ng agent --conf conf --conf-file conf/logagent.conf --name logagent -Dflume.root.logger=INFO,console

在node01上启动生产数据的jar文件

在node01的apps上先rz上传

在apps下 java -cp logproducer-1.0-SNAPSHOT.jar cn.chinahadoop.producer.LogProducer /home/hadoop/apps/userlog f1

会发现生产出了数据

line -> user_20,windows_v1_20171201,010,2,1534645660158

line -> user_95,android_pad_v1.2_20180110,0755,1,1534645661159

line -> user_43,android_v1.2_20180110,0755,1,1534645662160

line -> user_90,apple_phone_v1.2_20180101,020,2,1534645663161

line -> user_49,android_v1.2_20180110,021,1,1534645664162

line -> user_66,apple_phone_v1.2_20180101,020,1,1534645665163

line -> user_57,apple_pad_v1.2_20180101,021,2,1534645666163

line -> user_96,apple_phone_v1.2_20180101,010,1,1534645667164

line -> user_95,android_pad_v1.2_20180110,0755,1,1534645668165

line -> user_5,android_pad_v1.2_20180110,021,2,1534645669165

line -> user_51,apple_pad_v1.2_20180101,0755,1,1534645670166

line -> user_44,windows_v1_20171201,010,1,1534645671167

line -> user_81,apple_pad_v1.2_20180101,021,2,1534645672168

line -> user_82,apple_mac_v1.2_20180101,020,1,1534645673169

line -> user_95,android_pad_v1.2_20180110,0755,1,1534645674169

line -> user_60,apple_phone_v1.2_20180101,010,2,1534645675170

line -> user_97,android_v1.2_20180110,021,1,1534645676170

line -> user_84,apple_phone_v1.2_20180101,010,1,1534645677171

line -> user_21,apple_pad_v1.2_20180101,021,2,1534645678171

line -> user_58,apple_mac_v1.2_20180101,020,1,1534645679172

line -> user_55,android_v1.2_20180110,0755,1,1534645680174

line -> user_45,apple_pad_v1.2_20180101,021,2,1534645681175

line -> user_70,apple_mac_v1.2_20180101,020,1,1534645682176

line -> user_93,apple_pad_v1.2_20180101,021,1,1534645683177

line -> user_68,windows_v1_20171201,010,2,1534645684178

line -> user_34,apple_mac_v1.2_20180101,020,1,1534645685179

line -> user_87,apple_pad_v1.2_20180101,0755,1,1534645686180

line -> user_43,android_v1.2_20180110,0755,2,1534645687182

line -> user_54,apple_phone_v1.2_20180101,020,1,1534645688183

line -> user_61,android_v1.2_20180110,021,1,1534645689184

line -> user_97,android_v1.2_20180110,021,2,1534645690185

line -> user_18,apple_phone_v1.2_20180101,020,1,1534645691185

line -> user_77,android_pad_v1.2_20180110,021,1,1534645692186

line -> user_67,android_v1.2_20180110,0755,2,1534645693187

line -> user_82,apple_mac_v1.2_20180101,020,1,1534645694188

line -> user_2,windows_v1_20171201,020,1,1534645695189

line -> user_83,android_pad_v1.2_20180110,0755,2,1534645696191

line -> user_91,android_v1.2_20180110,0755,1,1534645697191

line -> user_9,apple_pad_v1.2_20180101,021,1,1534645698193

查看已经生成的文件

cd ~/userlog/

并且在node2上一经发现监控到了数据的产生

在node01上建立数据仓库

create database ods;

use ods;

create external table ods.userlog_external_pt(

user_id string,

client_version string,

area_id string,

user_behavior int,

time string

)

partitioned by(dt string)

row format delimited

fields terminated by ','

lines terminated by '\n'

stored as textfile

location '/data/userlog';

create database pdw;

use pdw;

##1.创建用户日志明细表

//用户id,使用的客户端版本号,客户端类型,地域id,地域名称,时间戳,曝光,点击

create table pdw.userlog_detail_pt(

user_id string,

client_version string,

client_type string,

area_id string,

area_name string,

time string,

pv_cnt int,

click_cnt int

)

partitioned by(dt string)

row format delimited

fields terminated by '\t'

lines terminated by '\n'

stored as RCFILE;

##2.创建新增用户明细表(用于计算新增用户数,累计用户)

//新增用户id,时间戳

create table pdw.new_user_detail_pt(

user_id string,

time string

)

partitioned by(dt string)

row format delimited

fields terminated by '\t'

lines terminated by '\n'

stored as RCFILE;

//导入数据:(先提前建立好 mkdir -r /home/hadoop/apps/hive_test/data/ 再rz area_data.txt client_version_type_data.txt

load data local inpath '/home/hadoop/apps/hive_test/data/area_data.txt' into table area_info;

load data local inpath '/home/hadoop/apps/hive_test/data/client_version_type_data.txt' into table rel.client_version_type_info;

在mysql上创建表

CREATE TABLE `realtime_pv_click_report_daily` (

`pv_cnt` int(11) NOT NULL,

`click_cnt` int(11) NOT NULL,

`date_time` varchar(512) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

执行用户明细脚本

sh ods_user_log_2_rcfile_daily.sh 0

在hivie中

use pdw;

执行新增用户脚本

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容