69.Kudu、Spark2、Kafka安装—CDH

69.1 演示环境介绍

  • CDH集群运行正常
  • 操作系统版本为:CentOS6.5
  • CM和CDH版本为:5.12.1
  • CM管理员为:admin用户
  • 操作系统用户为:root用户

69.2 操作演示

Kudu安装

  • Kudu的Parcel部署
    • 下载Kudu的Parcel包:
http://archive.cloudera.com/kudu/parcels/5.12.1/KUDU-1.4.0-1.cdh5.12.1.p0.10-el6.parcel
http://archive.cloudera.com/kudu/parcels/5.12.1/KUDU-1.4.0-1.cdh5.12.1.p0.10-el6.parcel.sha1
http://archive.cloudera.com/kudu/parcels/5.12.1/manifest.json
  • 以上面文件下载到http服务所在服务器的/var/www/html/kudu1.4目录
[root@ip-186-31-6-148~]# cd /var/www/html/
[root@ip-186-31-6-148 html]# mkdir kudu1.4
[root@ip-186-31-6-148 html]# cd kudu1.4/
[root@ip-186-31-6-148 kudu1.4]# ll
total 474140
-rw-r--r-- 1 rootroot 485506175 Aug 30 14:55 KUDU-1.4.0-1.cdh5.12.1.p0.10-el6.parcel
-rw-r--r-- 1 rootroot        41 Aug 30 14:55KUDU-1.4.0-1.cdh5.12.1.p0.10-el6.parcel.sha1
-rw-r--r-- 1 rootroot      2646 Aug 30 14:55 manifest.json
[root@ip-186-31-6-148 kudu1.4]# 
  • Kudu服务安装
    • CM界面配置Kudu的Parcel地址,并下载,分发,激活Kudu
    • 选择Master和Tablet Server
    • 配置相应的目录,无论是Master还是Tablet根据实际情况,数据目录(fs_data_dir)应该都可能有多个,以提高并发读写,从而提高Kudu性能
  • 配置Impala
    • 在Impala的高级配置项中设置KuduMaster的地址和端口:
--kudu_master_hosts=ip-186-31-6-148.fayson.com:7051
  • 多个master可以以“,”分割如:
--kudu_master_hosts=ip-186-31-6-148.fayson.com:7051,ip-186-31-6-148.fayson.com:7051

安装Spark2

  • 下载csd文件:
http://archive.cloudera.com/spark2/csd/SPARK2_ON_YARN-2.1.0.cloudera1.jar
  • csd文件移动至/opt/cloudera/csd目录下
[root@ip-186-31-6-148csd]# pwd
/opt/cloudera/csd
[root@ip-186-31-6-148 csd]#ll
total 16
-rw-r--r-- 1 rootroot 16109 Mar 29 06:58 SPARK2_ON_YARN-2.1.0.cloudera1.jar
[root@ip-186-31-6-148 csd]# 

csd目录如不存在,则创建

[root@ip-186-31-6-148cloudera]# mkdir csd
[root@ip-186-31-6-148 cloudera]# chown cloudera-scm:cloudera-scm csd/
  • 重启CM服务
[root@ip-186-31-6-148~]# service cloudera-scm-serverrestart
Stopping cloudera-scm-server:                              [  OK  ]
Starting cloudera-scm-server:                              [  OK  ]
[root@ip-186-31-6-148 ~]# 
  • Spark2的Parcel部署
    • 下载Spark2的Parcel包:
http://archive.cloudera.com/spark2/parcels/2.1.0/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel
http://archive.cloudera.com/spark2/parcels/2.1.0/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel.sha1
http://archive.cloudera.com/spark2/parcels/2.1.0/manifest.json

上面个文件下载至/var/www/html/spark2.1.0目录下

[root@ip-186-31-6-148html]# cd /var/www/html/
[root@ip-186-31-6-148 html]# mkdir spark2.1.0
[root@ip-186-31-6-148 html]# cd spark2.1.0/
[root@ip-186-31-6-148 spark2.1.0]# ll
total 173052
-rw-r--r-- 1 rootroot      4677 Mar 29 06:58 manifest.json
-rw-r--r-- 1 rootroot 177185276 Mar 29 06:58 SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel
-rw-r--r-- 1 rootroot        41 Mar 29 06:58SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel.sha1
[root@ip-186-31-6-148 spark2.1.0]# 
  • Spark2安装
    • CM管理界面配置Spark2的Parcel地址并保存
    • 选择History Server和Gateway节点

安装Kafka

  • 版本选择
  • Kafka的Parcel部署
    • 下载Kafka的Parcel包:
http://archive.cloudera.com/kafka/parcels/2.1.1.18/KAFKA-2.1.1-1.2.1.1.p0.18-el6.parcel
http://archive.cloudera.com/kafka/parcels/2.1.1.18/KAFKA-2.1.1-1.2.1.1.p0.18-el6.parcel.sha1
http://archive.cloudera.com/kafka/parcels/2.1.1.18/manifest.json
  • 上面文件下载至/var/www/html/kafka2.1.1.18目录下
[root@ip-186-31-6-148html]# cd /var/www/html/
[root@ip-186-31-6-148 html]# mkdir kafka2.1.1.18
[root@ip-186-31-6-148 html]# cd kafka2.1.1.18/
[root@ip-186-31-6-148 kafka2.1.1.18]# ll
total 66536
-rw-r--r-- 1 rootroot 68116503 Mar 27 17:39 KAFKA-2.1.1-1.2.1.1.p0.18-el6.parcel
-rw-r--r-- 1 rootroot       41 Mar 27 17:39KAFKA-2.1.1-1.2.1.1.p0.18-el6.parcel.sha1
-rw-r--r-- 1 rootroot     5252 Mar 27 17:40 manifest.json
[root@ip-186-31-6-148 kafka2.1.1.18]# 
  • Kafka服务安装
    • CM配置Kafka的Parcel包地址并保存
    • Kafka选择一组依赖关系
    • 选择Kafka Broker和Gateway
    • 根据集群环境修改Kafka配置
    • 修改Kafka Broker的heap大小,默认为50M,可能会导致Kafka启动失败

Kudu验证

  • 建表:
CREATE TABLE my_first_table(
    id BIGINT,
    name STRING,
    PRIMARY KEY(id)
)
PARTITION BY HASH PARTITIONS 16
STORED AS KUDU;
  • 通过Impala-shell创建Kudu表
[impala@ip-186-31-6-148root]$ impala-shell -iip-186-31-10-118.fayson.com
...
[ip-186-31-10-118.fayson.com:21000] > show tables;
Query: show tables
+------------+
| name       |
+------------+
| test       |
| test_table |
+------------+
Fetched 2 row(s) in 0.06s
[ip-186-31-10-118.fayson.com:21000] > CREATE TABLEmy_first_table(
                                    >     id BIGINT,
                                    >     name STRING,
                                    >    PRIMARY KEY(id)
                                    > )
                                    >PARTITION BY HASH PARTITIONS 16
                                    > STORED AS KUDU;
Query: create TABLE my_first_table(
    id BIGINT,
    name STRING,
    PRIMARY KEY(id)
)
PARTITION BY HASH PARTITIONS 16
STORED AS KUDU

Fetched 0 row(s) in 2.43s
[ip-186-31-10-118.fayson.com:21000] >
  • 插入数据并查询
    • 通过Kudu Master Web UI查看
[ip-186-31-10-118.fayson.com:21000]> insert into my_first_table values(1,'fayson');
Query: insert into my_first_table values(1,'fayson')
...
Modified 1 row(s), 0 row error(s) in 3.92s
[ip-186-31-10-118.fayson.com:21000] >select * from my_first_table;
...
+----+--------+
| id | name   |
+----+--------+
| 1  | fayson |
+----+--------+
Fetched 1 row(s) in 1.02s
[ip-186-31-10-118.fayson.com:21000] > 

验证Spark2

[root@ip-186-31-6-148~]# spark2-shell
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). ForSparkR, use setLogLevel(newLevel).
17/09/11 09:46:22 WARN spark.SparkContext: Support for Java 7 is deprecated as of Spark 2.0.0
Spark context Web UI available at http://186.31.6.148:4040
Spark context available as 'sc' (master = yarn, app id =application_1505121236974_0001).
Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__ ___ _____/ /__
    _\ \/ _ \/ _ `/__/  '_/
   /___/ .__/\_,_/_//_/\_\   version 2.1.0.cloudera1
      /_/
        
Using Scala version 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.7.0_67)
Type in expressions tohave them evaluated.
Type :help for more information.

scala> var textFile=sc.textFile("/fayson/test/a.txt")
textFile: org.apache.spark.rdd.RDD[String] =/fayson/test/a.txt MapPartitionsRDD[1] at textFile at <console>:24

scala> textFile.count()
res0: Long = 3

scala> 

验证Kafka

  • 创建一个test的topic
[root@ip-186-31-6-148hive]# kafka-topics --create--zookeeper ip-186-31-6-148.fayson.com:2181 --replication-factor 3 --partitions1 --topic test
  • 向topic发送消息
[root@ip-186-31-6-148hive]# kafka-console-producer--broker-list ip-186-31-10-118.fayson.com:9092 --topic test
  • 消费topic的消息
[root@ip-186-31-6-148hive]# kafka-console-consumer --zookeeperip-186-31-6-148.fayson.com:2181 --topic test --from-beginning
  • 查看topic描述信息
[root@ip-186-31-6-148hive]# kafka-topics --describe--zookeeper ip-186-31-6-148.fayson.com:2181 --topic test

大数据视频推荐:
腾讯课堂
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容