最靠谱的CDH5安装指南

系统要求
系统:CentOS 6.5
Cloudera:CM5.2.0 + CDH 5.2.0
内存:主节点4G内存以上,其他节点需要2G以上内存

Hadoop版本选择

目前Hadoop比较流行的主要有2个版本,Apache和Cloudera版本。
Apache Hadoop:维护人员比较多,更新频率比较快,但是稳定性比较差。
Cloudera Hadoop(CDH):CDH:Cloudera公司的发行版本,基于ApacheHadoop的二次开发,优化了组件兼容和交互接口、简化安装配置、增加Cloudera兼容特性。

准备工作

以下步骤要在所有节点上执行

  • 修改hostname
vi /etc/sysconfig/network
  • 关闭SELinux

查看SELinux状态

getenforce

若SELinux没有关闭,按照下述方式关闭

vi /etc/selinux/config

修改SELinux=disabled。重启生效,可以等后面都设置完了重启主机

# This file controls the state of SELinux on the system.
# SELINUX= can take one of these three values:
#       enforcing - SELinux security policy is enforced.
#       permissive - SELinux prints warnings instead of enforcing.
#       disabled - SELinux is fully disabled.
SELINUX=disabled
# SELINUXTYPE= type of policy in use. Possible values are:
#       targeted - Only targeted network daemons are protected.
#       strict - Full SELinux protection.
SELINUXTYPE=targeted
  • 关闭防火墙
sudo service iptables stop
sudo chkconfig iptables off
sudo chkconfig iptables --list
  • 网络配置
vim /etc/sysconfig/network-scripts/ifcfg-eth0

设置静态ip,以及指定ip地址

DEVICE="eth0"
BOOTPROTO="static"
IPADDR=192.168.1.110
NM_CONTROLLED="yes"
ONBOOT="yes"
TYPE="Ethernet"
DNS1=8.8.8.8
DNS2=8.8.4.4
GATEWAY=192.168.1.1
  • 修改hosts文件

把所有要添加到集群中的主机都要加入hosts中,格式如下:

127.0.0.1       localhost

# CDH Cluster
192.168.1.110   master
192.168.1.111   slave1
192.168.1.112   slave2

以上步骤执行完毕后,重启主机

reboot

重启后再次检查下以上几点,确保环境配置正确。

提前下载(本教程中,CM和CDH版本均为5.2.0)

    [cloudera-manager]
    # Packages for Cloudera Manager, Version 5, on RedHat or CentOS 6 x86_64                  
    name=Cloudera Manager
    baseurl=https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.2.0/
    gpgkey =https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera    
    gpgcheck = 1

这里注意下,将.sha1文件后缀更改为.sha,同时把内容只保留hash码部分。(5.2.0版本sha文件内容本身就只包含hash码,不需要修改,其他版本请自行查看!)

Cloudera Manager安装

以下步骤要在所有节点上执行:

  • 将cloudera-manager.repo文件拷贝到所有节点的/etc/yum.repos.d/文件夹下
  • 验证repo文件是否起效
    yum list|grep cloudera
    如果列出的不是你安装的版本,执行下面命令重试
    yum clean all
    yum list | grep cloudera
  • 将之前下载的rpms文件拷贝到所有节点下(任意目录)
    切换到rpms目录下,执行
    yum -y install *.rpm
  • 将之前下载的Parcel那3个文件拷贝到/opt/cloudera/parcel-repo目录下(如果没有该目录,请自行创建)
    至此,/opt/cloudera/parcel-repo下面有三个文件: CDH-5.2.0-1.cdh5.2.0.p0.36-el6.parcel
    mainfest.json
    CDH-5.2.0-1.cdh5.2.0.p0.36-el6.parcel.sha

以下步骤请只在主节点上执行:

  • 将下载好的bin文件拷贝到主节点任意目录下
  • 进入该目录,给bin文件赋予可执行权限
    sudo chmod +x ./cloudera-manager-installer.bin
  • 安装CM
    ./cloudera-manager-installer.bin
    接下来全部next和yes就行了,因为所需要的rpm包已经提前下载下来了,这个过程会进行的非常快。
CM安装成功

CDH集群安装

  • CM安装成功后浏览器输入http://ip:7180,ip是CM安装的主机ip或者主机名。显示如下界面,用户名和密码都输入admin,进入web管理界面。
CM Web管理界面

如果打不开改网页,请耐心等待会。这个服务启动是需要一定时间的。

  • 选择部署的版本,这里我们选择免费版的就可以了。
CM-选择版本
  • 点击继续
CM-介绍
  • 选择添加的主机。输入主机ip或者主机名,点击搜索。
CM-选择主机

这里如果选择一系列主机可以输入如下的内容:

192.168.1.[101-105]
slave[1-3].com.cn

勾选要添加的主机,继续下一步操作。

  • 选择存储库

这里我们采用Parcel离线安装的方式,安装简便、完全离线而且更便于集群的管理。

CM-选择存储库

选择我们之前上传到服务器的CDH5.2.0版本,其他全选无,下一步。

  • JDK安装选项
    这里之前已经安装过了,所以不需要勾选,直接继续。


    CM-JDK安装
  • 提供SSH登陆凭据
    由于CDH会自动管理所有主机间的SSH通讯,所以我们之前并没有手动配置各个节点间的SSH免密登录。在这里统一设置就行了,设置好密码点继续。

CM-SSH管理
  • 集群安装
    因为这里所需要的软件包我们之前都已经安装过了,这一步会很快结束。
CM-集群安装
安装完成
  • 安装Parcel到所有主机上
    因为Parcel文件已经提前下载好了,第一个进度条会直接显示已下载,然后开始分配。这个过程实际上就是将Parcel内的软件解压缩安装到各个主机上的过程。耐心等待,时间会比较长,我安装2台主机大概是需要20分钟时间。
CM-安装Parcel

安装完毕后点继续

Parcel安装完毕
  • 主机检查
    检查就可以了,建议不要跳过。检查结果如下:
主机检查

下面这2个都是误报,不需要理会。


主机检查2
  • 安装服务
    CDH5提供了你可能需要的各种服务,需要什么启动什么就行了。这里我选择了自定义,添加HBase,HDFS,MapReduce和ZooKeeper,这里大家按照自己的需求选。
CM-添加服务
  • 角色分配
    分配各个节点的角色
CM-角色分配
  • 数据库设置
    CDH默认内嵌了一个数据库,如果你需要MySQL或者Oracle请选择使用自定义数据库,点击测试连接,成功后点继续。
CM-数据库设置
  • 审核更改
    这里全部默认就可以了,直接继续。
CM-审核更改
  • 安装完成,初始化
    到这里集群已经安装部署完成了,CDH会自动对你选择的服务进行初始化设置,你也可以稍后自行开启。
CM-初始化

初始化完成后,将进入主页面

CM-主页

因为我们只安装了2台主机,而HDFS和ZooKeeper建议至少3个节点,所以页面上有一些警告,这些都不影响。到此,CDH集群部署完成。

问题汇总

1、安装过程中遇到以下提示

Detecting Cloudera Manager Server...
    Detecting Cloudera Manager Server...
    BEGIN host -t PTR 192.168.1.198
    198.1.168.192.in-addr.arpa domain name pointer localhost.
    END (0)
    using localhost as scm server hostname
    BEGIN which python
    /usr/bin/python
    END (0)
    BEGIN python -c 'import socket; import sys; s = socket.socket(socket.AF_INET); s.settimeout(5.0); s.connect((sys.argv[1], int(sys.argv[2]))); s.close();' localhost 7182
    Traceback (most recent call last):
    File "<string>", line 1, in <module>
    File "<string>", line 1, in connect
    socket.error: [Errno 111] Connection refused
    END (1)
    could not contact scm server at localhost:7182, giving up
    waiting for rollback request

在失败的主机上,终端执行

mv /usr/bin/host /usr/bin/host.bak

然后重试。

2、安装过程一直卡在"正在获取安装锁"
在卡住的主机上,删除/tmp文件夹中的所有scm_prepare_node.开头的文件,清空yum缓存,然后重启主机。

cd /tmp 
rm -rf  scm_prepare_node.*
yum clean all
reboot

3、安装完毕后NameNode格式化失败,报一下错误

IncorrectVersionException: Unexpected version of storage directory /data/dfs

删除NameNode节点的/data/dfs文件夹,重新添加主机。

4、如何更改节点ip
重新设置每台主机的hosts文件,完成后进入主机界面,点击重新运行升级向导,再走一遍之前的流程即可。

更改ip
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容

  • 引用:http://www.jianshu.com/p/57179e03795f 系统要求 系统:CentOS 6...
    纤尘22阅读 1,009评论 0 2
  • 简述 hadoop 体系衍生了许多商业发行版,其中国内最常用的是 CDH。CDH是在原生 apache hadoo...
    mtide阅读 6,677评论 1 13
  • 前言:比较懒,回头再分开章节,如果需要,ctrl+F 搜索吧 第二章:系统配置-java-mysql-rundec...
    k大数据阅读 1,749评论 0 1
  • 1.命令格式: kill[参数][进程号] 2.命令功能: 发送指定的信号到相应进程。不指定型号将发送SIGTER...
    金星show阅读 1,162评论 0 0
  • 今天跟朋友聊起了中學時期。 記得那時候的自己,超愛看書的。很迷戀四爺郭敬明,國民岳父韓寒,還有才女饒雪漫等等......
    EileenTse阅读 197评论 0 0