Hadoop实战:1、Hadoop基础与源码编译

Hadoop基础 

  大数据概述

可以用“5V + 1C”来概括:

    Variety (多样化)   Volume (海量)  Velocity (快速)  Vitality (灵活)

    Value (价值性)    Complexity (复杂)


Hadoop与Hadoop生态圈

Hadoop

狭义: 软件(HDFS、MapReduce、Yarn)

广义: 以hadoop为主的生态圈


Hadoop1.x

hdfs: 分布式文件管理系统                    存储

mapreduce1: 执行引擎                  计算+资源、作业调度

Hadoop2.x三大组件

hdfs: 分布式文件管理系统            存储

mapreduce2: 执行引擎                  计算

yarn: 资源(memory cpu)和作业调度平台    资源

Hadoop编译

[root@hadoop-01 ~]# cd /opt/

[root@hadoop-01 opt]# mkdir sourcecode software

[root@hadoop-01 opt]# cd sourcecode

[root@hadoop-01 sourcecode]# pwd

/opt/sourcecode

hadoop源代码下载

# 将hadoop-2.8.1-src.tar.gz下载(或者用rz上传)到sourcecode目录

[root@hadoop-01 sourcecode]# ll

total 33756   

-rw-r--r--. 1 root root 34523353 Aug 20 12:14 hadoop-2.8.1-src.tar.gz


# 解压

[root@hadoop-01 sourcecode]# tar -xzvf hadoop-2.8.1-src.tar.gz

[root@hadoop-01 sourcecode]# ll

total 33760

  drwxr-xr-x. 17 root root    4096 Jun  2 14:13 hadoop-2.8.1-src

-rw-r--r--.  1 root root 34523353 Aug 20 1c'd2:14 hadoop-2.8.1-src.tar.gz

[root@hadoop-01 sourcecode]# cd hadoop-2.8.1-src

JAVA安装

[root@hadoop-01 ~]# mkdir -p /usr/java

[root@hadoop-01 ~]# cd /usr/java

[root@hadoop-01 java]# rz #上传jdk-8u45-linux-x64.gz

[root@hadoop-01 java]# tar -xzvf jdk-8u45-linux-x64.gz


# 修改用户和用户组

[root@hadoop-01 java]# chown -R root:root jdk1.8.0_45


# 设置环境变量

[root@hadoop-01 java]# vi /etc/profile

# 在最底下加入

export JAVA_HOME=/usr/java/jdk1.8.0_45

export PATH=$JAVA_HOME/bin:$PATH

# 生效

[root@hadoop-01 java]# source /etc/profile


Maven安装

[root@hadoop-01 ~]# cd /opt/software/

[root@hadoop-01 software]# rz  #上传apache-maven-3.3.9-bin.zip

[root@hadoop-01 software]# ll

total 8432

-rw-r--r--. 1 root root 8617253 Aug 20 12:35 apache-maven-3.3.9-bin.zip

# 解压

[root@hadoop-01 software]# unzip apache-maven-3.3.9-bin.zip

# 设置环境变量

[root@hadoop-01 software]# vi /etc/profile

export MAVEN_HOME=/opt/software/apache-maven-3.3.9

export MAVEN_OPTS="-Xms256m -Xmx512m"

export PATH=$MAVEN_HOME/bin:$JAVA_HOME/bin:$PATH

# 生效

[root@hadoop-01 software]# source /etc/profile

# 查看

[root@hadoop-01 software]# mvn -version

Apache Maven 3.3.9 (bb52d8502b132ec0a5a3f4c09453c07478323dc5; 2015-11-11T00:41:47+08:00)

Maven home: /opt/software/apache-maven-3.3.9

Java version: 1.8.0_45, vendor: Oracle Corporation

Java home: /usr/java/jdk1.8.0_45/jre

Default locale: en_US, platform encoding: UTF-8

OS name: "linux", version: "2.6.32-431.el6.x86_64", arch: "amd64", family: "unix"


Findbugs安装

[root@hadoop-01 ~]# cd /opt/software/

[root@hadoop-01 software]# rz #上传findbugs-1.3.9.zip

# 解压

[root@hadoop-01 software]# unzip findbugs-1.3.9.zip

# 设置环境变量

[root@hadoop-01 software]# vi /etc/profile

export FINDBUGS_HOME=/opt/software/findbugs-1.3.9

export PATH=$FINDBUGS_HOME/bin:$MAVEN_HOME/bin:$JAVA_HOME/bin:$PATH

# 生效

[root@hadoop-01 software]# source /etc/profile

# 查看

[root@hadoop-01 software]# findbugs -version

1.3.9


protobuf安装

[root@hadoop-01 ~]# cd /opt/software/

[root@hadoop-01 software]# rz #上传protobuf-2.5.0.tar.gz

# 解压

[root@hadoop-01 software]# tar -xzvf protobuf-2.5.0.tar.gz

[root@hadoop-01 software]# cd protobuf-2.5.0

[root@hadoop-01 protobuf-2.5.0]# yum install -y gcc gcc-c++ make cmake

[root@hadoop-01 protobuf-2.5.0]# ./configure --prefix=/usr/local/protobuf

[root@hadoop-01 protobuf-2.5.0]# make && make install

# 设置环境变量

[root@hadoop-01 java]# vi /etc/profile

export PROTOC_HOME=/usr/local/protobuf

export PATH=$PROTOC_HOME/bin:$FINDBUGS_HOME/bin:$MAVEN_HOME/bin:$JAVA_HOME/bin:$PATH

# 生效

[root@hadoop-01 protobuf-2.5.0]# source /etc/profile

# 查看

[root@hadoop-01 protobuf-2.5.0]# protoc --version

libprotoc 2.5.0


其他依赖

yum install -y openssl openssl-devel svn ncurses-devel zlib-devel libtool

yum install -y snappy snappy-devel bzip2 bzip2-devel lzo lzo-devel lzop autoconf automake


编译

[root@hadoop-01 sourcecode]# cd hadoop-2.8.1-src

[root@hadoop-01 hadoop-2.8.1-src]# mvn clean package -Pdist,native -DskipTests -Dtar


注意:

download需要3.5h

不想download就使用.m2.tar.gz -->解压-->root家目录

编译好的tar包路径

/opt/sourcecode/hadoop-2.8.1-src/hadoop-dist/target/hadoop-2.8.1.tar.gz

[root@hadoop000 target]# pwd /opt/sourcecode/hadoop-2.8.1-src/hadoop-dist/target [root@hadoop000 target]# ls

antrun hadoop-dist-2.8.1-sources.jar classes hadoop-dist-2.8.1-test-sources.jar dist-layout-stitching.sh javadoc-bundle-options dist-tar-stitching.sh maven-archiver hadoop-2.8.1 maven-shared-archive-resources hadoop-2.8.1.tar.gz test-classes hadoop-dist-2.8.1.jar test-dir hadoop-dist-2.8.1-javadoc.jar



配置本地Maven仓库

window/linux:

cd /opt/software/apache-maven-3.3.9/conf

1.vi setting.xml   

D:\software\apache-maven-3.3.9\repository

2.创建D:\software\apache-maven-3.3.9\repository

提醒

1、有时候编译过程中会出现下载某个包的时间太久,这是由于连接网站的过程中会出现假死,

此时按ctrl+c,重新运行编译命令。

2、如果出现缺少了某个文件的情况,则要先清理maven(使用命令 mvn clean) 再重新编译。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容

  • 一、大数据的定义 大数据=5V+1C 5V:variety(多样化),volume(海量),velocity(...
    怀夕阅读 165评论 0 1
  • Hadoop概要 到底是业务推动了技术的发展,还是技术推动了业务的发展,这个话题放在什么时候都会惹来一些争议。 随...
    overad阅读 157评论 0 2
  • 这几年,大数据非常火,作为一个IT从业者,如果所属公司没有涉足大数据,并且自己再不主动了解一下大数据,出去都不好意...
    慕容老K阅读 4,578评论 1 3
  • 清晨,朦胧。曙光,咫尺。快说再见了,时间,不紧不慢。需要做的事还有很多,一切要有条不紊地进行下去。昨天,一切顺利,...
    漫漫无忧阅读 183评论 8 5
  • 水晶月 雪竹 捧一只水晶盒, 收今夜的月光住进。 藏着,藏着…… 故乡的月色, 月下的思念, 等你, 等你...
    xuezhu766阅读 397评论 2 2