学习笔记总体目录

目录

一、基础环境准备

二、总体步骤

三、安装VMware Workstation.6

四、新建三台虚拟机并安装CentOS 6.4(64位)系统

五、安装jdk,完成Java环境变量配置

       1、添加普通用户到sudo权限

       2、在各节点的/etc/hosts文件中加入集群节点和IP地址的对应关系

       3、检查系统位数,准备相应的jdk版本

       4、安装配置jdk

六、配置SSH免密码登录配置...30

1、分别在三台机器上执行:ssh-keygen -t rsa.31

2、把master节点的公钥添加到authorized_keys中...31

3、把salve1和slave2节点的公钥拷贝到master节点...32

4、把含有所有节点公钥的authorized_keys文件分发给slave1和slave2.32

5、修改.ssh目录和authorized_keys文件的权限...32

6、测试免密码登录配置结果...33

七、安装配置hadoop.34

1、上传并解压hadoop的安装包...34

2、到Hadoop-2.4.1的解压目录的etc目录下的Hadoop目录下去修改配置文件...34

3、第一步:修改hadoop-env.sh加入jdk的环境变量...35

4、第二步:修改core-site.xml.35

5、第三步,配置hdfs-site.xml.36

6、第四步,mapred-site.xml.38

7、第五步,配置yarn框架...38

8、第六步,修改yarn-env.sh,添加jdk支持...40

9、修改masters和slaves文件...40

10、把以上主节点上配置好的文件发送给两个子节点...40

11、启动前的准备工作(防火墙)...40

12、启动Hadoop,启动之前先初始化HDFS文件系统...41

13、正式启动...42

八、hadoop集群测试...44

1、HDFS测试...44

2、测试mapreduce.46

3、测试Wordcount实例...48

九、安装配置spark集群...52

1、去官网下载相应的安装文件...52

2、首先安装Scala.52

3、解压...52

4、配置Scala的环境变量...53

5、安装配置spark环境...54

6、配置spark.54

7、验证启动spark集群...56

8、分别关闭集群即可...57

附录:hadoop搭建常见问题解决办法...59

一、解决hadoop启动本地库报错...59

hadoop学习笔记-weekend110-2.63

1、NameNode元数据管理机制...63

2、NN的工作机制...67

3、DN的工作机制...68

4、HDFS的JAVA客户端编写...69

4.1准备工作...69

4.2在Linux环境下编写代码...73

4.3 Windows环境增、删、改、查等操作代码...76

4.3.1准备工作...76

4.3.2上传文件upload()...76

4.3.3上传文件upload2()...80

4.3.4下载文件download().83

4.3.5创建目录mkdirs().85

4.3.6删除操作delete().87

4.3.7查看信息listFiles()和listStatus().89

5、FileSystem设计思想总结...97

6、hadoop中的RPC框架实现机制...98

7、hadoop中的RPC应用实例demo.100

hadoop学习笔记-weekend110-3.102

1、mapreduce介绍及wordcount.102

2、YARN框架的技术机制...107

hadoop学习笔记-weekend110-4.109

1、hadoop中的序列化机制...109

2、hadoop的自定义排序实现...116

3、mapreduce中自定义分组的实现...121

4、shuffle机制(map-reduce之间框架原理)...125

5、MR程序的组件全貌...127

6、TextInputFormat对切片划分的源码分析...128

hadoop学习笔记-weekend110-5.135

1、安装配置zookeeper.135

2、zookeeper管理数据的方法...140

3、NN高可用方案的要点...142

4、配置hadoop-HA.143

4.1 hadoop-HA集群配置准备工作...143

4.2安装步骤...144

5、启动hadoop-HA.154

5.1启动zookeeper集群...154

5.2启动journalnode.154

5.3格式化HDFS文件系统...155

5.4格式化zkfc.156

5.5启动HDFS.157

5.6启动yarn框架...158

6、HDFS-HA测试...161

7、HDFS-动态增加节点和副本数量管理...163

8、HA的JAVA-API访问要点...172

附件:sftp常用命令用法...173

hadoop学习笔记-weekend110-6.177

1、hive安装及配置...177

2、hive的使用...183

3、hive的常用语法...189

4、hql语法及自定义函数...197

附录:yum-安装MySQL.205

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容

  • 当数据量增大到超出了单个物理计算机存储容量时,有必要把它分开存储在多个不同的计算机中。那些管理存储在多个网络互连的...
    单行线的旋律阅读 1,907评论 0 7
  • 版权声明:本文为博主原创文章,未经博主允许不得转载。 目录-[-]1 先决条件2 实验环境搭建 21 准备工...
    三三At你阅读 825评论 0 3
  • 首先,我们在使用前先看看HDFS是什麽?这将有助于我们是以后的运维使用和故障排除思路的获得。 HDFS采用mast...
    W_Bousquet阅读 4,174评论 0 2
  • Spark学习笔记 Data Source->Kafka->Spark Streaming->Parquet->S...
    哎哟喂喽阅读 6,606评论 0 51
  • 番茄工作法 努力工作却感觉工作越做越多?工作中常常被人打断,无法集中?和我一样有严重的拖延症?经常加班,没时间陪家...
    xinxinshen阅读 189评论 0 0