9、DateNode

DateNode工作机制

datenode工作机制.png
  1. 一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。
  2. DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。
  3. 心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机器,或删除某个数据块。如果超过10分钟没有收到某个DataNode的心跳,则认为该节点不可用。
  4. 集群运行中可以安全加入和退出一些机器。

数据完整性

为了保证数据的完整性,一般采用数据校验技术:

  1. 奇偶校验技术
  2. md5,sha1等校验技术
  3. CRC-32循环冗余校验技术
  4. ECC内存纠错校验技术

HDFS数据完整性

  1. HDFS以透明方式校验所有写入的数据,可以通过io.bytes.per.checksum属性设置,字节数默认是512 字节,创建一个单独的校验和,如果节点检测数据错误,就会报CheckSumException异常。
  2. 除了在读取数据时进行验证,数据节点也会在后台运行一个线程
    DataBlockscanner(数据块检测程序)周期性的验证存储在数据节点上的所有块。
  3. 一旦检测到corruptblock,在heartbeat阶段,DN会收到NN发来的Block Command,从其他数据块中拷贝一份新的replica(备份块)。

掉线时限参数设置

DataNode进程死亡或者网络故障造成DataNode无法与NameNode通信,NameNode不会立即把该节点判定为死亡,要经过一段时间,这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。如果定义超时时间为timeout,则超时时长的计算公式为:
timeout = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval。
而默认的dfs.namenode.heartbeat.recheck-interval 大小为5分钟,dfs.heartbeat.interval默认为3秒。
需要注意的是hdfs-site.xml 配置文件中的dfs.namenode.heartbeat.recheck-interval的单位为毫秒,dfs.heartbeat.interval的单位为秒。
在hdfs-default.xml描述如下

<property>
  <name>dfs.namenode.heartbeat.recheck-interval</name>
  <value>300000</value>
  <description>
    This time decides the interval to check for expired datanodes.
    With this value and dfs.heartbeat.interval, the interval of
    deciding the datanode is stale or not is also calculated.
    The unit of this configuration is millisecond.
  </description>
</property>
<property>
  <name>dfs.heartbeat.interval</name>
  <value>3</value>
  <description>Determines datanode heartbeat interval in seconds.</description>
</property>

添加新数据节点

随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点。

环境准备

  1. 克隆一台虚拟机
  2. 修改ip地址和主机名称
  3. 修改xsync文件,增加新增节点的ssh无密登录配置
  4. 删除原来HDFS文件系统留存的文件(/opt/module/hadoop-2.8.3/data)
    如果只有一个集群,那么单独启动datanode就可以,如果有多个集群,需要做如下配置

配置

  1. 在namenode的/opt/module/hadoop-2.8.3/etc/hadoop目录下创建dfs.hosts文件白名单名字可以随便写,只要绝对路径指向正确既可以
    输入如下内容
hadoop-100
hadoop-101
hadoop-102
hadoop-103
  1. 在namenode的hdfs-site.xml配置文件中增加dfs.hosts属性
<property>
  <name>dfs.hosts</name>
  <value>/opt/module/hadoop-2.8.3/etc/hadoop/dfs.hosts</value>
</property>
  1. 刷新namenode
    hdfs dfsadmin -refreshNodes
  2. 更新resourcemanager节点
    yarn rmadmin -refreshNodes
  3. 在NameNode的slaves文件中增加新主机名称
    hadoop-100
    hadoop-101
    hadoop-102
    hadoop-103
  4. 单独命令启动新的数据节点和节点管理器
    hadoop-daemon.sh start namenode
    yarn-daemon.sh start nodemanager
  5. 在web浏览器上检查是否ok

数据不均匀

start-balancer.sh
可以用命令实现集群的再平衡

退役旧数据节点

  1. 在namenode的/opt/module/hadoop-2.8.3/etc/hadoop目录下创建dfs.hosts.exclude文件
    输入要退役的节点的主机名称
    如,本例要退役hadoop-103
  2. 在namenode的hdfs-site.xml配置文件中增加dfs.hosts.exclude属性
<property>
  <name>dfs.hosts.exclude</name>
  <value>/opt/module/hadoop-2.3.3/etc/hadoop/dfs.hosts.exclude</value>
</property>
  1. 刷新namenode、刷新resourcemanager
    hdfs dfsadmin -refreshNodes
    yarn rmadmin -refreshNodes
  2. 检查web浏览器,退役节点的状态为decommission in progress(退役中),说明数据节点正在复制块到其他节点


    退役中.png
  3. 等待退役节点状态为decommissioned(所有块已经复制完成),停止该节点及节点资源管理器。注意:如果副本数是3,服役的节点小于等于3,是不能退役成功的,需要修改副本数后才能退役


    退役完成.png
  4. 从dfs.hosts文件中删除退役节点,再运行刷新节点的命令
  5. 从namenode的slave文件中删除退役节点hadoop-103
  6. 从dfs.hosts.exclude删除hadoop-103
  7. 如果数据不均衡,可以用命令实现集群的再平衡
    start-balancer.sh
    可以用命令实现集群的再平衡

DateNode多目录配置

  1. datanode也可以配置成多个目录,每个目录存储的数据不一样
  2. 具体配置如下
    修改hdfs-site.xml
<property>
  <name>dfs.datanode.data.dir</name>
  <value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.tmp.dir}/dfs/data2</value>
</property>

注意,不用格式化namenode,在哪台节点上配置,哪台节点DataNode是多目录

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343

推荐阅读更多精彩内容

  • 首先,我们在使用前先看看HDFS是什麽?这将有助于我们是以后的运维使用和故障排除思路的获得。 HDFS采用mast...
    W_Bousquet阅读 4,170评论 0 2
  • 二 、 HDFS体系结构 HDFS 采用的是master/slave架构设计 , 一个HDFS集群包含一个单独的 ...
    什么都不会的码农丶阅读 1,523评论 0 1
  • 原文 介绍 Hadoop分布式文件系统( HDFS )是一种分布式文件系统,设计用于在商品硬件上运行。它与现有...
    公子小水阅读 1,114评论 0 0
  • 几十年华终逝去, 回首当年不可提。 弄潮儿向涛头立, 散尽荣华韵不离。
    水月痕阅读 223评论 0 1
  • 原著小说和电影改编同时存在的好处是画面上和意境上的互补。有的画面感觉写不出来得靠演,如表现眼神的时候,不想看华丽词...
    觉悟寺的树洞阅读 498评论 0 2