HDFS-分布式文件系统

前言

  • 在大数据场景中,大量数据是以文件形式储存的,典型的是行为日志数据(用户搜索日志,购买日志,点击日志,以及机器操作数据等)
  • 这些数据都很重要,则就必须满足可扩展,容错,易用等特点

背景

HDFS的出现主要解决一下问题:

  • 容错性
    数据越来越大,所以储存的服务器就会原来越多,这就要求当中一台服务器异常不影响数据
  • 统一格式储存
    数据的大小各不相同,这就要求数据的保存要从新定义,(block 块是一个很好的解决问题)
  • 一次写入多次读取
    有些数据(日志)只会写一次,多次读取

分布式系统的存储种类

  • 文件级别的分布式系统
    存储单位是文件
  • 块级别的分布式系统
    存储单位是将文件分为的等大小的块

HDFS的基本架构

hdfs 采用主从架构(master-slave)

NameNode(主节点)
  • hdfs的集群管理者,负责管理集群的元信息(维护整个文件的目录结构树和数据块信息)和管理datanode(通过心跳周期性的检测DataNode的存活状态

  • NameNode的相关问题
    1、单点故障:
    一个集群只有一个NameNode为之服务,称为“active NameNode”,为了避免单点故障,可备用一台备用机“standby NameNode”;
    2、主备切换:
    手动模式:通过命令
    自动模式:借助zookeeper
    3、状态同步:
    借助第三方日志储存系统,activeNameNode将操作日志写入共享系统,standby NameNode从共享系统中读取出来

  • 拓展
    当数据越来越大时,单个nameNode会成为数据传输的瓶颈,这是就需要对NameNode进行分片,也就是可以允许多个NameNode 对集群进行服务(当然,也得考虑单点故障)

SecondNameNode(检查点节点)
  • 首先,它定时到NameNode去获取edit logs,并更新到fsimage上。
  • 一旦它有了新的fsimage文件,它将其拷贝回NameNode中。
  • NameNode在下次重启时会使用这个新的fsimage文件,从而减少重启的时间。
DataNode(从节点)
  • 储存实际的数据块,通过心跳即时汇报自己的状态信息
Client(客户端)
  • 用户借助client来与nameNode 和 dataNode 进行交互,完成各种操作
  • client 完成数据的分块
  • client 向dataNode传输数据是流水线操作

Hdfs的容错

  • NameNode 异常
    前面已经提到了nameNode 可设置主从配置
  • DataNode 服务器异常
    Hdfs的数据默认是3副本,当发现有数据异常,nameNode 可从新分配
  • 数据块损坏
    NataNode在存储数据的时候,会相应的生成一段随机数,当读取的时候发现随机数不一致,就认为数据失效了

HDFS的副本放置策略

  • 客户端与Datanode 同节点(第一个副本写在同节点的datanode上,另外两个副本写在另一个相同机架的不同dataNode上)
  • 客户端与NameNode 与dataNode 不同节点,(第一个副本会随机写在一个nataNode上,另外两个写在另一个相同机架的不同节点上)

HDFS的异构存储介质

  • hdfs 可支持多种储存介质(固态硬盘,内存等)

集中式缓存管理

HDFS可通过命令或者api来管理集中式缓存系统中的文件和目录,来提高效率

访问方式

  • shell
  • api
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容