1、Hadoop2新增了YARN,YARN的引入主要有两个方面的变更:
其一、HDFS的NameNode可以以集群的方式部署,增强了NameNode的水平扩展能力和高可靠性,水平扩展能力对应HDFS Federation,高可靠性对应HA。
其二、MapReduce将Hadoop1时代的JobTracker中的资源管理及任务生命周期管理拆分成两个独立的组件,资源管理对应ResourceManager,任务生命周期管理对应ApplicationMaster。
2、YARN on HDFS
HDFS的典型结构与HDFS二次结构对比