Yarn介绍(设计理念与基本架构)

Yarn : 新的计算框架,是一个全局资源管理器,负责整个集群的资源管理和分配

一. Yarn产生背景

    Hadoop1.0MR有局限性,概括为以下几个方面 : 

        扩展性差

        可靠性差

        资源利用率低

        无法支持多种计算框架

    为克服Hadoop1.0中MR存在各种问题而提出了Yarn,它将JobTracker中的资源管理和作业控制功能分开,分别由组件ResourceManager和ApplicationMaster实现,其中,ResourceManager负责所有应用程序的资源分配,而ApplicationMaster仅负责管理一个应用程序,进而诞生了全新的通用资源管理框架 - Yarn

二. Yarn基本架构

   基本架构

    Yarn是资源管理系统,它的基本设计思想是将Hadoop1.0MR中的JobTracker拆分成两个独立的服务 : 一个全局资源管理器ResourceManager和每个应用程序特有的ApplicationMaster

    Yarn总体上仍然是Master/Slave结构,在整个资源管理框架中,ResourceManager为Master,NodeManager为Slave,ResourceManager负责对各个NodeManager上的资源进行统一管理和调度.当用户提交一个应用程序时,需要提供一个用以跟踪和管理这个程序的ApplicationMaster,它负责向ResourceManager申请资源,并要求NodeManager启动可以占用一定资源的任务


    Apache Yarn的基本架构

   组件构成

    1)调度器:

    它仅仅是一个单纯的“调度器”,不参与 集群的其他任何操作,负责给各个应用程序的资源进行分配,基本分配单位是一个资源抽象概念“Container”,Container封装了内存和CPU。

    2)应用程序管理器(ApplicationMaster)(AM)

    应用程序管理器负责整个系统中的所有应用程序,包括:应用程序的提交、与调度器协商资源已启动ApplicationMaster进程,监控ApplicationMaster运行状态并在失败时重新启动它等

    3)Container

    Container是YARN的资源抽象,Container封装了某个节点内存和CPU,当AM向RM申请资源时,RM为AM 返回的资源用Container表示。负责对各个应用程序的资源进行分配

    4)NodeManager(NM)

    是每一个节点的资源和任务管理器,1会定时向RM汇报它所在节点的资源使用情况和Container的运行状态;2可以处理来自AM发送的Container的启动/停止等等命令

    5)ResourceManager(RM)

    全局资源管理器,负责整个集群集群的资源管理与分配, RM作为整个集群的资源管理与分配的角色,如果出现单点故障(单个节点宕掉),Hadoop2.4.0版本之前,无法在进行资源管理与分配,Hadoop2.4.0版本出现之后有了HA(高可用),可以增加RM的可用性(出现单点故障不影响RM运行)

通信协议

    Yarn的通信协议 - RPC协议,RPC协议是连接各个组件的,在Yarn中,任何两个需相互通信的组件之间仅有一个RPC协议,而对于任何一个RPC协议,通信双方有一端是Client,有一端为Server,且Client总是主动连接Server的,因此,Yarn实际上采用的拉式(pull-based)通信模型


Yarn的RPC协议

   Yarn主要由以下几个RPC协议组成 :

        JobClient ---> RM(ApplicationClientProtocol) : JobClient通过该RPC协议提交应用程序,查询应用程序状态等

        Admin ---> RM(ResourceManagerAdministrationProtocol) : Admin通过该协议更新系统配置文件,比如节点黑白名单,用户队列权限等

        AM ---> RM(ApplicationMasterProtocol) : AM通过该RPC协议向RM注册和撤销自己,并为各个任务申请资源

        AM ---> NM(ContainerManagementProtocol) : AM通过该RPC要求NM启动或者停止Container,获取各个Container的使用状态等信息

        NM ---> RM(ResourceTracker) : NM通过该RPC协议向RM注册,并定时发送心跳信息会报当前节点的资源使用情况和Container运行情况

    任务执行流程

    1    用户向YARN中提交应用程序,其中包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等

    2    ResourceManager为该应用程序分配第一个Container(这里可以理解为一种资源比如内存),并与对应的Node-Manager通信,要求它在这个Container中启动应用程序的ApplicationMaster。

    3    ApplicationMaster首先向ResourceManager注册,这样用户可以直接通过ResourceManage查看应用程序的运行状态,然后它将为各个任务申请资源,并监控它的运行状态,直到运行结束,即重复步骤4~7。

    4    ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源。

    5    一旦ApplicationMaster申请到资源后,便与对应的NodeManager通信,要求它启动任务。

    6    NodeManager为任务设置好运行环境(包括环境变量、JAR包、二进制程序等)后,将任务启动命令写到一个脚本中,并通过运行该脚本启动任务。

    7    各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度,以让ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务。在应用程序运行过程中,用户可随时通过RPC向ApplicationMaster查询应用程序的当前运行状态。

    8    应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己

    三. 多角度理解Yarn

    并行编程

       单机程序设计,为了快速处理一个大的数据集,通常采用多线程并行编程,有操作系统启动主线程,由它切分数据,任务分配,子线程启动和销毁等工作,而各个子线程只负责计算自己的数据,当所有子线程处理完数据后,主线程退出

        类比,Yarn上的应用程序运行过程与之相近,只不过他是集群上的分布式并行编程.Yarn为应用程序启动AppMaster(相当主线程),然后由AppMaster负责数据切分,任务分配,启动和监控等工作,而AppMaster启动的每个Task(相当于子线程)仅负责自己的计算任务.当计算完成,AppMaster认为运行完成,退出

   资源管理

   资源管理系统的主要功能是对集群中各类资源进行抽象,并根据各种应用程序或者服务的要求,按照一定的调度策略,将资源分配给他们使用,同时需采用一定的资源隔离机制防止应用程序或者服务之间因资源抢占而相互干扰

   云计算

   普遍认为,云计算包括以下几个层次的服务 : 

        IaaS : 基础设施即服务

        PaaS : 平台即服务

        SaaS : 软件即服务

    从云计算分层概念上讲,Yarn可看做PaaS层,它能为不用类型的应用程序提供统一的管理和调度

    我每天会写文章记录大数据技术从入门到精通,可以关注我的公众号"SmallBird技术分享",我们一起学习分享,并且回复'分享'会有大数据资源惊喜等着你~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343

推荐阅读更多精彩内容