Cloudera Manager大数据管理平台介绍

简介

Cloudera企业解决方案包括Cloudera Hadoop发行版(Cloudera’s Distribution Including Apache Hadoop,简称CDH),Cloudera Manager(CM)等。概括起来说,Cloudera提供一个可伸缩,稳定的,综合的企业级大数据管理平台,它拥有最多的部署案例,提供强大的部署,管理和监控工具。Cloudera Manager提供Admin Console,这是基于Web的用户界面,使得企业数据管理更加容易方便。Coudera Manager易于升级和安装Hadoop组件,还提供了在几分钟之内建立集群主节点的高可用(High Availability)。它还包括Cloudera Manager API,可用来获取集群运行状态以及配置Coudera Manager。

CM技术架构
image.png

Agent:安装在每台主机上。该代理负责启动和停止的过程,拆包配置,触发装置和监控主机。
Management Service:由一组执行各种监控,警报和报告功能角色的服务。
Database:存储配置和监视信息。通常情况下,多个逻辑数据库在一个或多个数据库服务器上运行。例如,Cloudera的管理服务器和监控角色使用不同的逻辑数据库。
Cloudera Repository:软件由Cloudera 管理分布存储库。
Clients:是用于与服务器进行交互的接口:
Admin Console :基于Web的用户界面与管理员管理集群和Cloudera管理。
API :与开发人员创建自定义的Cloudera Manager应用程序的API。

Cloudera Manager有四大功能:

(1)管理:对集群进行管理,如添加、删除节点等操作。
(2)监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。
(3)诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。
(4)集成:对hadoop的多组件进行整合。
[图片上传中...(image.png-fc2836-1629087455733-0)]

Cloudera Manager概述

Cloudera Manager(简称CM)是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机,Hadoop,Hive,Spark等服务的安装和配置做了极大的简化。他是Hadoop集群的软件分发及管理平台,通过它可以快速部署好一个Hadoop集群,并对集群的节点及服务进行实时监控。详情参见:官方链接


image.png
Cloudera Manager功能概述

一.状态管理
  (1)Cloudera Manager Server 维护了集群的各种状态。状态可分为两类:模块和运行时,两者都存储于CMS的数据库中。
  (2)模块包含集群,主机,服务,角色,配置。运行时包含进程,命令。

二.配置管理(CM在多个层面定义了配置)
  (1)服务层面
      可定义整个服务实例层面的配置,如HDFS服务的默认副本因子,
  (2)角色组层面
      可定义某个角色组的配置,如DataNode的处理线程数量,可根据DataNodes的不同分组进行不同的配置。
  (3)角色层面
      可覆盖从角色层面继承的配置。这种配置需要谨慎使用,因为会造成角色组中的配置分歧。如因为拍错需求临时启用某个角色实例的DEBUG日志。
  (4)主机层面
      根据监控,软件管理,资源管理的不同有不同的配置。
  (5)CM自身也有很多与管理操作相关的配置。

三.进程管理
  (1)非CM管理的集群使用脚本进行角色进程的启动,但在CM管理的集群中这类脚本不起作用。
  (2)CM管理的集群中,只能使用CM进行角色进程的启停,CM使用开源的进程管理名为supervisord,其会启动进程,重定向日志,通知进程失败,为进程设置正确的用户ID等等。CM支持自动重启一个崩溃的进程。如果一个进程在启动会频繁崩溃,还会被大声非健康标记。
  (3)停止CMS和CM代理不会使正在运行的进程被中止。

四.软件包管理
  CM支持两种软件分发格式:packages和parcels。
  (1)package
      是一种二进制分发格式,包含编译的代码和元数据如包描述,版本,依赖项。包管理系统评估此元数据以允许包搜索,执行升级,确保包的所有依赖关系得到满足。CM使用本地操作系统支持的包管理程序。
  (2)parcel
      也是一种二进制分发格式,包含CM需要使用的附加元数据。其余package的却别有:可安装同一个parcel的多个版本,并激活其中一个;parcel可安装到任何路径;通过parcel安装,CM会自动下载并激活和每个节点操作系统版本匹配的parcel包,解决某些操作系统版本不一致问题。

五.主机管理
  (1)CM提供了多种功能以管理Hadoop集群的主机。第一次运行CM管理控制台时,可搜索主机并添加到集群,一旦选中了主机就可以为其分配CDH角色。CM会在主机上自动部署作为集群托管节点所有软件:JDK,CM agent,CDH,Impala,Solr等等。
  (2)服务部署并运行后,管理员控制台中的“Hosts”区域显示集群中托管主机的总体状态。提供的信息包括主机上的CDH版本,主机所属的集群,运行在主机上的角色的数量。Cloudera管理服务中的主机监控角色执行监控检查并收集主机的统计信息,以允许你监控主机的监控和性能。

六.资源管理
  CM允许使用两种资源管理方式:
  (1)静态资源池
      使用Linux cgroups在多个服务间静态进行资源隔离,如HBase,Impala,Yarn分别使用一定百分比的资源。静态资源池默认不启用。
  (2)动态资源池
      用于某些服务内部的资源管理,如Yarn的各种资源调度器,Impala也可对不同池中的查询动态分配资源。

七.用户管理
  (1)访问CM通过用户账户进行控制。用户账户标识如何对用户进行身份验证,并确定授予用户的权限。
  (2)CM提供了多种用户认证机制。可以配置CM使用CM数据库认证用户,或使用某种外部认证服务。外部认证服务可以是LADP服务器,或者指定的其他服务。CM还支持使用安全断言标记语言(SAML)来实现单点登录。

八.安全管理
  (1)认证:
      认证是指用户或服务证明其有访问某种系统资源的权限。Cloudera集群支持操作系统认证,LDAP,Kerberos等认证方式。LDAP和Kerberos并不是互斥的,很多时候可以一起使用。
  (2)授权:
      授权关注谁可以存取或控制指定的资源或服务。CDH目前支持以下几种权限控制:
        1>.传统的POSIX形式的目录和文件权限控制;
        2>.HDFS扩展的ACL细粒度权限控制;
        3>.HBase可对用户和组设置各种操作的ACL;
        4>.使用Apache Sentry进行基于角色的全下控制;
  (3)加密:
      集群不同层面存储和传输的数据支持不同的加密方式。

九.Cloudera管理服务
  Cloudera Management Service 实现了多种管理特性,包括活动监视,主机监控,服务监控,时间服务,告警发布,报表管理等。

Cloudera Manager基本核心功能

Cloudera Manager作为Hadoop大数据平台的管理工具,能够有效地帮助用户更容易地使用Hadoop。他的核心功能分为四大模块:管理功能,监控功能,诊断功能和集成功能。

一.Cloudera Manager提供的管理功能
  (1)批量自动化部署节点
      CM提供强大的Hadoop集群部署能力,能够批量的自动化部署节点。安装一个Hadoop集群只需添加安装的节点,安装需要的组件和服务角色这三步,大大缩短了Hadoop的安装时间,也简化来Hadoop的安装过程。
  (2)可视化的参数配置功能
      Hadoop包含许多组件,不同组件都包含各种各样的XML配置文件。CM提供界面GUI可视化参数配置功能。
  (3)智能参数验证以及优化
      当用户配置部分参数值有问题时,CM会给出智能错误提示,帮助用户更合理地修改配置参数。
  (4)高可用配置
      CM对关键的组件使用HA部署,如NameNode高可用可以通过CM的Web管理界面,根据向导启用HDFS HA。
  (5)权限管理
      提供不同级别的管理权限,比如只度用户访问Cloudera Manager的界面时,所有服务对应的启停等操作选项都不可用。

二.Cloudera Manager提供的监控功能
  (1)服务监控
      查看服务和实力级别健康检查的结果,对设置的各种指标和系统运行情况进行全面监控。如果任何运行情况测试是不良(Bad),则服务或者角色的状态就是不良(Bad)。如果结果运行状况存在隐患(Concering,没有任意一项目是不良(Bad)),则服务或者角色的状况就是存在隐患(Concerning)。而且系统会对管理员应该采取得到行动提出建议。
  (2)主机监控
      监控集群内所有主机的有关信息,包括主机上目前消耗的内存,主机上运行的角色分配等,不但显示所有集群主机的汇总视图,而且能进一步显示单个主机关键指标详细视图。
  (3)行为监控
      CM提供来列表和图表来查看集群上进行的活动,不仅显示当前正在执行的任务行为,还可以通过仪表盘查看历史活动。
  (4)事件活动
      监控界面可以查看事件,系统管理员可以通过时间范围,服务,主机,关键字等信息过滤事件。
  (5)报警
      通过配置CM可以对指定的时间产生警报,并通过电子邮件或者SNMP的事件得到制定的警报通知。
  (6)日志和报告
      可以轻松点击一个链接查看相关的特定服务的日志条目,并且Cloudera Manager可以将收集的历史日志监控数据统计生成报表。

三.Cloudera Manager提供的诊断功能
  (1)周期性服务诊断
      CM会对集群中运行的服务进行周期性的运行状况测试,以检测这些服务的状态是否正常。如果有异常情况,就会进行告警,有利于更早地让用户感知集群服务存在的问题。
  (2)日志采集及检索
      对于一个大规模的集群,CM提供了日志收集功能,能够通过统一的界面查看集群中每台及其,各项服务的日志,并且能够根据日志级别等不同的条件进行检索。
  (3)系统性能使用报告
      CM能够查看系统性能使用报告,包括集群的CPU使用率,单节点的CPU使用率,单个进程的CPU使用率等各项性能数据,这对于Hadoop集群的性能调试很重要。

四.Cloudera Manager提供的集成功能
  (1)安全配置
      为了方便Hadoop大数据平台与原有身份认证系统如AD,LDAP等的集成,CM只需在界面上配置即可完成。
  (2)Cloudera Manager API
      通过Cloudera Manager API,能够方便地将CM集成到企业原有管理系统集成。
  (3)SNMP集成
      CM也提供了方便的SNMP集成能力,只要简单的配置,就能够将SNMP进行集成,并且将集群中的告警信息进行转发。

Cloudera Manager高级功能

Cloudera Manager的高级功能在免费的Express版本中是不提供的。
  (1)软件升级滚动
      Hadoop版本升级和bug修复,通常会影响业务的连续性。CM提供了滚动升级的功能,支持Hadoop平台进行滚动升级时继续对外提供服务以及应用。
  (2)参数版本控制
      任何时候进行配置修改并保存之后,Cloudera Manager会对该配置生成一个版本。Cloudera Manager支持查看历史配置,并回滚到不同版本,从而为集群恢复,问题诊断等提供了一个可靠的一句和方便的工具。
  (3)备份及容灾系统BDR
      Cloudera为Hadoop平台提供一个集成的,易用的灾备解决方案。BDR为灾备方案提供了丰富的功能,CM和BDR提供了完整的用户画像,实现界面化的数据备份与灾难恢复。
  (4)数据审计
      Cloudera Navigator的审计功能支持对数据的审计和访问。
  (5)安全集成向导
      启用Kerberos集成和外部安全认证集成,如支持通过内部数据库和外部服务进行用户认证。

原文链接:https://blog.csdn.net/weixin_43824520/article/details/102565454

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342