CDH Spark 监控

翻译: https://www.cloudera.com/documentation/enterprise/latest/topics/operation_spark_applications.html#spark_monitoring
版本: 5.14.2

使用日志查看和调试Spark应用程序

要查看有关所有正在运行的Spark应用程序的概述信息,请根据您使用的是哪个群集管理器执行以下操作之一:

  • YARN - 转到Cloudera Manager管理控制台中的YARN应用程序页面。

    要调试运行在YARN上的Spark应用程序,请查看NodeManager角色的日志:

    1. 打开日志事件查看器
    2. 过滤事件流以选择时间窗口,日志级别并显示NodeManager源。
    3. 对于任何事件,请单击查看日志文件以查看整个日志文件。
  • Spark Standalone - 转到Spark Master UI,默认为 http://spark_master:18080. 。显示集群中Master 和每个worker工作统计信息。另外,每个作业的详细日志输出也被写入每个工作者的工作目录。

使用Web应用程序UI可视化Spark应用程序

每个Spark应用程序都会启动一个Web应用程序UI,以显示有关应用程序的有用信息

  • 事件时间线,显示应用程序事件的相对排序和交错。时间表视图有三个层次:跨所有作业,在一个作业中,在一个阶段中。时间表还显示执行者分配和释放。
  • 阶段和任务的列表。
  • 执行指导每个作业的非循环图(DAG)。
  • RDD大小和内存使用情况的摘要。
  • 环境 - 运行时信息,属性设置,库路径。
  • 有关Spark SQL作业的信息。

根据应用程序是否正在运行或已完成,Web UI有不同的可用方式。

继续阅读:

访问正在运行的Spark应用程序的Web UI

要访问正在运行的Spark应用程序的Web应用程序UI,请打开 http://spark_driver_host:4040 。如果多个应用程序在同一主机上运行,​​则Web应用程序将绑定到以4040开头的连续端口(4041,4042等)。Web应用程序仅在应用程序持续时间内可用。

访问完成的Spark应用程序的Web UI

要访问已完成的Spark应用程序的Web应用程序UI,请执行以下操作:

  1. 采用以下方式之一打开Spark历史记录服务器 UI:
    • 打开网址 http://spark_history_server_host:18088
    • 在Cloudera Manager管理控制台中打开UI:
      1. 转到Spark服务。
      2. 单击历史记录服务器Web UI链接。历史服务器显示已完成的应用程序的列表。
  2. 在应用程序列表中,点击应用程序ID链接。应用程序UI显示。

注意:在CDH 5.10及更高版本以及Apache Spark 2的Cloudera Distribution中,Spark历史记录服务器的存储选项卡始终为空。要在应用程序运行时查看存储信息,请使用前一部分所述的应用程序的Web UI。应用程序完成后,存储信息不可用。

Spark Application Web应用程序示例

考虑一个作业,其中包含一组转换,用于将账户数据集中的数据与weblogs数据集连接起来,以确定每个账户的Web点击总数,然后将结果写入HDFS。在这个例子中,写入被执行两次,导致两个作业。要查看应用程序UI,请在历史记录服务器中单击App ID列中的链接:


图片.png

以下屏幕截图显示了应用程序中事件的时间线,包括运行的作业以及执行程序的分配和取消分配。每项工作都显示最后一项行动,saveAsTextFile 。时间表显示应用程序在运行第一份工作的过程中获取执行者。第二项工作完成后,执行程序变为空闲并返回到群集。

您可以如下操作时间线:

  • 平移 - 按住鼠标左键并左右滑动。
  • 缩放 - 选中启用缩放复选框并上下滚动鼠标。

要查看作业0的详细信息,请单击“描述”列中的链接。以下屏幕截图显示了作业0和DAG可视化中每个阶段的详细信息。放大显示细分从28到42秒的更细节:


图片.png

点击一个stage会显示更多细节和指标:


图片.png

作业1的网页显示了如何跳过前面的阶段,因为Spark保留了这些阶段的结果:

图片.png

示例Spark SQL Web应用程序

除上述屏幕外,使用Spark SQL API的应用程序的Web应用程序UI还具有一个SQL选项卡。考虑一个应用程序,它将两个表的内容加载到一对DataFrame中,加入这些表,然后显示结果。在您单击应用程序ID后,SQL选项卡显示查询中的最终操作:

图片.png

如果你点击show 链接你看到工作的DAG。单击此页面上的详细信息链接将显示逻辑查询计划:


图片.png

示例Spark Streaming Web应用程序

Spark Web应用程序UI还支持在“ 流式”选项卡中显示流式应用程序的行为。如果运行Spark Streaming示例中描述的 示例,并提供三个数据突发,则选项卡的顶部会显示一系列汇总流应用程序整体行为的统计信息的可视化对象:

图片.png

该应用程序有一个接收器处理3个事件批处理,这可以在事件,处理时间和延迟图中观察到。在页面的下方,您可以查看单个批次的详细信息:

图片.png

要查看特定批次的详细信息,请单击“ 批次时间”列中的链接。点击该批次中包含8个事件的2016/06/16 14:23:20链接,提供以下详细信息:


图片.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342

推荐阅读更多精彩内容