用 Superset 和 Druid 快速打造实时数据分析看板

Apache Superset是一款开源的企业级数据可视化和探索平台。它具有直观的界面,丰富的图表与仪表盘类型,并支持大规模数据集,方便进行实时分析与探索。Apache Druid是一款高性能、分布式、低延迟的OLAP数据存储方案。它适用于数据探查和快速数据摘要等场景,能轻松应对PB级数据。


Screenshot 2023-04-21 at 10.59.51 PM.png

本文将介绍如何结合Superset和Druid这两个优秀的开源软件,快速搭建一个实时数据分析看板应用。将二者整合,我们可以轻松实现一个帮助企业快速监控数据、获得数据洞察的智能平台。

一、环境准备

  1. 安装 Druid,安装和配置Superset
    安装步骤省略,可自行搜索。

  2. 添加 Druid 数据源

  • 登录Superset, 选择“数据源”菜单
  • 点击“+ 数据源”按钮,选择“Druid”数据源类型
  • 填写Druid数据源相关信息:
    • 名称: Druid数据源名称, 如test_druid
    • 主机: Druid Broker主机IP/域名
    • 端口:Druid Broker服务端口,默认为8082
    • 点击“保存”按钮,Druid数据源添加成功!

二、构建Druid数据表和查询

  1. 登录Druid Console, 构建数据表
    在Druid Console通过上传数据文件或提供数据流的方式创建数据表

  2. 定义复杂的查询
    Druid支持丰富的查询类型, 如GroupBy、TopN、Timeseries等...(查询语法示例)

{
  "queryType": "groupBy",
  "dataSource": "wikiticker", 
  "granularity": "all",
  "dimensions": ["page","country"],
  "aggregations": {
    "count": "count"
  },
  "intervals": [
    "2020-01-01/2020-01-02"
  ] 
}
  • queryType:指定GroupBy查询类型
  • dataSource:查询的数据源
  • granularity:聚合粒度,all表示全量数据
  • dimensions:分组维度
  • aggregations:聚合指标,这里使用count计数
  • intervals:时间范围
    该查询会按page和country两个维度对wikiticker数据源在2020-01-01至2020-01-02的所有数据进行分组,并统计每个分组的记录数。
    Druid通过简洁的JSON配置支持构建复杂的分组、TopN、时间序列等聚合查询。

三、在 Superset 中创建报表

  1. 新建Druid表格视图
    在Superset中,我们需要创建表格视图来显示Druid数据集的数据。新建Druid表格视图的步骤如下:
  • 选择数据源为我们之前添加的Druid数据源test_druid
  • 选择“Druid数据集”,这会拉取Druid Console中已有的数据集列表
  • 选择要查询的Druid数据集,比如wikiticker
  • 选择要查询的时间范围,可选择最近1小时、1天、1周、1月或自定义时间范围
  • 选择要使用的查询类型,包括Timeseries、TopN、GroupBy等
  • 根据所选查询类型配置对应的参数,如分组维度、聚合指标等
  • 点击“引入表格”按钮,表格视图创建成功
  1. 使用多种图表类型可视化数据
    在新建的表格视图上,点击工具栏的“创建图表”按钮,选择要使用的图表类型,即可将查询结果以图表形式进行可视化展示。

Superset支持线图、柱状图、散点图、地图、盒形图等多种图表类型,选择合适的可视化形式。

  1. 构建实时数据看板
    将创建好的多个图表和文本框拖动到仪表盘,设置自动刷新间隔,即可以实现一个实时数据监控看板。
    步骤如下:
  • 点击左侧“仪表盘”菜单, 选择“新建仪表盘”
  • 输入仪表盘名称, 选择布局样式, 点击“保存”
  • 添加文本框、图像等组件进行装饰(可选)
  • 将创建好的图表从左侧的可用内容拖动到仪表盘 Grid 空间中
  • 点击添加到仪表盘的图表,在右侧设置面板中设置自动刷新间隔(如每1分钟)
  • 回到仪表盘界面, 点击右上方“保存并进入编辑模式”按钮
  • 调整组件大小和位置, 美化仪表盘整体样式
  • 点击右上方“保存”按钮, 实时数据看板创建成功!

四、总结
通过 Superset 和 Druid,我们实现了一个实时数据分析看板应用。Druid提供实时和历史数据的存储与查询,Superset通过丰富的可视化手段, 将Druid查询结果呈现直观的网页报表和仪表盘。

写作是一个学习和思考的过程, 我也会不断总结与改进。谢谢阅读,如果你对文章中的内容有疑惑,欢迎点击我头像,看我个人介绍,与我取得联系,谢谢~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容