大家好,我是独孤风,大数据流动的作者。 最近几个概念频繁出现在大家的视野内。 什么是数据管理,数据治理,数据中心,数据中台,数据湖? 他们之间又...
[图片上传失败...(image-302b48-1688374117497)] 海阔天空 在勇敢以后 要拿执着 将命运的锁打破 冷漠的人 谢谢你...
1、什么是数据湖? 数据湖是一种技术系统,可以大批量并且廉价的分析结构化和非结构化数据资产。 其实很简单,数据湖的最大魅力在于可以分析一切类型的...
上一篇我们已经成功的安装了superset,那么该如何可视化我们的数据呢?本文将可视化王者英雄的数据,快速的入门Superset。 一、连接数据...
Apache Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dash...
Google File System 但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:Google File System(GFS)...
阿里巴巴一直在面向未来探索B类新电商模式,并从2019年开始重点构建“新供给、新链接、新营销”三新体系。买家是三新体系的核心,缺少买家维度的数字...
近日Kafka2.6版本发布,距离2.5.0发布只过去了不到四个月的时间。 Kafka 2.6.0包含许多重要的新功能。以下是一些重要更改的摘要...
虽然SparkStreaming已经停止更新,Spark的重点也放到了 Structured Streaming ,但由于Spark版本过低或者...