前言 Kyuubi提供了两个命令行工具:kyuubi-admin和kyuubi-ctl。这两个工具的功能和用法非常相似,能够获取到Kyuubi ...
前言 Kyuubi提供了两个命令行工具:kyuubi-admin和kyuubi-ctl。这两个工具的功能和用法非常相似,能够获取到Kyuubi ...
简介 通常来说Parquet文件可以使用Spark或Flink来读取内容。对于问题分析或者学习研究场景,临时查看一个parquet文件专门使用S...
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c...
本篇带来Hudi metadata index的介绍、配置和使用。本篇将Hudi官网内容有关部分重新整理在一起,阅读和查找起来更为容易。 Met...
前言 本篇为大家带来Hudi的数据文件布局的一些个人理解。 本篇大量引用了探索Apache Hudi核心概念 (1) - File Layout...
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c...
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c...
前言 本篇从Hudi角度介绍Flink常用的几种读写操作。内容主要来源于官网例子和个人理解。 读者如果想了解从编译、部署到使用的步骤,请参考:F...
前言 Hudi Flink支持配置table service的异步执行。Schedule的时机为checkpoint完成的时候。执行过程在线程池...
用户体系 无论使用Hue自身的用户管理体系还是LDAP用户体系,Hue操作大数据组件使用的是Impersonation机制。用户实际操作时会被模...
专题公告
玩转大数据