〇白衣卿相〇

发简信

〇白衣卿相〇

4
关注
22
粉丝
37
文章
25197

字数
27

收获喜欢
1

总资产

IP属地：上海

〇白衣卿相〇

大数据技术与应用实战
写了 32121 字，被 77 人关注，获得了 68 个喜欢

公众号[大数据技术与应用实战]，分享flink、hadoop、kafka等大数据相关技术实战，欢迎关注。
〇白衣卿相〇

Flink实战之入库任务调优
背景在调试flink写hdfs和hive时，任务总是报各种各样的异常，其中255问题最多，异常信息如下：这段异常是yarn报出来的，根本原因是Direct Memory ...

1028 0 1

〇白衣卿相〇

Flink实战之写Hive性能问题
上一篇中写了Kafka to Hive的样例，在实际测试过程中，发现性能比较差。问题1 我使用的是Flink1.11.1版本，这个版本有个性能上的问题，见FLINK-191...

1752 0 1
〇白衣卿相〇

Flink实战之Kafka To Hive
背景传统的入库任务一般借助于MapReduce或者Spark来写hive表，一般都是天级别最多小时级别的任务。随着实时性要求越来越高，传统的入库不太能满足需求。Flink完...

4517 0 0
〇白衣卿相〇

Flink实战之合并小文件
背景 Flink的filesystem connector支持写入hdfs，同时支持基于Checkpoint的滚动策略，每次做Checkpoint时将inprogress的文...

3484 0 1
〇白衣卿相〇

Flink实战之FileSystem-parquet支持ZSTD压缩
前言 ZSTD压缩算法是现在最流行压缩算法了，有着高压缩比和压缩性能强的有点，已经被各大框架所使用。目前hadoop 3.1.0版本已经支持ZSTD算法。所以可以使用Flin...

2333 0 0
〇白衣卿相〇

Flink实战之Flink必须依赖Hadoop2.7+？
背景最近在用filesystem connector来写hdfs，底层是通过StreamFileSink实现的。在看官方文档[https://ci.apache.org/p...

1805 0 0

〇白衣卿相〇

Flink源码阅读之FileSystem Connector
代码在flink-table-runtime-blink模块,用户指南参考官网[https://ci.apache.org/projects/flink/flink-docs...

961 0 1
〇白衣卿相〇

Flink实战之扩展JDBC Dialect
前言 Flink jdbc connect已经为依赖于jdbc进行操作的数据库系统提供了非常完善的功能。对于扩展只需要扩展其Dialect即可。具体步骤定义Customi...

1579 0 1
〇白衣卿相〇

Flink实战之Flink SQL connector支持并行度配置
背景目前flink sql是不支持source/sink并行度配置的，flink sql中各算子并行度默认是根据source的partition数或文件数来决定的，比如常用...

4416 0 1
〇白衣卿相〇

Flink源码阅读之Sql-Client的执行原理
前言 sql-cli相信大家都用过，通过sql-client.sh embedded启动就会进入交互界面，每条sql都可以单独执行。在功能调试时非常方便，还有进入界面的那个大...

1401 0 0
〇白衣卿相〇

Flink实战之Flink SQL中的Map、Array、Row
Flink sql支持Map、Array、Row类型，这几种类型在DDL中如何定义、如何获取、如何构造，本文做个总结。以如下数据作为样例：定义获取构造

12869 0 2

〇白衣卿相〇

Flink源码阅读之flink run 背后做了什么
我们经常使用flink run命令提交一个jar任务，比如提交到yarn集群，那么执行这个命令的背后flink都做了什么，能将我们的job提交到集群呢。对此我有兴趣一探究竟。...

853 0 0
〇白衣卿相〇

No operators defined in streaming topology. Cannot generate StreamGraph
Flink 1.11版本对Table&SQL模块进行了重构，废弃了TableEnvironment.sqlUpdate方法，引入了TableEnvironment.execu...

2450 0 1
〇白衣卿相〇

Flink实战之自定义TableFormat
自定义TableFormat主要包含如下步骤：实现TableFormatFactory接口实现SerializationSchemaFactory、Deserializa...

206 0 0
〇白衣卿相〇

Dynamic是1.11版本对table重构的新的接口，后者是1.11之前老的接口。
老接口对datastream严重依赖

Flink实战之自定义flink sql connector
背景最近工作中需要自定义开发一些flink sql的connector，因为官方提供的connector毕竟有限，在我们工作中可能会用到各种各样的中间件。所以官方没有提供的...

〇白衣卿相〇
11016 2 5
〇白衣卿相〇

补充一下，直接往hdfs写这个policy是ok的，但是同样的代码应用到写hive table里面就无法生成目标文件

Flink SQL FileSystem Connector分区提交与自定义小文件合并策略
本文已授权「Flink中文社区」微信公众号发布并标注原创。 Prologue 之前笔者在介绍Flink 1.11 Hive Streaming新特性时提到过，Flink SQ...

LittleMagic
6290 22 49

〇白衣卿相〇

按照楼主的代码测试之后，关键日志都打印出来了，也没任何异常，合并后的文件就是没有是什么情况，搞了今天也找不出原因，楼主有什么思路吗？

Flink SQL FileSystem Connector分区提交与自定义小文件合并策略
本文已授权「Flink中文社区」微信公众号发布并标注原创。 Prologue 之前笔者在介绍Flink 1.11 Hive Streaming新特性时提到过，Flink SQ...

LittleMagic
6290 22 49
〇白衣卿相〇

LittleMagic
写了 497005 字，被 35584 人关注，获得了 4850 个喜欢

本博客所有内容均适用知识共享-署名-相同方式共享（CC-BY-SA）4.0协议。
〇白衣卿相〇

Flink系列 - 实时数仓之ETL实战（二）
一、概述上一篇实战中我们已经使用ogg实现了mysql数据以json的格式同步到了kafka里边去了，也就是说我们的源端的埋点的数据已经处理好咯；那么接下来我们就可以使...

小飞牛_666
7839 6 14