block、packet与chunk 在DFSClient写HDFS的过程中,有三个需要搞清楚的单位:block、packet与chunk; block是最大的一个单位,它是...
block、packet与chunk 在DFSClient写HDFS的过程中,有三个需要搞清楚的单位:block、packet与chunk; block是最大的一个单位,它是...
一、背景 线上环境下,jvm经常发生full gc;运维监控方面,服务健康检测不健康;用户体验方面,经常出现大量的慢接口调用。经观察,这三者是伴随发生的。起初,我们从慢接口入...
1、简介 RocksDB是FaceBook起初作为实验性质开发的一个高效数据库软件,旨在充分实现快存上存储数据的服务能力。RocksDB是一个c++库,可以用来存储ke...
1 索引构建 索引构建 建立倒排索引的过程,就是索引构建 索引器 构建索引的程序或者计算机,就是索引器 索引器需要原始文本,但是文档可能采用多种编码格式,索引器对中间文件和最...
前言 这篇是昨晚没写完的,今晚补全发出来。 Flink算子链简介 “为什么我的Flink作业Web UI中只显示出了一个框,并且Records Sent和Records Re...
Intro Flink之所以能够做到高效而准确的有状态流式处理,核心是依赖于检查点(checkpoint)机制。当流式程序运行出现异常时,能够从最近的一个检查点恢复,从而最大...
4月30日抵达银川,作为一个省会城市,银川给大众的影响并不深刻,但是你还记得下面这只猴子吗。 《重庆森林》有位男演员的bb机口令是 爱你一万年,bb机是什么,还好我有点年纪了...
数据仓库系列文章 数仓架构发展史[https://www.ikeguang.com/?p=1582] 数仓建模方法论[https://www.ikeguang.com/?p=...
(文章始发个人公众号:川术;欢迎关注)你有没有遇到过这样的情况:不同的数据报告或产品中,相同的指标名称,却对应着不同的数字和不同的计算口径?相信大部分人会点头。我所在的环境中...