240 发简信
IP属地:广东
  • 这个其实应该只是一种架构设计,我也说不上具体为什么,从我的理解来看,协调者的工作只是做协调工作,他不参与具体的分配设计,协调者就好像一个传话筒,仅此而已,他的设计非常轻量和简单,这是从分工来说。另外从负载来说,把复杂的工作分摊到消费者上,能一定程度上减轻服务端的负载,在做服务器设计的时候~我们一般都是遵循这个来设计的。~~~~~~~以上只是个人见解~仅供参考~

    Kafka 重平衡 全流程解析

    前言 本文来自 极客时间 Kafka核心技术与实战这段时间有看 极客时间的这个课程,这里仅以分享的角度来做个笔记。那么本文将涉及到以下几个知识点: 重平衡是什么?为什么要了解...

  • @菜鸟大侠 你这只是一部分,总之意思就是水位之上的数据,其实相当于还没有完全写入,只有被水位覆盖,才算是完成真正的提交,有点两阶段的意思

    Kafka 水位详解

    什么是水位 kafka中用水位来描述,一个分区中的可见数据的offset。大概你需要知道这几点: hw(水位)你可以理解成是一个全局(所有副本最小offset)的offset...

  • 奇怪的知识

    数据中台是什么? 是一种战略选择和组织形式, 是依据企业特有的业务模式和组织架构,通过有形的产品和可实施方法构建的一套持续不断把数据变成资产并服务于业务的机制。 数据中台的四...

  • @胡阳_606a 这个涉及到迭代器模式,就是map里面的内容其实是没有直接执行的,你这里关掉了,后面map里面真正执行的时候读取的是一个关闭的链接

    Spark系列——关于 mapPartitions的误区

    前言 今天 Review 了一下同事的代码,发现其代码中有非常多的 mapPartitions,问其原因,他说性能比 map 更好。我说为什么性能好呢?于是就有了这篇文章 网...

  • 👍是的~

    Kafka 水位详解

    什么是水位 kafka中用水位来描述,一个分区中的可见数据的offset。大概你需要知道这几点: hw(水位)你可以理解成是一个全局(所有副本最小offset)的offset...

  • Spark 中join一定产生shuffle吗?

    产生shuffle的原因 其根本原因在于数据需要进行迁移才能产出正确的数据 join什么时候不需要数据迁移就能得出结果? 当 分区数 和 分区器 是一样的时候也就是在本地就...

  • Kafka 保证分区有序

    Kafka能做到全局有序吗? Kafka只能保证分区有序,如果只有一个分区,那也是变向的全局有序 Kafka如何保证分区有序 通过配置 max.in.flight.reque...

  • Kafka 水位详解

    什么是水位 kafka中用水位来描述,一个分区中的可见数据的offset。大概你需要知道这几点: hw(水位)你可以理解成是一个全局(所有副本最小offset)的offset...

  • 伟大而艰巨 的任务~~~~~~~

    大纲

    WorldEffect 第一期大纲: 给 RM 的世界以活着的感觉 GameSelfData: 事件独立数据Game_SelfData 类重写value(key)重写setV...

  • 《搬迁声明》

    我的博客即将同步至 OSCHINA 社区,这是我的 OSCHINA ID:solve,邀请大家一同入驻:https://www.oschina.net/sharing-pla...

  • 严格说起来是你这样...不过就目前看到的大部分内容来看,说到部署模式一般都是说可以部署在那些地方,面试按照楼主说的估计加分比较多

    Spark面试题整理

    整理来源:《Spark面试2000题》 目录Spark section-0 基础 (3)Spark section-1 Spark运行细节 (13)Spark section...

  • 120
    Flink WaterMaker详解

    什么是 WaterMaker WaterMaker 水位线在很多地方都有应用,其含义也不尽相同,在Flink中,水位线是用来触发窗口计算的其本质相当于一个flink流中的一...

  • 120
    Flink 状态管理

    前言 在传统的批处理中,数据划分为一个个batch,然后每一个Task去处理一个batch。一个批次的数据通过计算处理输出就是最终的结果。对于state的需求不高 对于流计算...

  • 120
    Flink Window

    1.window 概述 streaming流式计算是一种被设计用于处理无限数据集的数据处理引擎,而无限数据集是指一种不断增长的本质上无限的数据集 Window窗口就在一个无界...

  • Flink系列——感性认识

    前言 可以当做一个初步认识 Flink 的文章,仅此而已!!!!! 我们以一个生产口罩的工厂为例来尝试理解一下Flink的整个计算流程 工厂的老板 VS JobManager...

  • @printf_2975 并没有具体的说法,可能贵和业务有关,但是具体值,你只能自己慢慢尝试。。。

    推荐系统 —— LFM隐语义模型

    前言 本文是推荐系统系列的第三篇了,主要来讲一下 LFM 算法,与之前一样,注重原理方面,不会在算术上多做纠结,以方便快速理解该算法 什么是 LFM? 一种基于矩阵分解的用来...

  • canal 搭建

    mysql环境配置 步骤 1: 开启 binlog 步骤 2: 赋权限 注:由于5.7版本MySQL有密码设置的规范。可以使用root用户登陆后 降低MySQL密码安全级别,...

  • 120
    SparkSQL技巧——如何识别SQL语句 和 执行一个SQL文件

    前言 这是一个非常小的技巧,但是应该还是有点用。 怎么在SparkSQL中写SQL? 如果我们直接使用,那么大概是如下这样:ss.sql("select * from xxx...

个人介绍
实力来自点点滴滴的积累,专注原创,分享大数据技术。