一、参考资料 1、官方文档[https://clickhouse.com/docs/zh/] 2、大数据技术与数仓-clickhouse专栏[h...
一、组件 介绍一下kafka进行数据复制时会涉及到的一些组件概念 zookeeper:维护集群信息,当broker加入或退出时,kafka通过订...
一、概述 关键技术:预计算、大规模并行处理、列式存储 工作原理本质:MOLAP(多维立方体分析),具体过程:指定数据模型,定义维度和度量预计算c...
一、关于直立行走 基因的随机突变。对于进化论,人们常常会有一个误导,以为进化就是朝着一个明确的、更好的方向进化。基因突变跟进化一样,只有适应与不...
一、概述 Flink User-defined Sources & Sinks 官方文档[https://ci.apache.org/proje...
一、认识 分布式的支持实时分析的数据存储系统,处理海量规模的数据和实时方面比传统的olap系统有显著的性能改善 特点快速查询,数据预聚合和内存华...
步骤如下: 生成第二个账号密钥,要与原默认密钥id_rsa区分开,执行如下命令:ssh-keygen -t rsa -C "你的第二个账号" -...
一、用户画像基础 1、什么是用户画像 用户画像,即用户信息标签化,通过收集用户的社会属性、行为方式、偏好特征等多维度数据,运用大数据技术进行数据...
一、简介 1、HBase是什么 HBase,Hadoop Database,是一个基于Hadoop HDFS作为其文件存储的分布式数据库 高可用...