ClickHouse docker 集群搭建学习(小白向)

1.环境准备

1.1.SSE4.2验证

验证是否支持SSE 4.2指令集,因为向量化执行需要用到这项特性

# grep -q sse4_2 /proc/cpuinfo && echo "SSE 4.2 supported" || echo "SSE 4.2 not supported" 
> SSE 4.2 supported

如果不支持SSE指令集,则不能直接使用先前下载的预编译安装包,需要通过源
码编译特定的版本进行安装

ps:如果宿主机支持,那么看这篇文章关于虚拟化中cpu的指令集SSE 4.2的不支持,实在不行,那么换机器吧

1.2.docker安装

  1. https://hub.docker.com/搜索clickhouse
  2. 拉取镜像 docker pull clickhouse/clickhouse-server
  3. 启动容器 docker run -d -v /etc/hosts:/etc/hosts:ro -v /etc/localtime:/etc/localtime:ro -v $(realpath ./ch_data):/var/lib/clickhouse/ -v $(realpath ./ch_logs):/var/log/clickhouse-server/ -p 18123:8123 -p19000:9000 --name some-clickhouse-server --ulimit nofile=262144:262144 clickhouse/clickhouse-server

-v /etc/localtime:/etc/localtime:ro 挂载宿主机时区,ro为只读,防止容器更改
-v /etc/hosts:/etc/hosts:ro挂载宿主机的路由表,方便后续配置集群使用
ClickHouse存储数据的主文件夹 $(realpath ./ch_data) 当前文件夹下的ch_data文件夹
日志$(realpath ./ch_logs)当前文件下的ch_log文件夹
clickhouse-client 端口映射外部19000
http端口映射外部18123
容器名称 some-clickhouse-server

1.3.配置修改

复制容器中的配置users.xml config.xml
容器查看命令 docker ps -a
sudo docker cp [容器id] /etc/clickhouse-server/users.xml /存放目录/users.xml
sudo docker cp [容器id] /etc/clickhouse-server/config.xml.xml /存放目录/config.xml

1.3.1.users.xml配置修改默认密码

生成sha256_hex方式echo -n root,.123 | openssl dgst -sha256

    <users>
       <!-- 默认账号 ,账号名-->
       <default> 
           <!--密码-->
           <!--
           <password>root,.123</password>
           -->
           <!--加密密码-->
           <password_sha256_hex>a14c4c9d228e0cc32814050fea0f1df49dad0e1857615f5c7900bcb8d33b55a1</password_sha256_hex>
           <!--用户可以从中连接到ClickHouse服务器的网络列表-->
           <networks>
               <ip>::/0</ip>
           </networks>
           <!--可以配读写,只读,写等 不一一列举,自行查阅-->
           <profile>default</profile>
           <!--限制用户使用资源,自行查阅-->
           <quota>default</quota>
           <!--(超级权限)用户可以创建其他用户,并赋予其他用户权限 ,0关闭,1开启-->
           <access_management>1</access_management>
       </default>
   </users> 

1.3.2. 挂载users.xml

加入挂载文件-v [修改过后的users.xml路径]:/etc/clickhouse-server/users.xml

1.3.3. config.xml配置集群(3分片1副本)

  1. 新建一个文件 vi metrika.xml,内容如下,这里replica中的host也就是我们/etc/hosts表中的信息,已经挂载到容器内了
  2. zookeeper使用的是现成的
  3. 我这里拉下来的clickhouse镜像版本为21.12.3.32,其中config.xml文件中有测试分片的配置,找到<remote_servers>标签,删掉标签以及子标签信息,或者注释掉,又或者备份一个作为单机配置使用
    4.这里clickhouseport19000,由docker容器化映射的外部端口
    5.注意replica中的password不能使用加密密码,只能使用明文,原网站部署Smartbi MPP分布式集群
metrika.xml中密码的注意事项
 <yandex>
    <clickhouse_remote_servers>
        <!-- 自定义的集群名称 -->
        <ck_cluster>
            <!-- 分片信息 -->
            <shard>
                <weight>1</weight>
                <!-- 分布式表写入数据是否只写入到一个副本,配合复制表引擎使用,默认false -->
                <internal_replication>true</internal_replication>
                <!-- 分片副本信息,这里指定的用户名密码只能是明文,如果需要密文密码需要将配置指向users.xml中的profile中 -->
                <replica>
                    <host>node95</host>
                    <port>19000</port>
                    <user>default</user>
                    <!--不能使用加密密码-->
                    <password>root,.123</password>
                </replica>
            </shard>
            <shard>
                <weight>1</weight>
                <internal_replication>true</internal_replication>
                <replica>
                    <host>node94</host>
                    <port>19000</port>
                    <user>default</user>
                    <password>root,.123</password>
                </replica>
            </shard>
            <shard>
                <weight>1</weight>
                <internal_replication>true</internal_replication>
                <replica>
                    <host>node93</host>
                    <port>19000</port>
                    <user>default</user>
                    <password>root,.123</password>
                </replica>
            </shard>
        </ck_cluster>
    </clickhouse_remote_servers>

    <!-- Replicated*MergeTree会用到zk -->
    <zookeeper-servers>
        <node index="1">
            <host>node95</host>
            <port>2181</port>
        </node>
        <node index="2">
            <host>node94</host>
            <port>2181</port>
        </node>
        <node index="3">
            <host>node93</host>
            <port>2181</port>
        </node>
    </zookeeper-servers>

    <!-- Replicated*MergeTree建表语句的参数,指定zk的存储目录用 -->
    <macros>
      <!--集群名称-->
      <layer>ck_cluster</layer>
      <!--分片-->
      <shard>shard01</shard>
      <!--副本-->
      <replica>replica01</replica>
    </macros>

    <!-- 监听网络-->
    <networks>
        <ip>::/0</ip>
    </networks>
    
    <!-- 数据压缩算法  -->
    <clickhouse_compression>
        <case>
            <min_part_size>10000000000</min_part_size>
            <min_part_size_ratio>0.01</min_part_size_ratio>
            <method>lz4</method>
        </case>
    </clickhouse_compression>
</yandex>
  1. config.xml文件需要修改,添加如下信息

1.1. 添加信息
<include_from>/etc/clickhouse-server/metrika.xml</include_from>指定我们刚才新建metrika.xml文件路径,这个路径是容器内的路径,到时候需要挂载到容器中
<remote_servers incl="clickhouse_remote_servers" optional="true" />
<zookeeper incl="zookeeper-servers" optional="true" />
1.2.网络
查找到<listen_host>标签(注释里)
如果集群ipv4和ipv6地址都支持,将:
<listen_host>::</listen_host> 取消注释
如果集群支持ipv4和不支持ipv6,将:
<listen_host>0.0.0.0</listen_host> 取消注释
下面这种方式我没有成功,应该是我的服务器没有设置支持ipv6
<listen_host>::1</listen_host>
<listen_host>127.0.0.1</listen_host>
1.3.遗漏点
之前没有配置clickhouse中的时区,文件中的<timezone>内容修改为<timezone>Asia/Shanghai</timezone>

1.3.4.重构容器

先停止之前的容器docker stop [容器id]
再删除容器 docker rm [容器id]
启动容器,命令如下:
docker run -d -v /etc/hosts:/etc/hosts:ro -v /etc/localtime:/etc/localtime:ro -v /home/bigdata/clickhouse_docker/metrika.xml:/etc/clickhouse-server/metrika.xml -v /home/bigdata/clickhouse_docker/users.xml:/etc/clickhouse-server/users.xml -v /home/bigdata/clickhouse_docker/config.xml:/etc/clickhouse-server/config.xml -v /home/bigdata/clickhouse_docker/ch_data:/var/lib/clickhouse/ -v /home/bigdata/clickhouse_docker/ch_log:/var/log/clickhouse-server/ -p 18123:8123 -p19000:9000 --name some-clickhouse-server --ulimit nofile=262144:262144 clickhouse/clickhouse-server
1.额外挂载了metrika.xml config.xml user.xml
2.其他的2个节点分别按照以上1.3.3~1.3.4的方式操作
3.补充一个传输的命令 scp -r /home/bigdata/clickhouse_docker 用户名@主机:/home/bigdata/clickhouse_docker
4.docker镜像操作 保存镜像到本地 docker save -o 保存的名字.tar 镜像REPOSITORY 镜像TAG
docker save -o clickhouse.tar clickhouse/clickhouse-server latest
加载本地tar到镜像 docker load -i tar包名
docker load -i clickhouse.tar

1.4集群验证

登录clickhouse,执行sqlSELECT * FROM system.clusters会看到以下信息

集群情况查看

1.5分片测试

  • 在3个节点都执行以下sql,其中ck_cluster为我们的集群名称,这点注意
--本地表
create table person_local (ID Int8, Name String, BirthDate Date) ENGINE = MergeTree(BirthDate, (Name, BirthDate), 8192);
--分布表(Distributed)本身不存储数据,相当于路由,需要指定集群名、数据库名、数据表名、分片KEY.
这里分片用rand()函数,表示随机分片。
create table person_all as person_local ENGINE = Distributed(ck_cluster, default, person_local, rand());

补充:
查询分布表,会根据集群配置信息,路由到具体的数据表,再把结果进行合并。
person_local 为本地表,数据只是在本地
person_all 为分布式表,查询这个表,引擎自动把整个集群数据计算后返回

  • 执行完毕,结构是这样的


    分片测试表
  • 数据插入sql
insert into person_all (*) values ('1','a','2021-10-01');
insert into person_all (*) values ('2','b','2021-10-01');
insert into person_all (*) values ('3','c','2021-10-01');
insert into person_all (*) values ('4','d','2021-10-01');
insert into person_all (*) values ('5','e','2021-10-01');
insert into person_all (*) values ('6','f','2021-10-01');
insert into person_all (*) values ('7','g','2021-10-01');
insert into person_all (*) values ('8','h','2021-10-01');
insert into person_all (*) values ('9','i','2021-10-01');
insert into person_all (*) values ('10','j','2021-10-01');
insert into person_all (*) values ('11','k','2021-10-01');
insert into person_all (*) values ('12','l','2021-10-01');
  • 数据查询验证,结果如下
select * from person_all;
select * from person_local;
95节点上的person_local数据

94节点上的person_local数据

93节点上的person_local数据
  • 可以发现数据分片到了三台机器的本地表。

感谢

Clickhouse分布式集群搭建
ClickHouse集群安装部署流程(踩坑解决)
clickhouse分布式三分片一副本部署

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容