搭建TiDB集群

今天发现昨天压根不需要另外再搭建一个spark的集群环境。因为tidb1.0版本已经集成了tiSpark组件,所以搭建完tidb集群,它就是一个内置spark集群的环境。

我晕~不过昨天还是有价值的,那就是昨天文章前半部分的内容,可通过配置hostname让tidb各节点互相通信。可见昨天文章:http://www.jianshu.com/p/08d3072c2621

ok,今天就先把tidb集群搭建过程记录下来

准备

http://www.jianshu.com/p/7bd05b55b182这篇单节点部署类似,首先安装ansible,接着下载 TiDB-Ansible

机器配置资源如下

域名 IP tidb集群角色
tidb1 192.168.122.16 TiDB/PD
tidb2 192.168.122.18 TiKV
tidb3 192.168.122.19 TiKV
tidb4 192.168.122.20 TiKV

spark集群

域名 IP 主从关系
tidb1 192.168.122.16 Master
tidb2 192.168.122.18 Slave
tidb3 192.168.122.19 Slave
tidb4 192.168.122.20 Slave

编辑inventory.ini

还是先编辑inventory.ini内容

# TiDB Cluster Part
[tidb_servers]
tidb1

[tikv_servers]
tidb2
tidb3
tidb4

[pd_servers]
tidb1

[spark_master]
tidb1

[spark_slaves]
tidb2
tidb3
tidb4

# Monitoring Part
[monitoring_servers]
tidb1

[grafana_servers]
tidb1

[monitored_servers:children]
tidb_servers
tikv_servers
pd_servers
spark_master
spark_slaves

## Binlog Part
[pump_servers:children]
tidb_servers

[cistern_servers]

[drainer_servers]

[pd_servers:vars]
# location_labels = ["zone","rack","host"]

## Global variables
[all:vars]
deploy_dir = /home/tidb/deploy

## Connection
# ssh via root:
 ansible_user = root
 ansible_become = true
 ansible_become_user = tidb

# ssh via normal user
# ansible_user = tidb

cluster_name = test-cluster

# misc
enable_elk = False
enable_firewalld = False
enable_ntpd = True
machine_benchmark = True
set_hostname = False
tidb_version = v1.0.0
use_systemd = True

# binlog trigger
enable_binlog = False

这里enable_ntpd和machine_benchmark设置为True,use_systemd也设置为True

部署

和之前一样,继续用root账户,相关inventory.ini文件配置如前所述。接下来的过程和单节点部署类似

使用 local_prepare.yml playbook, 下载 TiDB

ansible-playbook local_prepare.yml

初始化系统环境,修改内核参数。如服务运行用户尚未建立,此初始化操作会自动创建该用户

ansible-playbook bootstrap.yml

如果 ansible 使用 root 用户远程连接需要密码, 使用 -k 参数,执行其他 playbook 同理

ansible-playbook bootstrap.yml -k

部署

ansible-playbook deploy.yml -k

启动

ansible-playbook start.yml -k

测试安装是否成功

使用 MySQL 客户端连接测试, TCP 4000 端口是 TiDB 服务默认端口。

mysql -u root -h 192.168.122.16 -P 4000

TiSpark安装

其实执行到这里,TiSpark已经安装部署好了。 TiDB 集群中默认已集成 Spark、TiSpark jar 包及 TiSpark sample data。

目录信息

Spark 已默认部署在 TiDB 实例部署目录/home/tidb/deploy/spark 目录中

TiSpark jar 包默认部署在 Spark 部署目录 jars 文件夹下

/home/tidb/deploy/spark/jars/tispark-0.1.0-beta-SNAPSHOT-jar-with-dependencies.jar

TiSpark sample data 及导入脚本默认部署在 TiDB-Ansible 目录下

/usr/local/tidb-ansible/resources/bin/tispark-sample-data

导入样例数据

假设 TiDB 集群已启动,其中一台 TiDB 实例服务 IP 为 192.168.122.16,端口为 4000,用户名为 root, 密码为空。

cd /usr/local/tidb-ansible/resources/bin/tispark-sample-data

修改sample_data.sh中 TiDB 登录信息,比如:

mysql -h 192.168.122.16 -P 4000 -u root < dss.ddl

执行脚本

./sample_data.sh

执行脚本的机器上需要安装 MySQL client,CentOS 用户可通过

yum -y install mysql

来安装。

登录 TiDB 并验证数据包含TPCH_001库及以下表

执行

mysql -u root -h 192.168.122.16 -P 4000

如下图

图1.png

范例

假设您的 PD 节点 IP 为 192.168.122.16,端口 2379, 先进入 spark 部署目录启动 spark-shell:

cd  /home/tidb/deploy/spark/bin
./spark-shell

scala> import org.apache.spark.sql.TiContext
scala> val ti = new TiContext(spark, List("192.168.122.16:2379"))
scala> ti.tidbMapDatabase("TPCH_001")

之后您可以直接调用 Spark SQL:

scala> spark.sql("select count(*) from lineitem").show

结果为

+--------+|count(1)|+--------+| 60175|+--------+

下面执行另一个复杂一点的 Spark SQL:

scala> spark.sql(
      """select
        |   l_returnflag,
        |   l_linestatus,
        |   sum(l_quantity) as sum_qty,
        |   sum(l_extendedprice) as sum_base_price,
        |   sum(l_extendedprice * (1 - l_discount)) as sum_disc_price,
        |   sum(l_extendedprice * (1 - l_discount) * (1 + l_tax)) as sum_charge,
        |   avg(l_quantity) as avg_qty,
        |   avg(l_extendedprice) as avg_price,
        |   avg(l_discount) as avg_disc,
        |   count(*) as count_order
        |from
        |   lineitem
        |where
        |   l_shipdate <= date '1998-12-01' - interval '90' day
        |group by
        |   l_returnflag,
        |   l_linestatus
        |order by
        |   l_returnflag,
        |   l_linestatus
      """.stripMargin).show

结果为下图

图2.png

碰到的问题和解决方案

1.每台server需要安装ntpd

报错信息如下


图3.png

安装ntpd,并启动ntpd服务

yum install ntp ntpdate
service ntpd start

2.确保spark不会冲突
昨天我自己安装了一个spark集群,后来发现

图4.png

然后我把原有spark进程杀掉就行了

3.PD启动不了,报timeout错误

图5.png

这里是我之前搭建tidb集群后,又修改了inventory.ini 文件,没有关闭原来的集群导致的。
此时应执行集群销毁命令

ansible-playbook unsafe_cleanup.yml

然后重新从执行ansible-playbook bootstrap.yml开始运行就可以了,见部署章节

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容