背景
Elasticsearch,是现在最主流的开源搜索框架。这篇文章详细介绍了如何在centos7上搭建Elasticsearch搜索集群。
事先声明:本篇安装教程仅针对于想简单快速地搭建一个ES集群来进行学习的人群。
环境
- 三台centos7的机器:
hostname | ip |
---|---|
node1 | 192.168.163.128 |
node2 | 192.168.163.129 |
node3 | 192.168.163.130 |
- Java版本:jdk8
- Elasticsearch版本:5.1.1
搭建步骤
温馨提示:以下所有操作都在root帐号下执行。
一、安装Java8
所有节点都安装Java8,具体安装步骤请参考:http://lintut.com/how-to-install-java-8-on-rhel-centos-7-x-and-fedora-linux/
二、添加hosts
每个节点,用vim打开/etc/hosts,然后添加以下内容:
192.168.163.128 node1
192.168.163.129 node2
192.168.163.130 node3
其中node1、node2、node3即为集群中三台机器的hostname。
三、下载安装Elasticsearch软件包
-
首先导入Elasticsearch的rpm公钥:
# rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch
-
下载rpm安装包:
# wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.1.1.rpm
下载完成之后,我们需要校验一下安装包是否下载完整。这里我们只需要比对一下下载下来的rpm包的sha1值与官网上提供的sha1值是否一致就行了:
# sha1sum elasticsearch-5.1.1.rpm 6acaf80c75d9b7774afd7920fa9bfb3d6eb76ad6 elasticsearch-5.1.1.rpm
官网的地址为:https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.1.1.rpm.sha1
-
安装rpm:
# rpm --install elasticsearch-5.1.1.rpm Creating elasticsearch group... OK Creating elasticsearch user... OK ### NOT starting on installation, please execute the following statements to configure elasticsearch service to start automatically using systemd sudo systemctl daemon-reload sudo systemctl enable elasticsearch.service ### You can start elasticsearch service by executing sudo systemctl start elasticsearch.service
每个节点都需要安装一遍Elasticsearch。
四、修改配置文件
安装完成之后,我们需要修改Elasticsearch的默认配置项。所有的配置文件位于/etc/elasticsearch/目录下面
修改JVM参数
由于我的虚拟机的内存只有2G,而Elasticsearch默认启动脚本里面就需要2G的内存空间,为了防止OOM,所以我们需要将JVM的堆栈大小修改为1G。jvm参数的配置文件为/etc/elasticsearch/jvm.options,我们用vim去打开编辑:
# vim /etc/elasticsearch/jvm.options
然后将-Xms2g和-Xmx2g修改为:
# Xms represents the initial size of total heap space
# Xmx represents the maximum size of total heap space
-Xms1g
-Xmx1g
修改Elasticsearch的配置
由于我们做的是Elasticsearch的集群配置,所以我们要按照集群的方法进行配置。Elasticsearch的配置文件是/etc/elasticsearch/elasticsearch.yml:
# vim /etc/elasticsearch/elasticsearch.yml
我们以node1机器为例:
cluster.name: wooyoo-es
node.name: node1
network.host: node1
discovery.zen.ping.unicast.hosts: ["node1", "node2", "node3"]
discovery.zen.minimum_master_nodes: 2
我们详细介绍一下每个配置项的作用
配置项 | 作用 |
---|---|
cluster.name | 集群的名字。只有配置了相同集群名的服务器才会被认为属于一个集群。 |
node.name | 当前节点的名称。建议与hostname保持一致。 |
network.host | Elasticsearch绑定的地址。默认情况下,绑定的地址是127.0.0.1。由于我们是一个集群,为了节点之间能够互相通讯,所以我们需要配置自己的内网地址,这里由于我们配置过了hosts,所以可以直接写自己的hostname。 |
discovery.zen.ping.unicast.hosts | 手动配置集群中各个节点的地址。这里我们采用的是单播的发现机制。 |
discovery.zen.minimum_master_nodes | 这个值是为了防止“脑裂”用的。假设我们集群中的三个节点都可以被选为master(master-eligible),但是由于一个节点由于网络问题,与其他两个节点无法通讯了,那么此时集群划分为了2+1。如果这个节点将自己选为了master,那么此时就会出现两个master,也就是俗称的”脑裂“。那么为了防止这单独的节点不会将自己选为master,就需要利用这个值。比如我们这里配置的是2,那么这个节点发现自己只有1个人,就不会把自己选为master了,这样就避免了”脑裂“的情况。通常这个值等于(master_eligible_nodes / 2) + 1。在我们的例子中,就是(3 / 2) + 1 = 2。 |
另外,由于我们通过rpm方式安装,所以我们无需配置日志和数据存储的路径,日志默认的路径为/var/log/elasticsearch
,数据的默认路径为/var/data/elasticsearch
。
配置文件的修改操作,每个节点都要执行一遍。
五、启动Elasticsearch
由于我们是通过rpm的方式进行安装,所以直接通过启动脚本进行启动即可:
# /etc/init.d/elasticsearch start
如果是停止,或者重启的话,对应的参数就是stop和restart。或者我们用systemctl
来启动:
# systemctl start elasticsearch
当每个节点都启动之后,我们来确认一下每个节点的启动状态。启动信息可以通过查看/var/log/elasticsearch/wooyoo-es.log
该日志文件。如果某个节点被选为了master,那么日志中就会出现对应的信息,我们查看node2节点的日志:
[2016-12-25T21:27:29,788][INFO ][o.e.c.s.ClusterService ] [node2] new_master {node2}{HYeMegH7QCamfOuvv5rqYQ}{ImIkUQkvRbC2tOxCoSTKdw}{node2}{192.168.163.129:9300}, added {{node1}{eGLt364yRZiRDWROmIkVhw}{uKnUR0fBTASgxgMkqRS3OQ}{node1}{192.168.163.128:9300},}, reason: zen-disco-elected-as-master ([1] nodes joined)[{node1}{eGLt364yRZiRDWROmIkVhw}{uKnUR0fBTASgxgMkqRS3OQ}{node1}{192.168.163.128:9300}]
[2016-12-25T21:27:30,350][INFO ][o.e.c.s.ClusterService ] [node2] added {{node3}{Q1QfOueFQR-jKJ6j2QV7jg}{NsTdYP9GRxygcfEgTrcBrg}{node3}{192.168.163.130:9300},}, reason: zen-disco-node-join[{node3}{Q1QfOueFQR-jKJ6j2QV7jg}{NsTdYP9GRxygcfEgTrcBrg}{node3}{192.168.163.130:9300}]
通过日志可以看到,new_master
表示node2被选为了master节点,added
表示有其他slave节点添加进了集群,added
一共出现了两次,对应的分别是node1节点和node3节点。
至此,Elasticsearch集群已经搭建成功。
其他
如果没有其他什么目的的话,强烈建议通过rpm的方式进行安装,可以省去很多麻烦。博主一开始是通过tar包来安装,没想到遇到了很多问题,比如不能以root用户启动,需要修改一些系统参数,而且也没有服务重启脚本。所以一般情况下,通过rpm的方式安装是最为方便的。