快速掌握分布式搜索引擎ElasticSearch（一）

前言

由于最近在项目中接触使用到了ElasticSearch，从本篇博客开始将给大家分享这款风靡全球的产品。将涉及到ElasticSearch的安装、基础概念、基本用法、高级查询、中文分词器、与SpringBoot集成进行接口开发等相关知识。

ElasticSearch简述

如果大家接触过大数据的话，相信大家或多或少的听说过ELK。ELK是目前非常主流的用于网站监控，流量监控，日志监控，集中日志管理的一套解决方案。而ElasticSearch如同ELK的心脏一般，起到一个非常核心的作用。简单来说，Logstash通过把日志收集到ElasticSearch中，进行储存，kibana负责可视化的展现结果。

ELK

说白了，ElasticSearch就是一款大数据搜索引擎，那么在市面上还有哪些类似的产品呢？在Java开源界的话，主要就是Lucene、Solr和ElasticSearch了。

Lucene，Java领域的搜索引擎鼻祖，是一个比较底层的东西，需要深厚的搜索理论基础才可以掌握，比较复杂（它本身不是一个完整的解决方案，需要额外的开发工作）。因此，为了方便使用，屏蔽复杂性，Solr和ElasticSearch在lucene的基础上进行了二次开发。

Solr相比ElasticSearch而言拥有更加成熟的社区，比较稳定，但是随着数据量越来越大，对实时性要求越来越高，Solr的搜索效率在下降，而ElasticSearch却没有明显的变化。因此ElasticSearch非常适合实时搜索的应用。（比如大名鼎鼎的Github的站内实时搜索就在应用ES）

另外，由于ElasticSearch提供了简单易用的Restful API，轻松的横向扩展机制（说白了，可以通过加机器来扩展容量），能支持PB级别的结构化或非结构化数据处理，具有强大的分布式储存能力。

ElasticSearch的安装

安装比较简单，下载地址是：

https://www.elastic.co/cn/downloads/elasticsearch

下载后直接解压，运行即可。

运行es

默认启动端口9200

查看es启动状态

注意上面的方式是单实例的安装，那么分布式安装呢？

其实，对于分布式安装，无非注意下面几个配置要点：

指明谁是master，谁是slave，集群的名字，节点启动的端口（特别是在同一台机器上模拟分布式）。

几个重要的基础概念

索引，含有相同属性的文档集合。

类型，索引可以定义一个或者多个类型，文档必须属于一个类型。

文档，文档是可以被索引的基本数据单位。

看起来，比较绕，我们用类比的思路来理解：

类比理解

索引相当于database，类型相当于table，文档相当于一条记录，文档Document是es里面最小的储存单位。需要注意的是索引在es中的名称必须是英文字母小写且不包含中划线。和索引相关的有2个高级概念，一个是分片，一个是备份。

分片：每个索引都有多个分片，每个分片是一个lucene索引。

备份：拷贝一个分片就完成了分片的备份。

假设索引的数据很大，就会造成硬盘的压力很大，同时搜索速度也会出现瓶颈。那么可以将索引分成多个分片，从而分摊压力。分片的同时，还可以允许用户进行水平扩展和拆分，进行分布式的储存，从而提高搜索的效率。

当一个主分片出现问题时，备份的分片可以代替工作，从而提高了es的可用性。

es在默认创建索引时，会创建5个分片，一个备份。

假设我们的es是一个master，2个slave，创建索引时，走的默认配置（5个分片，1个备份）,那么图示如下：

分片和备份

图中标绿颜色的是主分片，其他是备份的分片。

创建ES索引、类型

本文前面提到es提供了简单易用的Restful API来操作索引／类型／文档，下面介绍下基本格式：

API基本格式 http://ip:port/索引/类型/文档id

http常用方法 get/put/post/delete

下面，我们演示一下利用postman来创建一个索引和类型：

创建索引和类型

查询索引、类型信息

好了，本篇博客就介绍到这里，下一篇博客再来给大家介绍文档的增删改查操作等。

see u next time~

张丰哲

2018.11.10

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,839评论 6赞 482
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,543评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 153,116评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,371评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,384评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,111评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,416评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,053评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,558评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,007评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,117评论 1赞 334
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,756评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,324评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,315评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,539评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,578评论 2赞 355
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,877评论 2赞 345

快速掌握分布式搜索引擎ElasticSearch（一）

前言

ElasticSearch简述

ElasticSearch的安装

几个重要的基础概念

创建ES索引、类型

推荐阅读更多精彩内容