ES 查询语法解析之SearchAPI - 文章很长，慎入

本文以6.8版本为例

1. 搜索API(_search API)

下面的地址可以找到很多版本的参考文档：
https://www.elastic.co/guide/en/elasticsearch/reference/index.html

搜索的端点地址可以是多索引多mapping type的。搜索的参数可作为URI请求参数给出,也可用request body给出。

搜索API端点地址（6.8版本）

GET /bank/account/_search
GET /twitter/ _search?q=user:kimchy
GET /kimchy,elasticsearch/_search?q=tag:wow
GET /_all/_search?q=tag:wow
GET /_search?q=tag:wow

1.search

# 指定index
GET /bank/_search?q=address:bristol

# 查询多个索引
GET /bank,songs_v1/_search

# 查询所有
GET /_all/_search

# 查询所有
GET /_search

2. URL Search

这里还可以点击Copy as curl查看另外的一种访问形式，当然上边的语句中也有描述：
but it can be handy for quick "curl tests".
此时粘贴到nodepad等编辑器中的显示结果如下：
curl -X GET "localhost:9200/twitter/_search?q=user:kimchy&pretty"
这个指令可以直接在linux中执行，很方便进行测试

对上面的返回内容进行简单的解释：
{
   "timed_out": false,  #是否超时
   "took": 62,  # 本次查询消耗的时间，这里是62ms
   "_shards":{ # 分片相关的内容
       "total" : 1, # 总共有多少个分片
       "successful" : 1, # 成功查询了多少个分片
       "skipped" : 0, # 跳过了多少个分片
       "failed" : 0 # 有多少个分片是失败的
   },
   "hits":{ # 查询命中的信息
       "total" : 1, # 总共命中的数量
       "max_score": 1.3862944, # 所有命中中的最高得分，因为这里只有一个命中，所以得分等于该命中的内容
       "hits" : [ # 所有命中的文档所组成的一个数组
           {
               "_index" : "twitter",  # 属于哪个index
               "_type" : "_doc", # 是什么类型的type
               "_id" : "0", # id 是多少
               "_score": 1.3862944, # 命中得分
               "_source" : {  # source字段
                   "user" : "kimchy",
                   "date" : "2009-11-15T14:12:12",
                   "message" : "trying out Elasticsearch",
                   "likes": 0
               }
           }
       ]
   }
}
相关的parameters，这里仅罗列了一些，具体可以到网站上进行查询:

3. Request Body Search

From/Size：分页相关，但是不建议使用，原因如下：
因为在有分片的情况下，需要先查询每个分片上的内容之后合并然后再符合的内容，比方说一共有5个分片，当查询前10的时候需要分别查询5个分片的前10(因为其分布情况是未知的，所以我们只能这样查询)，归整排序后再选择前面的10个，这好像也没有什么问题，但是如果取11~20的时候呢？这个时候就需要5个分片分别取20个，然后归整，最后取11~20中的内容。所以这里我们就发现问题了，在不断往后去取数据的时候，五个分片导致的后果就是要查询的内容不断扩大，本质上效率没有提升反而下降了。

官网的建议是批量的时候使用Scorll（不适合交互式查询），其他的时候使用Search After
使用的例子：

#  From/Size分页相关
GET /bank/_search
{
 "sort": [
   {
     "account_number": {
       "order": "asc"
     }
   }
 ],
 "from": 0,"size": 10
}

Search After: 分页相关，解决from/size的相关问题

例子：

# 分页相关 Search After
GET /bank/_search
{
  "size": 6,
  "sort": [
    {
      "account_number": {
        "order": "asc"
      }
    }
  ]
}


GET /bank/_search
{
  "size": 6,
  "sort": [
    {
      "account_number": {
        "order": "asc"
      }
    }
  ],
  "search_after": [1]
}

但是这个方法也有一定的问题，比如排序的字段内容最好都是唯一的，不然可能会导致某些数据无法查询到，比如如果返回的排序数字是 10，但是排序的字段为10的内容条数过多，比如第一次是查询10条内容，最后一条的排序字段的数字是10，而其后边还有很多个数字为10的内容，那么下一次在发送查询的时候，由于search_after填写的是10，那么这些没有罗列出来的10的内容，就被跳过了。

Field Collapsing: 字段折叠

例子：

# field collapse
GET /bank/_search
{
 "query": {
   "match": {
     "address": "street"
   }
 }, 
 "collapse": {
   "field": "gender.keyword"
 }
}

# 将数据展开
GET /bank/_search
{
 "query": {
   "match": {
     "address": "street"
   }
 }, 
 "collapse": {
   "field": "gender.keyword",
   "inner_hits" : {
     "name": "details",
     "size": 3,
     "sort": ["account_number"]
   }
 }
}

# 多次折叠
GET /bank/_search
{
 "query": {
   "match": {
     "address": "street"
   }
 },
 "collapse": {
   "field": "gender.keyword",
   "inner_hits": {
     "name": "age_coll",
     "collapse": {"field": "age"},
     "size": 3
   }
 }
}

Source filtering: source 过滤

例子：

# _source
# 展示（默认是true）
GET /bank/_search
{
 "query": {
   "match_all": {}
 },
 "_source": true
}

# 隐藏
GET /bank/_search
{
 "query": {
   "match_all": {}
 },
 "_source": false
}

# 指定返回的内容
GET /bank/_search
{
 "query": {
   "match_all": {}
 },
 "_source": ["address", "balance"]
}

# 返回指定的内容以外的内容
GET /bank/_search
{
 "query": {
   "match_all": {}
 },
 "_source": {
   "excludes": ["address", "balance"]
 }
}

# includes，本质与返回指定内容一样
GET /bank/_search
{
 "query": {
   "match_all": {}
 },
 "_source": {
   "includes": ["address", "balance"]
 }
}

Fields

例子：

#stored_fields 

#对于非store字段，没有任何意义

PUT /songs_v20
PUT /songs_v20/_mapping/classic
{
 "properties": {
   "songName" : {"type": "text"},
   "singer" : {"type": "keyword"},
   "lyrics" : {
     "type": "text",
     "store": true
   }
 }
}

POST /songs_v20/classic
{
 "songName" : "could this be love",
 "singer" : "James",
 "lyrics" : "Could This Be love,Woke Up This Morning Just Sat In My Bed,8 a.m. First Thing In My Head,Is A Certain Someone Who's Always On My Mind,He Treats Me"
}


GET /songs_v20/_search
{
 "_source": true,
 "query": {
   "match_all": {}
 },
 "stored_fields": ["songName", "singer", "lyrics"]
}

Version: 是否返回版本信息

例子:

#   version 是否返回版本信息

GET /bank/account/_search
{
 "query": {
   "term": {
     "_id": {
       "value": "20"
     }
   }
 },
 "version": true
}

Script Fields: 将字段计算后返回

例子：

# script field 将字段计算后返回
GET /bank/_search
{
 "_source": true,
 "query": {
   "term": {
     "_id": {
       "value": "20"
     }
   }
 },
 "script_fields": {
   "age_2year_later": {
     "script" : {
       "lang": "painless",
      "source" : "doc['age'].value + 2"
     }
   },
   "age_2year_before" : {
     "script" : {
       "lang": "painless",
      "source" : "doc['age'].value - 2"
     }
   }
 }
}

min_score: 过滤掉评分太低的

例子：

#有评分太低的，
GET /songs_v1/popular/_search
{
 "query": {
   "match": {
     "lyrics": "So many people all around the world"
   }
 }
}

#加上min_score 去掉评分低的
GET /songs_v1/_search
{
 "query": {
   "match": {
     "lyrics": "so many people all around world"
   }
 },
 "min_score" : 1
}

Sort：排序

例子：

# sort
GET /bank/_search?size=4
{
 "_source": false,
 "query": {
   "term": {
     "state.keyword": {
       "value": "DC"
     }
   }
 },
 "sort": [
   {
     "age": {
       "order": "asc"
     }
   }
 ]
}

# sort mode

# min max avg
GET /numbers/_search
{
 "sort": [
   {
     "numbers": {
       "order": "desc",
       "mode": "min"
     }
   }
 ]
}


# 按照数组的长度来排序的实现方式
GET /numbers/_search
{
 "sort": [
   {
     "scriptFIELD": {
       "type": number,
       "script": {
         "lang": "painless",
         "source": "doc['numbers'].length"
       },
       "order": "desc"
     }
   }
 ]
}

Highlighting: 高亮

例子：

高亮

GET /bank/_search
{
 "query": {
   "match": {
     "address": "green"
   }
 },
 "highlight": {
   "fields": {
     "address": {}
   }
 }
}
#当我们指定需要高亮显示时，返回结果时，就会在与搜索内容匹配的地方包裹一个标签

#这个标签是可以替换掉的
GET /bank/_search
{
 "query": {
   "match": {
     "address": "green"
   }
 },
 "highlight": {
   "fields": {
     "address": {
       "pre_tags": "<strong>",
       "post_tags": "</strong>"
     }
   }
 }
}

如果觉得有收获就点个赞吧，更多知识，请点击关注查看我的主页信息哦~

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,921评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,635评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,393评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,836评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,833评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,685评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,043评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,694评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,671评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,670评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,779评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,424评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,027评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,984评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,214评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,108评论 2赞 351
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,517评论 2赞 343

ES 查询语法解析之SearchAPI - 文章很长，慎入

1. 搜索API(_search API)

推荐阅读更多精彩内容