一、es索引的基本操作
1、文档
2、常用操作
-
访问es(GET请求)
192.168.56.101:9200
-
查看es健康状态(GET请求)
192.168.56.101:9200/_cluster/health
-
创建索引(PUT请求)
- 请求地址(新增索引index_01)
192.168.56.101:9200/index_01
- 请求参数
{ "settings": { "index": { "number_of_shards": "2", "number_of_replicas": "0" } } }
-
删除索引(DELETE请求)
删除索引index_01
192.168.56.101:9200/index_01
-
查看所有索引(GET请求)
192.168.56.101:9200/_cat/indices?v
-
查看单个索引(GET请求)
192.168.56.101:9200/index_01
3、索引的mappings
映射
-
创建(PUT请求)
创建索引
index_mapping
,并添加属性realname
、username
,realname
可以呗索引,username
不能被索引192.168.56.101:9200/index_mapping
{ "mappings": { "properties": { "realname": { "type": "text", "index": true }, "username": { "type": "keyword", "index": false } } } }
index:默认true,设置为false的话,那么这个字段就不会被索引
-
查看分词效果(GET请求)
为刚创建的索引
index_mapping
中的属性字段realname
添加值,并查看分词效果,以下是GET请求路径和GET请求参数- 请求
192.168.56.101:9200/index_mapping/_analyze
{ "field": "realname", "text": "落尘的秋" }
- 结果
{ "tokens": [ { "token": "落", "start_offset": 0, "end_offset": 1, "type": "<IDEOGRAPHIC>", "position": 0 }, { "token": "尘", "start_offset": 1, "end_offset": 2, "type": "<IDEOGRAPHIC>", "position": 1 }, { "token": "的", "start_offset": 2, "end_offset": 3, "type": "<IDEOGRAPHIC>", "position": 2 }, { "token": "秋", "start_offset": 3, "end_offset": 4, "type": "<IDEOGRAPHIC>", "position": 3 } ] }
-
为已经存在的索引添加
mappings
为 index_01 添加 mappings
- 请求(POST)
192.168.56.101:9200/index_01/_mapping
- json参数
{ "properties": { "name": { "type": "long" } } }
<font color='bisque'>注:某个属性一旦被建立,就不能修改了,但是可以新增额外属性</font>
二、es的数据类型
1、基本数据类型
- text, keyword,
string - long, integer, short, byte
- double, float
- boolean
- date
- object
- 数组不能混,类型一致
2、字符串
-
text
文字类需要被分词被倒排索引的内容,比如
商品名称
,商品详情
,商品介绍
,使用text。 -
keyword
不会被分词,不会被倒排索引,直接匹配搜索,比如
订单状态
,用户qq
,微信号
,手机号
等,这些精确匹配,无需分词。
三、文档相关
1、基本操作
-
添加文档
创一个临时索引 index_doc,往这个索引中添加文档(类似于数据库中添加一条数据),对一个文档进行全量更新也是一样的方式,即为替换
- 请求(POST)
192.168.56.101:9200/index_doc/_doc/1
说明:index_doc(索引名称)/_doc(添加文档请求固定写法)/1(文档id,可以不写,会自动生成)
- 参数
{
"id": 1001,
"name": "job-1",
"desc": "this is a good job, 这是一个好工作!",
"create_date": "2022-10-22"
}
-
注意
如果索引没有手动建立mappings,那么当插入文档数据的时候,会根据文档类型自动设置属性类型。这个就是es的动态映射,帮我们在index索引库中去建立数据结构的相关配置信息。
“fields”: {“type”: “keyword”}
对一个字段设置多种索引模式,使用text类型做全文检索,也可使用keyword类型做聚合和排序“ignore_above” : 256
设置字段索引和存储的长度最大值,超过则被忽略
-
文档删除(DELETE)
192.168.56.101:9200/index_doc/_doc/100
说明:index_doc(索引名称)/_doc(说明要删除的时一个文档)/1(文档id,指明要删除的文档)
这种删除是逻辑删除不是物理删除
-
全量更新doc(POST)
整个doc中source信息会被新的数据完全替换掉
192.168.56.101:9200/index_doc/_doc/2
{ "doc": { "name" : "好工作" } }
-
更新某个字段信息
只更新name
```
192.168.56.101:9200/index_test/_update/2
```
```json
{
"doc": {
"name" : "好工作"
}
}
```
-
更新文档
每次修改后version都会进行修改
- 请求(POST)
-
查询某个索引的特定的文档信息(GET)
查询结构包含所有的source信息
192.168.56.101:9200/index_doc/_doc/2(文档id信息)
-
查询某个索引的所有文档信息(GET)
192.168.56.101:9200/index_doc/_doc/_search
-
查询某个索引下特定文档中的特定信息(GET)
只查看id,name信息,属性之间用“,”隔开
192.168.56.101:9200/index_doc/_doc/2?_source=id,name
-
查询某个索引下所有文档中的特定信息(GET)
192.168.56.101:9200/index_doc/_doc/_search?_source=id,name
-
判断文档是否存在(HEAD)
192.168.56.101:9200/index_doc/_doc/2
判断返回的状态吗status,200表示存在,404表示不存在
2、元数据
数据结构说明
- _index:文档数据所属那个索引,理解为数据库的某张表即可。
- _type:文档数据属于哪个类型,新版本使用
_doc
。 - _id:文档数据的唯一标识,类似数据库中某张表的主键。可以自动生成或者手动指定。
- _score:查询相关度,是否契合用户匹配,分数越高用户的搜索体验越高。
- _version:版本号。
- _source:文档数据,json格式。
3、文档乐观锁控制
?if_seq_no={数值}&if_primary_term={数值
-
插入新的数据
POST /my_doc/_doc { "id": 1010, "name": "imooc-1010", "desc": "imoocimooc!", "create_date": "2019-12-24" } # 此时 _version 为 1
-
修改数据
POST /my_doc/_doc/{_id}/_update { "doc": { "name": "修改测试" } } # 此时 _version 为 2
-
模拟两个客户端操作同一个文档数据,_version都携带为一样的数值
# 操作1 POST /my_doc/_doc/{_id}/_update?if_seq_no={数值}&if_primary_term={数值} { "doc": { "name": "操作1" } } # 操作2 POST /my_doc/_doc/{_id}/_update?if_seq_no={数值}&if_primary_term={数值} { "doc": { "name": "操作2" } }