本文翻译自:https://www.elastic.co/guide/en/elasticsearch/reference/current/_modifying_your_data.html
本文是Elasticsearch的入门文档,将会介绍ElasticSearch中关于修改,更新和删除数据的相关操作。
修改数据
Elasticsearch近乎实时提供数据操作和搜索功能。默认情况下,你可以在你索引/更新/删除操作数据的一秒钟延迟(刷新间隔)后,看到其出现在搜索结果中。这是与其他平台(如SQL)的重要区别,这类型的平台数据在事务完成后可以立即使用。
索引和替换文档
我们以前看过我们如何索引一个文档。如下:
PUT /customer/external/1?pretty
{
"name": "John Doe"
}
接下来,将上述将指定的文档索引到外部类型,ID为1的自定义索引。如果我们再次使用不同的(或相同)文档执行上述命令,Elasticsearch将替换(即重新索引),新的文档现有的ID为1,且出现在顶部:
PUT /customer/external/1?pretty
{
"name": "Jane Doe"
}
以上将ID为1的文档的名称从“John Doe”更改为“Jane Doe”。另一方面,如果我们使用不同的ID,则新的文档将被编入索引,并且已经在索引中的现有文档保持不变(相当于复制),如下:
PUT /customer/external/2?pretty
{
"name": "Jane Doe"
}
以上索引为一个ID为2的新文档。索引时,ID部分是可选的。如果没有指定,Elasticsearch将生成一个随机ID,然后使用它来对文档进行索引。索引API调用的返回值中包含Elasticsearch生成的实际ID(或者我们在前面的例子中明确指定的任何内容)。
此示例显示如何索引没有显式ID的文档:
POST /customer/external?pretty
{
"name": "Jane Doe"
}
请注意,在上述情况下,我们使用POST动词而不是PUT,因为我们没有指定ID。
更新文档
除了能够索引和替换文档外,我们还可以更新文档。注意,虽然Elasticsearch实际上并没有在底层进行及时更新。每当我们进行更新时,Elasticsearch都会删除旧的文档,然后对一个新文档进行索引(相当于复制),同时更新一次应用更新。
此示例显示如何通过将名称字段更改为“Jane Doe”,以此来更新我们以前的文档(ID为1):
POST /customer/external/1/_update?pretty
{
"doc": { "name": "Jane Doe" }
}
此示例显示如何通过将名称字段更改为“Jane Doe”来更新我们以前的文档(ID为1),同时在其中添加一个年龄字段:
POST /customer/external/1/_update?pretty
{
"doc": { "name": "Jane Doe", "age": 20 }
}
也可以使用简单的脚本来执行更新。此示例使用脚本将年龄增加5:
POST /customer/external/1/_update?pretty
{
"script" : "ctx._source.age += 5"
}
在上面的例子中,ctx._source是指当前的源文档即将被更新。
请注意,在撰写本文时,一次只能对单个文档执行更新。在将来,Elasticsearch可能会提供给予查询条件的多个文档的更新功能(如SQL UPDATE-WHERE语句)。
删除文档
删除文档是相当简单的。此示例显示如何删除我们之前的ID为2的客户:
DELETE /customer/external/2?pretty
请参阅_delete_by_query API以删除与特定查询相匹配的所有文档。值得注意的是,删除整个索引效率更高,而不是使用“按查询删除”API删除符合的文档。
批量处理
除了能够索引,更新和删除单个文档之外,Elasticsearch还提供了使用_bulk API批量执行上述任何操作的功能。这个功能很重要,因为它提供了一个非常有效的机制来尽可能快地进行多个操作,尽可能少的网络往返行程。
作为一个快速示例,以下调用在一个批量操作中指定两个文档(ID 1 - John Doe和ID 2 - Jane Doe):
POST /customer/external/_bulk?pretty
{"index":{"_id":"1"}}
{"name": "John Doe" }
{"index":{"_id":"2"}}
{"name": "Jane Doe" }
此示例更新第一个文档(ID为1),然后在一个批量操作中删除第二个文档(ID为2):
POST /customer/external/_bulk?pretty
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}
请注意,对于删除操作,在它之后没有相应的源文档,因为删除只需要待删除的文档的ID。
由于其中一个操作失败,Bulk API不会失败。如果一个单一的动作由于任何原因而失败,它将继续处理其后的其余动作。当批量API返回时,它将为每个操作提供一个状态(按照发送的相同顺序),以便·可以检查特定操作是否失败。