这里简单记录一下elasticsearch java api 的调用。
首先,初始化一个client.
public TransportClient initClient() {
Settings settings = Settings.settingsBuilder().put("cluster.name", cluster)
.put("client.transport.ignore_cluster_name", false).put("node.client", true)
.put("client.transport.sniff", true).build();
TransportClient client = null;
try {
client = TransportClient.builder().settings(settings).build()
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("192.168.0.70"), 9300));
if (client == null) {
LOGGER.info("Init Elasticsearch client failed!");
} else {
LOGGER.info("Init Elasticsearch client successul!");
}
} catch (UnknownHostException e) {
LOGGER.error("client initlization failed!");
LOGGER.error(e.toString());
}
return client;
}
初始化client的时候记得加上cluster,这个表示你elasticsearch的cluster,可以在配置文件里面找到,如果你elasticsearch安装了head插件,直接可以在网页上看到。
然后,可以加上你的定制条件进行查询。
res = client.prepareSearch(index).setTypes().setQuery(query).setPostFilter(filter)
.setSearchType(SearchType.DFS_QUERY_THEN_FETCH).setFrom(from).setSize(count).setExplain(true)
.execute().actionGet();
关于查询可以定制一个 setQuery(QueryBuilder) 和 setPostFilter(filter) 。当然还可以根据需要添加排序,分页等参数。这里主要谈一下query和filter.
query的作用是根据条件创建搜索规则。
postFilter的作用是在搜索的结果的基础上过滤结果。
elasticSearch 2.4 以后没有filter相关概念,所以构建query和filter都用QueryBuilder。简单举几个例子
QueryBuilder query = QueryBuilders.matchAllQuery(); //全部查询
QueryBuilder query = QueryBuilders.queryStringQuery(key);
//filter
QueryBuilder timeFilter = QueryBuilders.rangeQuery("doc.create_time").from(begin_time).to(end_time);
QueryBuilder channelFilter = QueryBuilders.termsQuery("doc.channel", channel_list);
elasticsearch提供了boolQuery来代替filter的or, and, not等操作。如果想要把上面的filter关联起来需要用must, mustNot, should等操作。
filter = QueryBuilders.boolQuery().must(timeFilter).must(channelFilter);
must可以理解为and, mustNot可理解为not, 但should不能理解为or,这个对查询的结果相关性有影响。
elasticsearch post filter可以作简单的yes/not过滤,但是无法对复查结果进行过滤,至少我没发现。比如下面这种情况。
- 我有两种类型的文档,type =1/2;
- 我不要两天以外的type=1的文档;
QueryBuilder typeFilter = QueryBuilders.termQuery("doc.media_type", 2);
QueryBuilder timeFilter = QueryBuilders.rangeQuery("doc.create_time").lt(TimeUtil.getDaysBefore(2));
QueryBuilder wFilters = QueryBuilders.boolQuery().must(typeFilter).must(timeFilter);
filter = QueryBuilders.boolQuery().mustNot(wChatFilters);
这种是没办法做到的,这样只会过滤掉所有type=2的文档以及所有两天以外的文档。
继续探索。。。