背景 之前公司有个需求,需要存储多值的标签+分值类型的数据,并用来检索,其中标签是有限的,分值最大为1,示例数据如下: id字段值doc1(标签...
简介 Elasticsearch目前在使用的服务发现算法,是基于zen的服务发现的第二代实现 节点模式 节点有三种模式,分别是CANDIDATE...
Elasticsearch中,在node的配置中可以指定path.data用来作为节点数据的存储目录,而且我们可以指定多个值来作为数据存储的路径...
记录一下canal的问题。数据同步一直使用阿里开源的canal,最近使用过程中遇到一些问题,在这里记录一下。 原因 我们使用canal监听MyS...
核心概念 基于Lucene Java应用 内存使用分析 Lucene的内存消耗 倒排索引。(堆内存)Lucene中,索引是存储在磁盘中,一个索引...
介绍 今天记录一下Lucene的搜索过程,基于自己的理解吧。 概要 获取词典及词典的文档号倒排表 解析Query语句,转为一棵Query查询树 ...
为什么要使用线程池 降低资源消耗重复利用已创建的线程降低线程创建和销毁造成的消耗。 提高响应速度当任务到达时,任务可以不需要等到线程创建就能立即...
简介 在1.x的时候,Elasticsearch默认的集群通信是多播方式,也支持单播,而从2.x开始,默认是单播模式。到目前的7.x,多播模式以...
Discovery简介 主要是在节点刚启动或者主节点down了的时候,进行节点发现或者master选举。旨在为集群推选一个合适的master(就...