Apache lucene 介绍
apacche lucene 是开源、高性能、支持全文搜索、跨平台的java API库;理论上它可以用于任何需要实现全文搜索功能的应用。
Apache lucene 特性
可扩展、高性能索引
- 在现代硬件,索引效率可达150GB/h
- 内存占用低,只需要使用1MB的堆空间
- 增量索引速度接近批量索引
- 索引大小大约是索引文本大小的20~30%
强大、精确、高效的搜索算法
- 支持权重查询,首先将最优结果返回
- 支持多种查询类型,句子查询、通配符查询、临近查询、范围查询等等
- 支持字段搜索,例如文章的标题、作者、内容等等
- 支持任一字段排序
- 对合并结果支持多索引查询
- 可同时进行更新和查询
- 支持分面搜索,可对结果进行分组,连接
- 快速,高效内存调用,容错支持
- 插件化权重模块,包括Vector SpaceModel和Okapi BM25
- 可配置的存储引擎
跨平台解决方案
- 基于Apache Licene的开源框架
- 百分百纯java编写