引入人工智能技术,具有一定程度的智能特征的信息检索系统,就是智能信息检索系统。智能信息检索系统按照研究的侧重点不同可以划分为3类:语义检索系统、跨媒体信息检索系统和个性化信息检索系统。
本体在信息检索领域应用开始于20世纪末—21世纪初,基于本体的信息检索系统是语义检索系统的一种,一般应包含信息采集、本体获取和扩展、语义标注、语义索引、查询处理、检索和排序等。
(1)本体获取与扩展:国外对本体的研究项目很多,已经建成了许多可以使用的开源本体知识库系统,如较为成熟的通用本体库系统Word Net,Dbpedia,Cyc,以及生物医学领域本体、企业领域本体在Semantic Web网站上也提供了一些可以使用的本体,网址为http://semanticweb.org/wiki/Ontology.国内对这方面的研究十分有限,比较著名的是通用本体库系统How Net(知网http://www.keenage.com/html/e_index.html)。
(2)语义标注:外研究人员在基于本体的语义标注方面已经取得了一些研究成果,开发了一系列工具(http://annotation.semanticweb.org/tools),如自动标注工具Mn M(http:kmi.open.ac.uk/projects/akt/Mn M/),Melita (http:nlp.shef.ac.uk/melita/)等。
(3)系统的性能评测:国际上比较著名的TREC会议(http://trec.nist.gov/)在信息检索评测领域起到了很好的示范作用。
基于本体的智能信息检索系统的目标也是在消耗较少的情况下尽快返回准确而全面的结果,因此与传统的信息检索系统一样,主要从效率、效果等方面进行评价.在效率方面,主要是对时间开销、空间开销和响应速度进行测试;在效果方面,主要考虑检索返回的文档中有多少相关文档、返回了多少正确的文档以及靠不靠前等,有时还需要对覆盖率、访问量以及数据更新速度进行评价。
智能信息检索系统领域的主要国际学术会议和期刊有SIGIR,IJCAI,UCAI,WSDM,TREC,WWW,AAAI,ECAI,ECIR,ICML,ECML,ISWC,ECWC,AIRS和Information Retrieval,IEEE TKDE,IEEE Intelligent Systems,Web Semantics,Knowledge-Based Systems,Knowledge and Information Systems,Data & Knowledge Engineering,Information Processing & Management,Expert Systems with Applications,Knowledge Engineering Review,JSEE,Information Systems,Journal of Artificial Intelligence Research,International Journal of Software Engineering and Knowledge Engineering等。
引自:杨月华等,基于本体的智能信息检索系统,软件学报,2015
.