CrOSS是一款针对科研人员的,用于聚合学术搜索,聚合学术内容的学术聚合引擎,希望能帮助科研人员快速找到所需论文,高效了解相关领域研究的整体情况。
下面是一段介绍视频。
为什么使用CrOSS?
总的来说,当前科研人员在学术搜索时还是会遇到很多问题。下面是一个现实的例子。
上图是在百度学术中搜索“趋势预测算法”的结果。虽然学术搜索引擎已经尽力优化搜索结果中各篇论文的排序,但是这样的搜索体验并不好,主要有以下两个问题:
1. 为了找到适合的论文,需要在海量的搜索结果中逐一阅读摘要,进一步确认论文是否是自己想要的,耗费了大量时间。
2. 对于搜索结果,其实可能是描述不同主题的,例如上图中分别描述了“网络”、“风电”、“股市”这三种场景的趋势预测算法应用,但是列表的返回结果不加区别地将这些结果返回,用户没有一个全局的视角,需要一篇一篇的整理归类,非常麻烦。
CrOSS的定位
除了百度学术,当前的学术搜索引擎(谷歌、bing)、知识库(中国知网,web of science)都有前述的问题,为了解决上面两个问题,CrOSS应运而生。
1. 针对问题一,CrOSS以文章主题为集合为用户返回搜索结果,通过定制化的聚类算法以及一些其他处理来帮助用户阅读论文。目前CrOSS主要根据论文标题、关键词、摘要等信息将论文转换为由研究点组成的向量,而后对这些论文进行聚类归纳。
2. 针对问题二,CrOSS对处理的后的结果使用可视化图表呈现,当前,使用气泡图来展示结果。气泡图的大小表示了文章数量的多少。这样,研究点信息就可以被用户一目了然地领会。
CrOSS的功能
CrOSS的核心功能是对学术搜索结果进行聚类分析以及分析结果的可视化展现。具体功能介绍如下。
1、聚合多搜索引擎
单一的知识库涵盖的论文并不全面,CrOSS支持从多搜索引擎在线获取论文。目前来说,主要支持百度学术和Bing学术作为搜索源。
2、搜索结果聚类分析以及可视化展示
CrOSS在获得搜索结果后,对搜索结果进行聚类分析,并以气泡图的形式为用户展示结果,用户可以点击气泡图来查看论文详情,下载论文、分享论文等。
3、主题筛选功能
由于CrOSS使用软聚类算法,且一次分析的论文数量较多,返回气泡较多, 便于用户查看全局结果,但不利于用户筛选具体某一个主题。因此CrOSS支持主题筛选功能,以帮助用户进一步和简化论文发现。
4、关键词筛选
关键词是CrOSS进行分析的最小单位,用户根据搜索结果中出现的关键词筛选搜索结果。不同于传统搜索引擎的‘高级检索’功能,CrOSS的关键词筛选功能是启发性的,即这些关键词是CrOSS预先“阅读”了文章的关键信息后得到并呈现给用户的。
5、收藏和分享
在用户登录CrOSS后,可以对认为重要的文章或主题进行收藏。
用户可以将CrOSS分析出的主题(一系列关键字对应的一系列文章)或单篇文章分享到其他平台上。目前,CrOSS支持使用LinkedIn帐号登录,并将内容分享到LinkedIn的动态。LinkedIn用户可以点击分享直接进到CrOSS查看聚合内容。
欢迎使用
CrOSS是一个持续优化的项目,在下一版CrOSS中会引入更多更优化的功能。欢迎访问CrOSS,开启全新的学术搜索体验!
CrOSS(http://cross.free4inno.com)