帕累托二八定律
百分之八十的价值来自于百分之二十的因子,其余的百分之二十的价值则来自于百分之八十的因子
所以,书读经典,要事第一,任何事情先找方法就是提高效率,可以更快捷地进行工作的关键
话不多说,本篇文章主要介绍一下最近才学会的一个高效检索文献的工具----Histcite,可以用于迅速锁定一个领域内的高质量文献和开山鼻祖,大大减少文献筛选的功夫。
背景介绍
我通常检索文献的方法是在pubmed或者WOS中直接输入关键词,按照被引频次由高到低进行排列,然后浏览每一篇文献的摘要,逐步找出合适的文献。但是这样一方面往往信息量非常大,有的关键词会检索出上万篇论文,高被引文献也很多,往往没有时间和精力一篇一篇阅读下去;另一方面,有的文献虽然引用频次高,但是其实跟你想研究的领域没有太大的关系,主要是被其他领域所引用。这时候,就会低效率地浪费不少时间。无意间发现Hisccite(History of Cite)软件,可以分析WOS核心数据集中的文献,迅速找出自己研究领域内使用频次最高的质量最好的文献,觉得非常有用。Histcite 是由SCI的发明人加菲尔德开发,可用图示的方式展示某一领域不同文献之间的关系,根据在所参与分析的文献中引用于被引用的频次,判断文章在专业领域内的地位。然后自己选择出自己需要的高分文献,导出并导入Endnote中进行管理。
分析流程
比如我检索的关键词是GWAS。
- 首先打开WOS数据库,检索栏选择Web of science核心合集。输入检索关键词:GWAS,进行research。
![WK8KHN45FO@)]V8Y8WJDN9C.png](http://upload-images.jianshu.io/upload_images/1782692-067b2bf468a5f9f9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
可勾选左侧进行检索结果精炼。我选择research area里面的GENETIC HEREDITY进行Refine。共检索出2535条结果。
-
导出这2535条结果:选择Save to Other File Formats.
Number of records:填写1-500 (随后依次填写501-1000,1001-1500,1501-2000,2001-2500,2501-2535导出全部记录。不能多填,因为一次只能导出500条记录)
Records Content:Full Record and Cited References
Fill Format:Plain Text
然后点击send
- 在C盘中建立文件夹:fakepath。将刚才保存的导出文献数据复制到此文件夹里。因为这好像是Histcite的默认读取路径,其他的路径貌似不能够导入分析,在我的电脑上是这样。
- 启动Histcite软件,弹出IE浏览器页面
点击左上角的File-----浏览------在C:\fakepath\下导入文件(如果有多个文件,依次导入即可)----Add File
![Y(DINLE8`72IIRIR_JP}C]N.png](http://upload-images.jianshu.io/upload_images/1782692-0fd08bb32285d835.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
最终导入完2535条结果,显示界面如下:
![}5N4$TF5RK37EJ]BI%39RBI.png](http://upload-images.jianshu.io/upload_images/1782692-a164e9f5f56c870d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
对参数的理解详见参数介绍。 -
点击工具栏上的Tools, 选择Graph Maker,弹出作图界面
此即为文献引用图。可分析见到,所见所领域内的文献从2007年开始,2007年的应该是此领域内的比较是早的文献,2010年的是文献高发的年份。2010年,2011年都有引用频次很高的文献,这些文献可能是所研究领域内的重要文献。作图界面并不复杂,关键选择是参与做图的文献数量,其余参数都是调整图片中方块、线条和字体的大小。这里选择的是 LCS 排名前 30 的文献。如果对图中某篇文献感兴趣,可以直接点击它,软件会在一个新窗口中打开该文献的详细信息,我们可以预览一下论文的标题和摘要
基本软件操作流程就是这样,下面详细解读一下各个参数的意义及进阶功能。
参数介绍
初始界面
![}5N4$TF5RK37EJ]BI%39RBI.png](http://upload-images.jianshu.io/upload_images/1782692-a164e9f5f56c870d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
有四个重要参数需要我们理解:**LCS,GCS,LCR,GCR **
- LCS:是local citation score的简写,即本地引用次数。它表示这篇文章在当前数据集中被引用的次数。
- GCS:是global citation score,即引用次数,它表示这篇文章被整个WOS数据库中所有文献引用的次数,也就是你咋web of science网站上看到的引用次数。
- LCR:是local cited references ,本地参考文献数,它表示这篇文献的参考文献在当前数据集中的数量,即这篇文献引用别人的情况。如果一篇文章的 LCR 值高,意味着它引用了大量的你限定领域内文献,极有可能是综述文章。
- CR:是cited references,即文章引用的参考文献数量。如果某篇文献引用了50篇参考文献,则CR为50。这个数据通常能帮我们初步判断一下某篇文献是一般论文还是综述。
一篇文章GCS很高,说明被全球科学家关注较多。但是如果一篇GCS很高,而LCS很小,说明这种关注主要来自与你不是同一领域的科学家。此时,这篇文献对你的参考意义可能不大。
LCR与CR对应是local cited references,是指某篇文献引用的所有文献中,有多少篇文献在当前数据库中。
LCS可以快速定位一个领域的经典文献, LCR可以快速找出最新的文献中哪些是和自己研究方向最相关的文章。
进行作图的时候,通常就是选择LCS进行
补充遗漏的重要文献
![X2W{(U79Z[QZMLQ]SI9I7E.png
点击上方Cited references,此处表示的是所有你导入文献的引用文献
前面带有绿色的+号,说明这篇文献不在你当前导入的文献中。Recs是一个非常重要的参数,它表示这篇文献在当前数据集中被引频次,通过 Recs 排序,我们很快就可以定位重要的被遗漏的文献。所以我们很有必要把重要的遗漏文献添加进入进行分析。添加的方法如下:
- 复制遗漏文献的DOI,在WOS中检索出相应的文章题目
- 点击绿色的+号,把文章题目复制进入Title位置,点击apply changes,然后close对话框即可。
![LP1$U]86{}5NXOA74BSU6S2.png](http://upload-images.jianshu.io/upload_images/1782692-850d1f688c5ec9f5.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
看看是不是已经有了变化?绿色箭头不见了,上方出现红色的update lists,表明这篇文献已经被添加进入目前分析的文献中。依次类推,为了更全面找到基因遗传性领域内GWAS的重要文献,我把排列位置在前20位的遗漏文献文献都手动添加进去。
添加好文献之后,再次进行作图分析,这时候,可以看到图已经发生了变化
重要文献导入endnote进行管理
-
对于你感兴趣的文献(我感兴趣的是按照LCS从高到低进行排列),点击Tools----Make & Tag,select records with (我选择是1-50),select records only, 点击Mark即勾选完成
点击上方的Makers,即精炼出我所勾选的50篇重要文献
- 点击File----Export----Records----save到相应的文件夹,后缀改为.txt
-
新建一个endnote文件,将导出的.txt文件导入,即形成endnote文献集,通过find full text功能批量下载全文,进一步阅读浏览。
注意事项
- Histcite软件下载 (http://science.thomsonreuters.com/scientific/m/HistCiteInstaller.msi
- 如果刚开始向HistCite内导入文献出问题的话,需要把savedrecs文件中开头的Web of Science改为Web of Knowledge,我的就是这样解决的。
用了几次HistCite,感觉对快速了解一个领域还是非常有用的。当然功能还在继续摸索中,希望可以不断找到提高做事情效率的方法,能够更高效地做好事情。