Histcite快速了解一个领域

帕累托二八定律

百分之八十的价值来自于百分之二十的因子，其余的百分之二十的价值则来自于百分之八十的因子

所以，书读经典，要事第一，任何事情先找方法就是提高效率，可以更快捷地进行工作的关键

话不多说，本篇文章主要介绍一下最近才学会的一个高效检索文献的工具----Histcite，可以用于迅速锁定一个领域内的高质量文献和开山鼻祖，大大减少文献筛选的功夫。

背景介绍

我通常检索文献的方法是在pubmed或者WOS中直接输入关键词，按照被引频次由高到低进行排列，然后浏览每一篇文献的摘要，逐步找出合适的文献。但是这样一方面往往信息量非常大，有的关键词会检索出上万篇论文，高被引文献也很多，往往没有时间和精力一篇一篇阅读下去；另一方面，有的文献虽然引用频次高，但是其实跟你想研究的领域没有太大的关系，主要是被其他领域所引用。这时候，就会低效率地浪费不少时间。无意间发现Hisccite（History of Cite）软件，可以分析WOS核心数据集中的文献，迅速找出自己研究领域内使用频次最高的质量最好的文献，觉得非常有用。Histcite 是由SCI的发明人加菲尔德开发，可用图示的方式展示某一领域不同文献之间的关系，根据在所参与分析的文献中引用于被引用的频次，判断文章在专业领域内的地位。然后自己选择出自己需要的高分文献，导出并导入Endnote中进行管理。

分析流程

比如我检索的关键词是GWAS。

首先打开WOS数据库，检索栏选择Web of science核心合集。输入检索关键词：GWAS，进行research。
![WK8KHN45FO@)]V8Y8WJDN9C.png](http://upload-images.jianshu.io/upload_images/1782692-067b2bf468a5f9f9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
可勾选左侧进行检索结果精炼。我选择research area里面的GENETIC HEREDITY进行Refine。共检索出2535条结果。

%SOLAKK5PDC}@K0A99I9W7G.png
导出这2535条结果：选择Save to Other File Formats.

0EJ82`6VCP%R)4F@(D9OW99.png

Number of records：填写1-500 (随后依次填写501-1000,1001-1500,1501-2000,2001-2500,2501-2535导出全部记录。不能多填，因为一次只能导出500条记录）
Records Content：Full Record and Cited References
Fill Format：Plain Text
然后点击send

R))HZXKIF18_ODAH4E%VYIA.png

将文件(savedrecs)保存至相应的文件夹下即可。
在C盘中建立文件夹：fakepath。将刚才保存的导出文献数据复制到此文件夹里。因为这好像是Histcite的默认读取路径，其他的路径貌似不能够导入分析，在我的电脑上是这样。
启动Histcite软件，弹出IE浏览器页面

OUOXZJGQW6P~0)WQXBLQOIY.png

点击左上角的File-----浏览------在C:\fakepath\下导入文件(如果有多个文件，依次导入即可)----Add File
![Y(DINLE8`72IIRIR_JP}C]N.png](http://upload-images.jianshu.io/upload_images/1782692-0fd08bb32285d835.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
最终导入完2535条结果，显示界面如下：
![}5N4$TF5RK37EJ]BI%39RBI.png](http://upload-images.jianshu.io/upload_images/1782692-a164e9f5f56c870d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
对参数的理解详见参数介绍。
点击工具栏上的Tools, 选择Graph Maker，弹出作图界面

YCM8B$8{HWK(`N}A73(CTV0.png](http://upload-images.jianshu.io/upload_images/1782692-2ec4bb2195cce8e4.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 检查基本参数符合要求后，点击Make Graph. ![6JU3601AV`VYTB(()WS0YBS.png

此即为文献引用图。可分析见到，所见所领域内的文献从2007年开始，2007年的应该是此领域内的比较是早的文献，2010年的是文献高发的年份。2010年，2011年都有引用频次很高的文献，这些文献可能是所研究领域内的重要文献。作图界面并不复杂，关键选择是参与做图的文献数量，其余参数都是调整图片中方块、线条和字体的大小。这里选择的是 LCS 排名前 30 的文献。如果对图中某篇文献感兴趣，可以直接点击它，软件会在一个新窗口中打开该文献的详细信息，我们可以预览一下论文的标题和摘要
基本软件操作流程就是这样，下面详细解读一下各个参数的意义及进阶功能。

参数介绍

初始界面

![}5N4$TF5RK37EJ]BI%39RBI.png](http://upload-images.jianshu.io/upload_images/1782692-a164e9f5f56c870d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
有四个重要参数需要我们理解：**LCS，GCS，LCR，GCR **

LCS：是local citation score的简写，即本地引用次数。它表示这篇文章在当前数据集中被引用的次数。
GCS：是global citation score，即引用次数，它表示这篇文章被整个WOS数据库中所有文献引用的次数，也就是你咋web of science网站上看到的引用次数。
LCR：是local cited references ，本地参考文献数，它表示这篇文献的参考文献在当前数据集中的数量，即这篇文献引用别人的情况。如果一篇文章的 LCR 值高，意味着它引用了大量的你限定领域内文献，极有可能是综述文章。
CR：是cited references，即文章引用的参考文献数量。如果某篇文献引用了50篇参考文献，则CR为50。这个数据通常能帮我们初步判断一下某篇文献是一般论文还是综述。
一篇文章GCS很高，说明被全球科学家关注较多。但是如果一篇GCS很高，而LCS很小，说明这种关注主要来自与你不是同一领域的科学家。此时，这篇文献对你的参考意义可能不大。
LCR与CR对应是local cited references，是指某篇文献引用的所有文献中，有多少篇文献在当前数据库中。
LCS可以快速定位一个领域的经典文献， LCR可以快速找出最新的文献中哪些是和自己研究方向最相关的文章。
进行作图的时候，通常就是选择LCS进行

补充遗漏的重要文献

![X2W{(U79Z[QZMLQ]SI9I7E.png
点击上方Cited references,此处表示的是所有你导入文献的引用文献

6T_CIWYWGF5XPM%CR(GXTSJ.png

前面带有绿色的+号，说明这篇文献不在你当前导入的文献中。Recs是一个非常重要的参数，它表示这篇文献在当前数据集中被引频次，通过 Recs 排序，我们很快就可以定位重要的被遗漏的文献。所以我们很有必要把重要的遗漏文献添加进入进行分析。添加的方法如下：

复制遗漏文献的DOI，在WOS中检索出相应的文章题目
点击绿色的+号，把文章题目复制进入Title位置，点击apply changes，然后close对话框即可。
![LP1$U]86{}5NXOA74BSU6S2.png](http://upload-images.jianshu.io/upload_images/1782692-850d1f688c5ec9f5.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
看看是不是已经有了变化？绿色箭头不见了，上方出现红色的update lists，表明这篇文献已经被添加进入目前分析的文献中。依次类推，为了更全面找到基因遗传性领域内GWAS的重要文献，我把排列位置在前20位的遗漏文献文献都手动添加进去。

P$WVVSBLVTK@P002LDOK43N.png

添加好文献之后，再次进行作图分析，这时候，可以看到图已经发生了变化

EPQ6S~1_IVPS9N5DI7MX8O4.png

重要文献导入endnote进行管理

对于你感兴趣的文献（我感兴趣的是按照LCS从高到低进行排列），点击Tools----Make & Tag，select records with (我选择是1-50)，select records only，点击Mark即勾选完成

7%$T90QGFI2EJ$L5U%SSAA3.png

点击上方的Makers，即精炼出我所勾选的50篇重要文献
点击File----Export----Records----save到相应的文件夹，后缀改为.txt
新建一个endnote文件，将导出的.txt文件导入，即形成endnote文献集，通过find full text功能批量下载全文，进一步阅读浏览。

~I){((3B(PCULTXSETX%KZU.png

注意事项

Histcite软件下载 (http://science.thomsonreuters.com/scientific/m/HistCiteInstaller.msi
如果刚开始向HistCite内导入文献出问题的话，需要把savedrecs文件中开头的Web of Science改为Web of Knowledge，我的就是这样解决的。

用了几次HistCite，感觉对快速了解一个领域还是非常有用的。当然功能还在继续摸索中，希望可以不断找到提高做事情效率的方法，能够更高效地做好事情。

最后编辑于：2017.12.05 04:23:24

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,732评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,496评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,264评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,807评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,806评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,675评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,029评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,683评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,704评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,666评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,773评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,413评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,016评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,204评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,083评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,503评论 2赞 343