各位同学大家好,欢迎来到蒸鱼科研小教室。今天我想跟大家分享一个非常好用的引文分析工具—Histcite。大家在刚进入到某个新领域时,例如在Google scholar上搜索Management 一定会发现文献太多根本无从下手,不知道从哪篇文献入门去探索这个领域。这时你就需要Histcite这个工具来帮助你快速理出某个领域的研究脉络,例如哪些论文属于该领域的开山之作?哪些作者对该领域有重大贡献?那么就让我们开始吧。
背景
Histcite最早是由汤森路透所运营的文献分析软件,而2016年10月,汤森路透知识产权与科技事业部被加拿大Onex公司和香港霸菱亚洲投资基金收购,并独立成立Clarivate Analytics公司。Clarivate Analytics旗下有众多知名产品,如Web of Science (Academic Literature Retrieval),HistCite (Academic Literature Analysis), Endnote (Academic Literature Management),JCR (Journal Citation Report, Academic Literature Management)等。
由于HistCite属于Clarivate Analytics旗下,所以它只能用来分析Web of Science所导出的数据。关于更多数据库的介绍如果大家有兴趣的话未来我可以另外写一篇文章跟大家分享一下。此外HistCite官方已经停止更新,我这边用的是由Tsing开发的HistCite Pro版,大家如果有兴趣的话可以在网上搜索下载。
文献数据下载
首先下载需要分析的文献数据。我们打开Web of Science的网站。在选择数据库时要选择Web of Science核心合集。在这个地方输入你想搜索的领域,我们以International Business为例。如果想要搜索更精准的内容,可以点击下面添加行输入额外的关键字进行搜索。这里也可以自定义年代,我们选近十年来的文献进行分析。最后点击搜索即可。
在这边可以看到搜索结果,如果文献太多的话可以按照被引频次降序排列,导出前1000-2000篇即可。
然后点击导出,其他文件格式 这边为了方便讲解我就先导出1000篇。在记录内容中选择全记录与引用的参考文献,文件格式的地方选择纯文本,然后导出即可。
导入数据
我们将下载好的文件拖入txt文件夹中,并运行main程序,输入1 点击回车。
在这边我们就可以看到刚刚导入进来的文献
数据分析
第一行中
Records: 1000--指的是我们一共导入了1000篇文章
Author: 2538--指的是这1000篇文献一共有2538位作者
Journals: 327--指的是一共有327个期刊
Cited references: 53454--指的是这1000篇文献一共引用了53454篇文献
Words: 2354--指的是有哪些单词是经常被这些文章提到的
这里我们可以着重看右边的四个数据
LCS (Local Citation Score) 本地引用次数--这篇文献在我们导入的数据库中被引用的次数。(可以着重看这个数据,它可以反应这篇文章在领域内的认可度。)
GCS(Global Citation Score) 全球引用次数--这篇文献在整个Web Of Science中被引用的次数(可以参考GSC的数据,因为其他领域的作者也可能会引用这篇文章,因此它无法准确的反映这篇文章在本领域的认可度。)
LCR(Local Cited References) 本地参考文献引用数--这篇文献在所导入的1000篇文章中被引用的次数
CR(Cited References) 这篇文章引用Web Of Science数据库文献的数量(可以用来筛选出哪些文章为文献综述)
作图
然后可以点击菜单栏的Tools--Graph Maker--Make Graph,便可以轻松得到下方文献之间的引用关系图。左边select by下方LCS/GCS分别为本地引用次数/全球引用次数,后面的Count指的是按LCS或GCS排序,分析前30篇,而Value指的是分析所有LCS或GCS大于30的文献。大家可以根据自己的需求来设置筛选条件。