文献引文分析利器HistCite详细

一款非常强大的引文分析工具,可以快速绘制出某个研究领域的发展脉络,快速锁定某个研究方向的重要文献和学术大牛,还可以找到某些具有开创性成果的无指定关键词的论文!

如果你选修过中国科学技术大学罗昭锋老师的《文献管理与信息分析》,那么你一定不会对HistCite感到陌生,这是一款非常强大的引文分析工具,可以快速绘制出某个研究领域的发展脉络,快速锁定某个研究方向的重要文献和学术大牛,还可以找到某些具有开创性成果的无指定关键词的论文。

如果说一次引用表示给你的文章投一票,那么并不是所有票都有效,只有相同领域文章的引用才能真正体现你在这个领域中的实力。所以在WebofScience(以下简称WOS)上按照被引次数倒序排列,越靠前不一定就越重要。还有一种情况,你发明了某种材料,但是后来名字变了,之后的文章使用的关键词都是新名字,别人搜新名字的关键词是搜不到你的开创性文章的,但是很显然你的文章是非常重要的。通过HistCite可以直观的看出这个研究领域的论文全部引用了你的文章,可以体现你的文章的重要性。

好了,下面开始使用这个工具。首先要了解一点,HistCite这款软件是ThomsonReuters(汤森路透)公司开发的,和WOS是一家公司,所以HistCite只支持WOS数据库,对于Scopus等数据库则无能为力,不过Github上面有人写了一个可以将Scopus导入Histcite进行分析的脚本——Scopus2Histcite,有兴趣的同学可以去试试看。

年10月,汤森路透知识产权与科技业务被ClarivateAnalytics(科睿唯安)公司收购了,从此WOS也是归该公司所有,因此导出的数据纯文本也发生了些许变化,从而不能直接导入HistCite进行分析。不过别担心,HistCitePro完全兼容新的文件格式!

打开WOS,注意数据库要选择核心合集(CoreCollection)!

例如简单检索一下石墨烯在锂离子电池负极中的应用:

检索结果不是太多,可以全部导出,如果文献太多的话,可以先按照被引频次降序排列,只导出前篇就差不多了。

下面开始导出文献信息,点击页面上的按钮右边的下拉按钮,选择。

在弹出的菜单中,记录数填写1到,因为每次最多只能导出篇文献,所以上面的篇文献需要分成6次导出,后面导出的时候依次填写到、到1等等。。。记录内容选择,文件格式选择,然后点击发送即可得到导出的txt文件,类似可以导出其他5个。

注意:含个记录的txt文档一般是3M左右,如果你的只有几百K,请仔细按照上面这张图进行导出!!!

下面使用HistCite来分析这6个txt格式的引文数据文件。由于HistCite多年不更新,现在存在各种Bug,比如直接打开HistCite,一加载文件就报错:Nosuchfileordirectory。对于这种情况,你可以选择在C盘根目录下新建fakepath文件夹,然后将全部的txt文档复制到里面,再打开HistCite来进行加载,但是仍然会遇到下面FormatUnknown的问题。

尝试第二种方法。选中所有的txt文件,然后拖到HistCite的图标上,放开鼠标,果然自动打开了软件。

但是,事情好像并没有那么简单,又出现了一个报错:FormatUnknown。

最后,在罗老师的指引下,我将每个txt文件的第一行中的Science改成了Knowledge。

然后再将txt文件拖放到HistCite图标上面打开,终于成功加载了!

可以看到篇文献信息全部加载进来了。

在受到这么多折磨之后,我用Python开发了一个方便使用的脚步,于是一个以HistCite源程序为核心的精简易用免安装版本问世了,就叫HistCitePro吧。

由于HistCite源程序只支持Windows系统,所以Pro版本也只能在Windows下使用!

你只需要下载HistCitePro的压缩包(下载链接见文末)并解压(建议解压到C盘或者D盘的根目录下,保证路径中不含中文),就可以直接用,不需要安装,同时去掉了很多没用的文件,大大缩小了软件体积。对于从WOS上导出的txt数据文件,不用做任何修改,只要把全部的txt放到TXT文件夹里面,然后双击main.exe即可一键完成加载,非常方便。

好了,数据加载完毕,下面开始分析数据吧,点击Tools菜单下的GraphMaker。

在弹出的页面上点击MakeGraph即可得到一张引文关系图,包含了最有价值的前30篇文章的完整引文关系。

这张图看起来不是很清楚,在左边的Size选项中选择Full模式,重新绘制一张高清图,然后右击图片“另存为”一张图片即可。

图上有30个圆圈,每个圆圈表示一篇文献,中间的数字是这篇文献在数据库中的序号。圆圈越大,表示被引用次数越多。不同圆圈之间有箭头相连,箭头表示文献之间的引用关系。多数情况下,你会看到最上面有一个圆圈较大,并有很多箭头指向这篇文章。那么这篇文章很可能就是这个领域的开山之作。

通过我绘制出的这张关系图,我们发现标号为29、49、56、60的四个大圆圈非常显眼,可见这四篇文献的被引次数都是非常高的,我们对全部文献进行按照LCS排序,发现前四位刚好就是这4篇文献。

再回到那张圆圈箭头关系图,可见石墨烯在锂离子电池负极材料中的应用研究主要起源于年(29号文献),其通讯作者Honma来自日本,看来日本在石墨烯电池方面的研究开展得相当早。之后,在年,很多原创性的成功迸发而出,具有代表性的就是49、56、60、48号文献,非常有趣的是,年诺贝尔物理学奖的获奖项目刚好是石墨烯,其中的关联显而易见。之后的几年,石墨烯在锂离子电池负极方面的研究越来越多,方向约越来越细。

好了,前面提到HistCite可以找到某些具有开创性成果的无指定关键词的论文,我们来看看是怎么办到的。点击页面上的,然后就可以看到本地库中文献参考的全部文献信息,后面带有加号的表示本地txt库中没有包含,这些往往就是被遗漏的重要文献。

同样的,我们点击上面的按钮,可以找到本领域的一些大牛,具体的操作步骤读者可以自己去摸索。

那么我们怎么把文献记录导出到Endnote呢?首先点击菜单栏中下的选项,调出标记选择工具栏。

下图红框内就是标记选择工具栏。左边栏用于指定选择范围,可以选择当前列表中的全部文献,也可以按照序号(#)、LCS、LCR等数值的区间来选择文献,还可以手动勾选需要的文献。中间栏表示的是需要导出的信息范围,可以只导出记录本身,也可以选择导出引用的文献或者被引的文献。右边栏的按钮就是确认选择按钮。

所以,我们选择好了需要导出的文献记录,点击按钮。

然后,我们就会发现上面出现了一个新的标签,后面的数字就是我们选中的记录条数,如果发现这个数字不正确,点击按钮旁边的来重新选择。确认无误之后,点击图示的标签链接,即可显示全部被选的文献记录。

好的,下面依次点击、、来导出选中的文献记录。

成功导出后得到一个.hci格式的文本文件,直接修改后缀为txt。如果导出不成功,一般多尝试几次就可以。

好的,现在我们打开Endnote,依次点击、、按钮。

在弹出的对话框中通过找到刚才的txt文件,选择Multi-Filter(Special),选择ImportAll,然后点击按钮即可导入。

评论中沈曦同学提到了将HistCite选好的文献导入到Noteexpress软件里的方法,具体操作是在导入时将过滤器选择为webofscience。

最后附上HistCite里面几个重要的英文缩写(感谢Dingledodies同学):

GCS(globalcitationscore),某一文献在WOS数据库中的总被引用次数。有些引用这篇参考文献的文章可能和你的研究方向毫无关系,但GCS还是会把这个引用数据记录下来。

LCS(localcitationscore),某一文献在本地数据集中的被引用次数。因为你导入Histcite的文章都是和你检索词有关系的,可以认为这些文章是你的研究同行,因此如果某一篇文献的LCS值很高,就意味着它是你研究领域内的重要文献,很有可能是你领域内的开创性文章,注意LCS高的文献和GCS高的文献不一定是同一篇!

LCR(localcitedreferences),某一文献引用本地数据集中参考文献的数目。根据LCR值的排序,可以快速定位近期







































拉萨白癜风专科医院
北京治疗白癜风哪里医院疗效好


转载请注明:http://www.shijichaoguyj.com/wxbz/2299.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: