知识图谱的科学图谱

The science map of knowledge graph.

知识图谱是啥?

知识图谱(Knowledge Graph)是当前学术界和工业界的研究热点,旨在描述真实世界中存在的各种实体或概念。其中每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识 符。每个“属性-值”键对用来刻画实体的内在特性,关系用来连接两个实体,表示它们之间的关联。有人认为,知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。目前,在知识图谱领域用到的技术有:实体识别、关系识别、主题模型、文档分类、图数据库、Elastic search、知识建模、人机交互、推理机等等。Google、Wikipedia等公司都在进行相关的研究应用,2012年Google推出自己的第一版知识图谱,Google Knowledge Graph是Google的一个知识库,其使用语义检索从多种来源收集信息,以提高Google搜索的质量。

利用知识图谱的原理方法结合科学计量学方面的计算进行研究,是现在的一大热点。这些研究的基本思路是利用科学知识图谱的分析软件,以科研文献数据库为数据集,构建出不同文献之间的引用关系网络等语义网,结合关键词分析、共词分析、作者关联分析等方法,表现出不同的研究主题历年关注度的时间演化规律,揭示相关科学领域的历史脉络以及发展趋势。目前,应用较多的是结合Citespace软件作为工具,主要研究分析WoS数据库里文献资料,通过设定某一主题词,从数据库里导出相应的文献数据,再利用Citespace进行各个视角的分析。

操作方法

WoS数据库收录了上万种权威性的学术期刊,这些期刊包括了各个科学研究领域。WoS数据库的文献索引信息比较齐全,是科学计量学领域常用的数据库。

在WoS检索数据库里以 knowledge graph 为主题进行检索,时间区间设置为2000-2015。最终得到4,071条来自 Web of Science 核心合集的检索结果。L利用Citespace软件,对检索得到的4071条记录进行初步的分析,初步得到图1的结果:

 

可以看到2010年Fortunato的一篇文章在knowledge graph领域受到了极大的关注和引用。

通过聚类分析,可以发现,在2000-2015年,knowledge graph领域的研究人员关注的热点主要有图2中的7个方面:

 

参考文献

[1] 刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3): 582-600. [2] 李明鑫, 王松. 近十年国内知识图谱研究脉络及主题分析[J]. 图书情报知识, 2016 (4): 93-101. [3] 王仁武, 袁毅, 袁旭萍. 基于深度学习与图数据库构建中文商业知识图谱的探索研究[J]. 图书与情报, 2016, 160(01): 110-117. [4] http://www.cipsc.org.cn/kg3/ [5] Nickel, M., Murphy, K., Tresp, V., & Gabrilovich, E. A Review of Relational Machine Learning for Knowledge Graphs. [6] Socher, R., Chen, D., Manning, C. D., & Ng, A. (2013). Reasoning with neural tensor networks for knowledge base completion. In Advances in Neural Information Processing Systems (pp. 926-934). [7] Dong, X., Gabrilovich,E., Heitz, G., Horn, W., et al. Knowledge Vault A web-scale approach to probabilistic knowledge fusion. In Proceedings of KDD.