知识图谱

图1:截至2015年1月,谷歌搜索中显示的托马斯·杰斐逊 Thomas Jefferson的知识图谱内容

知识图谱 the knowledge graph是谷歌的一个知识库,谷歌通过它从各种渠道收集信息,丰富谷歌搜索引擎的搜索结果。这些信息会被放在搜索结果旁的一个信息框中呈现给用户。2012年5月,谷歌搜索引擎开始引入这项功能,首先可在美国使用,2012年年底这项功能推广到了全球。


谷歌知识图谱涵盖的内容在其推行后迅速增长,7个月内增长了三倍(涵盖了5.7亿个实体和180亿条信息关系),并解决了谷歌每月处理的1000亿次搜索中“大约三分之一”的问题。到2020年5月,这个数字已经增长到5000亿,涉及50亿个信息点。不过知识图谱的内容一直因为没有来源或引用而引起了许多争议。


谷歌把这些出现在搜索结果右侧(移动端出现在顶部)的信息框称为“知识图谱卡”.[1]。根据谷歌的说法,知识图谱的信息来源很多,包括中情局世界概况 The CIA World Factbook、维基数据和维基百科。它被用于回答谷歌智能助理和谷歌家庭中的语音询问。[2][3]2016年10月,谷歌称,知识图谱已经覆盖了700亿个信息关系[4] 。目前还没有官方文件说明谷歌知识图谱是如何实现的。[5]


来自知识图谱的信息用于回答谷歌智能助理[6][7]和谷歌家庭的语音询问。[8]


历史

谷歌在2012年5月16日正式发布了谷歌知识图谱,以助于显著提高谷歌搜索引擎的信息质量。[2] 起初只支持英语,2012年12月增加了西班牙语、法语、德语、葡萄牙语、日语、俄罗斯语及意大利语等七种语言。[9]2017年3月增加了孟加拉语。[10]


该知识图谱由Freebae(一个众包知识库)部分支持。.[11]


2014年8月,《新科学家》杂志报道,谷歌发起了一个项目:Knowledge Vault[12] 。文章发表后,谷歌联系到 Search Engine Land,解释说Knowledge Vault是一篇研究性论文,而不是谷歌的可服务。在其报道中,Search Engine Land提到,谷歌指出:他们在用“很多模型”探索从文本中自动收集语义的可能性。[13]谷歌知识图谱旨在处理信息关系,从互联网上自动收集和整合信息,形成一个能够直接回答诸如“麦当娜出生在哪里”等问题的知识库。据报道,谷歌知识图谱最核心的能力,是自动获取和处理信息,而非依靠众包等人工手段。2014年的一份报告指出,知识图谱聚合了超过16亿信息关系,其中2.71亿被认为是“可信的事实”,被认为可信度超过90%。


争议

缺乏信息来源

截止2016年5月,谷歌每月处理的1000亿次搜索中“约三分之一”都会出现出现知识图谱卡。维基媒体基金会的研究主管达里奥·塔拉博雷利告诉《华盛顿邮报》,谷歌知识图谱卡中信息来源的缺失损害了人们判断信息真假的能力,甚至损害到构建完整观点的能力。该报道还称,这些卡片“经常来源不明”,比如女演员贝蒂·怀特年龄的知识图谱卡就被评价为“来源不明但是语气肯定,仿佛是上帝写下的”。[14]


维基百科阅读量减少

《登记册》报道,谷歌搜索结果旁的知识图谱卡上直接显示结果导致维基百科的读者数大幅下降,因为卡片获取了维基百科上的一些信息[15]。《每日点报》在2014年指出: “就实质内容而言,维基百科仍然没有真正的竞争对手。大家都在争夺流量,但维基作为一个非营利组织,流量并不像商业媒体网站那样等同于收入”。 在这篇文章发表后,维基百科的运营团体维基媒体基金会的一位发言人表示,他们“欢迎”知识图谱卡片功能,并正在“调查”流量下降的情况,并且说到“我们也没有发现搜索引擎引荐来源有显著下降。我们还与参与知识图谱卡片工作的谷歌工作人员保持着沟通”。[16]


参见


参考文献

  1. "Your business information in the Knowledge Panel". Google My Business Help. Google. Retrieved December 10, 2017.
  2. 2.0 2.1 Singhal, Amit (May 16, 2012). "Introducing the Knowledge Graph: things, not strings". Official Google Blog. Google. Retrieved December 10, 2017.
  3. Schwartz, Barry (December 17, 2014). "Google's Freebase To Close After Migrating To Wikidata: Knowledge Graph Impact?". Search Engine Roundtable. Retrieved December 10, 2017.
  4. Vincent, James (October 4, 2016). "Apple boasts about sales; Google boasts about how good its AI is". The Verge. Vox Media. Retrieved December 10, 2017.
  5. Ehrlinger, Lisa; Wöß, Wolfram (2016). "Towards a Definition of Knowledge Graphs" (PDF).
  6. Lynley, Matthew (May 18, 2016). "Google unveils Google Assistant, a virtual assistant that's a big upgrade to Google Now". TechCrunch. Oath Inc. Retrieved December 10, 2017.
  7. Kovach, Steve (October 4, 2016). "Google is going to win the next major battle in computing". Business Insider. Axel Springer SE. Retrieved December 10, 2017.
  8. Bohn, Dieter (May 18, 2016). "Google Home: a speaker to finally take on the Amazon Echo". The Verge. Vox Media. Retrieved December 10, 2017.
  9. Newton, Casey (December 14, 2012). "How Google is taking the Knowledge Graph global". CNET. CBS Interactive. Retrieved December 10, 2017.
  10. "Making it easier to Search in Bengali". Official Google India Blog (in English). Retrieved 2018-01-26.
  11. {{cite web |url= http://googleblog.blogspot.com/2012/05/introducing-knowledge-graph-things-not.html |title=Introducing the Knowledge Graph: Things, Not Strings |work=Google Official Blog
  12. Hodson, Hal (August 20, 2014). "Google's fact-checking bots build vast knowledge bank". New Scientist. Retrieved December 10, 2017.
  13. Sterling, Greg (August 25, 2014). "Google "Knowledge Vault" To Power Future Of Search". Search Engine Land. Retrieved December 10, 2017.
  14. Dewey, Caitlin (May 11, 2016). "You probably haven't even noticed Google's sketchy quest to control the world's knowledge". The Washington Post. Retrieved December 10, 2017.
  15. Orlowski, Andrew (January 13, 2014). "Google stabs Wikipedia in the front". The Register. Retrieved December 10, 2017.
  16. Kloc, Joe (January 8, 2014). "Is Google accidentally killing Wikipedia?". The Daily Dot. Retrieved December 10, 2017.


编者推荐

集智相关文章

从知识工程到知识图谱全面回顾

知识工程是符号主义人工智能的典型代表,近年来越来越火的知识图谱,就是新一代的知识工程技术。知识工程将如何影响未来人工智能领域的发展,甚至让计算机拥有像人类一样的认知能力?本文将从历史出发,系统梳理知识工程近 40 年的发展历程,结合互联网大数据时代的技术和社会背景,展望知识工程和知识图谱的未来前景。


肖仰华:当知识图谱“遇见”深度学习

大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的“喂养”下,人工智能技术获得了前所未有的长足进步,其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利消耗殆尽,深度学习模型效果的天花板日益迫近。另一方面大量知识图谱不断涌现,这些蕴含人类大量先验知识的宝库却尚未被深度学习有效利用。

融合知识图谱与深度学习,已然成为进一步提升深度学习模型效果的重要思路之一。以知识图谱为代表的符号主义、以深度学习为代表的联结主义,日益脱离原先各自独立发展的轨道,走上协同并进的新道路。


学术前沿——双曲空间中的网络、单词及其知识图谱

康奈尔大学计算机科学系教授Chris De Sa 与斯坦福大学计算机科学系博士生Albert Gu携手构建出高效的嵌入算法——使用双曲线组合结构嵌入算法,以更低的维度更好地嵌入文本、知识图谱等非结构化的数据。


集智课程

系统讲解知识图谱——从建模到应用

本系列课程中,我们将围绕知识图谱,从知识建模、知识获取、知识管理到知识赋能整个生命周期,进行系统讲解。


知识表征学习专题

本系列课程主要讲解知识图谱(Knowledge graph)以及实现知识图谱的多种算法,内容包括知识图谱的基本概念,实现知识图谱的常见模型等等。




本中文词条由Thingamabob参与编译,Ricky审校,薄荷编辑,欢迎在讨论页面留言。

本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。