首页 >> 图书情报学
“科学知识图谱”与“Google知识图谱”比较分析 ——基于知识管理理论视角
2017年10月30日 08:57 来源:《情报杂志》 作者:冯新翎 何胜 等 字号

内容摘要:随着大数据技术发展,“Google知识图谱”(Google knowledge graph)引起广泛关注,由于在中文译名上与图书情报领域中的“科学知识图谱”(Mapping knowledge domain)相似,容易引起误解。

关键词:科学知识图谱;谷歌知识图谱;语义网;大数据

作者简介:

  作者简介:冯新翎,ORCID:0000-0001-5873-6019(1981- ),女,硕士,江苏理工学院计算机工程学院讲师,研究方向:大数据挖掘与应用;何胜,ORCID:0000-0001-6762-8271)(1971- ),男,博士,江苏理工学院计算机工程学院副教授,研究方向:大数据挖掘与应用;熊太纯,ORCID:0000-0002-8623-4793)(1971- ),男,江苏理工学院图书馆研究馆员,研究方向:图书馆学;武群辉,ORCID:0000-0002-3720-9006,男(1973- ),江苏理工学院图书馆副研究馆员,研究方向:图书馆学;柳益君,ORCID:0000-0002-5381-6084)(1978- ),女,江苏理工学院计算机工程学院副教授,研究方向:大数据挖掘与应用。常州 213001

  内容提要:[目的/意义]随着大数据技术发展,“Google知识图谱”(Google knowledge graph)引起广泛关注,由于在中文译名上与图书情报领域中的“科学知识图谱”(Mapping knowledge domain)相似,容易引起误解。[方法/过程]基于知识管理理论,从知识获取、知识组织、知识存储、知识共享和知识创新的角度比较分析,并讨论大数据情景下两类知识图谱在相关领域的应用前景。[结果/结论]分析结果表明,两者之间既有本质的区别又有紧密的联系,在大数据时代,两者在知识创新方面的融合和发展将会带来知识管理领域科学范式的变革。

  关 键 词:科学知识图谱 谷歌知识图谱 语义网 大数据

  标题注释:国家社会科学基金一般项目“基于大规模网络分析方法和内存计算技术的高校图书馆大数据应用模式与实证研究”(编号:15BTQ016)的研究成果之一。

  中图分类号 G350 文献标识码 A 文章编号 1002-1965(2017)01-0149-05

  0 引言

  自从2002年由Rasmussen等学者在65届美国信息科学与技术学会会议上发表题为Visualizing knowledge domains的文献[1],将可视化方法及工具应用于图书情报领域知识管理的研究在国外学界逐步兴起。国内方面,陈悦、刘则渊等提出将这一研究方法的中文译为“科学知识图谱绘制”[2]。随后,“科学知识图谱”或“知识图谱”概念在国内图情领域得到广泛应用,成为知识管理的重要方法[3,4]。

  为提供海量数据的智能检索服务,Google公司率先构建了统一结构化的Knowledge Map[5],即以语义网[6](Semantic Web)和领域本体[7](Ontology)为其关键技术的大规模语义网络知识库。Knowledge Map按照中英文字面的含义也译为“知识图谱”,近年来主要出现在国内计算机领域相关文献中[8-10]。另外,中国中文信息学会(http://www.cipsc.org.cn/)已经连续召开三届“中文知识图谱研讨会”,讨论语义网知识库的开发和应用,“知识图谱”概念在中文信息处理领域已经被普遍使用。随着语义网技术在图情领域中的广泛应用,以语义网知识库为特征的“Google知识图谱”势必引入到图情领域,从而在名称上与作为知识管理重要方法的“科学知识图谱”相冲突,因此有必要厘清各自概念的内涵,并予以比较和分析。

  两类知识图谱都属于知识管理范畴,在知识管理过程中不同阶段扮演不同角色,完成各自功能。以下首先分析各自术语一般涵义,追溯相关理论渊源,重点以知识管理过程为主线进行比较分析,并总结各自适用领域。另外,因为“Google知识图谱”是大数据时代的产物,所以还讨论了两类知识图谱在大数据环境下的应用前景。

  1 两类知识图谱的涵义

  “科学知识图谱”(Mapping knowledge domain)将科研活动的主体(如研究人员,机构,团队)或具有某个共同特征的学科领域群体(如学科知识单元、知识群体)作为研究对象,是知识管理过程中的一种分析方法,广泛应用于科学计量、引文分析、知识创新预测等,包含“科学图”(Science mapping)、“文献计量图”(Bibliometric mapping)、“文献图”(Literature mapping)等内容[11]。陈超美认为知识图谱是揭示知识演化进程和机制的信息可视化方法[12]。陈悦等将知识图谱定义为能绘制、挖掘、分析和显示知识之间的相互联系,并能提供知识共享以及促进科研合作的可视化工具[2]。综合来看,“科学知识图谱”的共同特点是基于图形分析的可视化手段,显示知识演化进程和知识结构,辅助知识管理的方法和工具[13]。

  “Google知识图谱”(Google Knowledge Graph)是在知识管理过程中,为应对海量知识检索挑战,由Google公司提出并构建的基于语义网的大规模知识库。基于本体和语义网技术,“Google知识图谱”通过描述现实世界中的各种实体(概念)及其复杂关系,将多种异构的知识库关联起来,并构建基于图(Graph)的统一的结构化语义网络知识库,在此基础上实现智能检索和知识推理。为方便表述,本文的“Google知识图谱”是建立在语义网技术基础上所有类似Google知识库架构的知识库统称,如搜狗知立方(www.sogou.com)和百度知心(www.baidu.com)在架构上类似Google知识库,就属于“Google知识图谱”类型。

  2 两类知识图谱的区别

  2.1 相关理论渊源 以科学主体和学科知识为研究对象的“科学知识图谱”,用图形方式直观呈现科学主体(或学科知识)网络结构、知识单元互动和知识群体演化等隐含的复杂关系,其产生有深刻的理论渊源。相关支撑理论有揭示网络结构和演化关系的“社会网络分析”理论,强调知识创新的“知识单元离散和重组”理论,尤其是科学史和科学哲学领域中,库恩提出的“科学发展模式”理论[14,16]。库恩认为,科学发展进程实质是通过新旧“范式”交替更迭的模式,不断推动科学创新和科学革命。“科学知识图谱”是“跟踪科技前沿、选择科研方向、开展知识管理并辅助科技决策”的重要方法和工具[15],以助益科技活动、强化知识管理等方式有力地促进了旧范式突破和新范式诞生,从而积极推动科学发展的进程。

  作为大数据时代产物的“Google知识图谱”,紧密依存大数据理论,以及关注数据规范性和关联性的本体和语义网理论。由于信息技术飞速发展引起了数据生成,传播与存储方式的巨大变革,为更全面、精准和高效获取知识以及发现创新知识,“Google知识图谱”以本体建模为手段,通过领域概念术语的规范化,推动知识全面共享,借助于语义网络分析理论挖掘并发现新知识,应用语义网知识库关联方法实现海量知识的分布式存储。

  2.2 知识管理视角 已有的相关研究文献对知识管理的过程划分并不完全一致,但一般包括知识获取(采集)、知识组织、知识存储(检索)、知识共享和知识创新等阶段[17-19]。两类知识图谱的共性在于二者都是服务于知识管理过程,区别在于二者分别参与不同的过程,完成不同的功能,如图1所示,“科学知识图谱”本质是知识管理的方法,一般与知识获取、知识组织、知识共享和知识创新密切相关,“Google知识图谱”本质是知识库,参与了知识获取、知识组织、知识存储和知识创新过程。

  

图1 基于知识管理的两类知识图谱比

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们