什么是知识?
Knowledge is consider as facts about and relationships between these different objects。
知识是人类通过观察学习思考有关客观世界的各种现象而获得和总结出的所有事实Facts,概念Concepts,规则或原则Rules&Principles的集合。
我们说,获得某一项领域的知识,其实是了解这个领域事物之间的联系。比如我们知道苹果是红色的这个知识,就是了解了apple和red这两者之间的关联(the color is)
人工智能一个难以超越人类智慧的重要原因在于,人类能掌握知识,具有联想、联系万物的能力,但是这对于机器很难。
一个很有意思的问题,人为什么会有总结和联想能力?如何让机器自己找出事物之间的规律?
知识图谱
我们可以先观望一下google这篇official blogIntroducing the Knowledge Graph: things, not strings
比如这里个query [taj mahal] ,从表面上看,这就是两个单词。
但是我们知道, [taj mahal](泰姬陵)有着rich meaning.
a “graph”—that understands real-world entities and their relationships to one another: things, not strings.
Knowledge Graph是能理解真是世界实际事物关联(real-world entities connections)的intelligent model。
知识图谱(Knowledge Graph)是google于2012年提出的概念,本质是语义网络(Semantic Network)的知识库,也可理解为多关系图(Multi-relational Graph)。
图(Graph)由节点(Vertex)和边(Edge)构成。
多关系图(Multi-relational Graph)是包含多种类型节点与边的图。
实体是真实世界中事物的抽象,关系用来刻画实体间的联系。
中国古人的五行学说和易经八卦就是对世间万物进行高度抽象后的知识图谱。
知识图谱与问答系统
知识图谱可理解为事物关系图。常常用来做针对关联性问题的问答系统,如“比尔盖茨的妻子是谁?”,“该地点附近有什么好吃的?”。
实现第一条问答的前提是,我们已构件好包含“Bill Gates”和“Melinda Gates”实体,以及两实体关系(夫妻)的知识图谱(Knowledge Graph)。
执行搜索时,通过关键词提取("Bill Gates", "wife"),在知识库上匹配获得最终答案。
知识图谱问答系统和搜索引擎区别
搜索苹果的颜色是什么?搜索引擎会根据关键字给你找出一堆网页,让你自己筛选判断。
而知识图谱的问答系统会直接告诉你答案是红的。
知识图谱与搜索引擎结果优化 :从information engine到knowledge engine
Google于2012年5月16日发布了知识图谱(Knowledge Graph),目的是为了提升搜索引擎返回的答案质量,洞察用户查询背后的语义信息。
Google知识图谱的宣传语“things not strings”,即要发掘搜索字串背后隐藏的语义和事物信息。
如google加菲猫,搜索引擎会返回右边的知识卡片。包含查询对象和相关对象的信息。
知识图谱的表示和存取
知识图谱主要有两种存储方式:
- 基于RDF的存储,基本单位为SPO三元组。
- 基于图数据库的存储,表现形式多为属性图。
目前来看,工业更多使用图数据库(如Neo4J)。学术领域则经常用RDF表示。
属性图(Property Graph)
现实世界,实体和关系拥有各自属性。如人的实体可拥有姓名,年龄属性。
属性图(Property Graph)用来表示带属性的知识图谱。
属性图贴近现实生活场景,能很好描述业务中的逻辑。
图数据库
图数据库是目前增长最快的数据库系统,Neo4j是目前使用率最高的图数据库,社区活跃,查询效率高,可惜不支持准分布式。
关系数据库和图数据库的区别
关系数据库的核心是一张张表,通过表的连接(外键),间接地维护实体间的关系,当关系一多的时候,表间的连续查询就会显得很繁琐。
图数据库则能非常直接简洁地表示出实体间的关系。
从某个角度而言,关系数据库更侧重实体的数据,图数据库更侧重关系的描述。
一个图数据库,最终会有着类似下图结构。
RDF
知识图谱可视为一条条知识构成,每条知识表示为一个SPO三元组(Subject-Predicate-Object)。
RDF(Resource Description Framework),即资源描述框架,是W3C制定的,用于描述实体/资源的标准数据模型。
参考资料 :
https://www.jiqizhixin.com/articles/2018-06-20-4
https://zhuanlan.zhihu.com/p/31726910
https://www.2cto.com/database/201703/614201.html
https://googleblog.blogspot.com/2012/05/introducing-knowledge-graph-things-not.html