一、早期知识表示简介
知识特性:相对正确性、不确定性、可表示性、可利用性
知识分类:常识性知识、领域性知识(作用范围);事实性知识、过程性知识控制知识(作用及表示);确定性知识、不确定性知识(确定性);逻辑性知识、形象性知识(结构及表现形式)
早期知识表示方法:一阶谓词逻辑(例:has_son(X,Y))、产生式规则(IF
---THEN---置信度CF)、框架、语义网络(节点-弧-节点)、逻辑程序、缺省逻辑、模态逻辑
Horn逻辑,一阶谓词逻辑的子集
原子Atom:P(t1,t2..,tn)
规则Rules由原子构建:
has_child(X,Y):-has_son(X,Y)
事实是没有体部和变量的规则 has_child(Helen,Jack):-
描述逻辑:一阶谓词逻辑的可判定子集,用于描述概念和属性
概念:一个领域的子集 {x|Student(x)}
关系:该领域上的二元关系 {|friend(x,y)}
个体:一个领域内的示例 {XiaoMing}
TBox:包含内涵知识,描述概念的一般性质,例:Mother、Person、has_child
ABox:包含外延知识,描述领域中的特定个体,例:Mother(Helen)
框架
在框架理论中,框架就是知识表示的基本单位
组成:槽:用于描述所论对象某一方面的属性
侧面:用于描述相应属性的一个方面
优点:描述完善和全面,质量高,允许数值计算
缺点:成本高,对知识库的质量要求非常高,表达形式不灵活,难与其他形式数据集关联使用。
产生式模式:
优点:自然性、模块性、有效性、清晰性
缺点:效率不高(规则库庞大、匹配费时),不能表达具有结构性的知识
语义网络
节点:表示各种事物、概念、情况、属性、动作状态等,每个节点可以带有若干属性;
弧:表示各种语义联系,指明它所连接的节点之间某种语义关系。
二、 基于语义网的知识表示框架
知识表示(representation)
什么是RDF(资源描述框架,Resource Description Framework)?
Resource:页面、图片、视屏等任何具有URI标识符
Description:属性、特征和资源之间的关系
Framework:模型、语言和这些描述的语法
在RDF中,知识总是以三元组(triple)形式出现:(主,谓,宾)
RDF也是一个图模型(节点-边-节点),资源和属性用URI标识(可以理解为ID)
RDF允许空白节点,一个资源可以是匿名的即不被URL标识(_:X),例,haofen是某一次KG讲座的讲者
RDF是数据模型(RDF/XML、Turtle、N-Triples),不是序列格式化
封闭世界假设-开放世界假设
例:(CCF ADL,speaker,Haofen)并不意味着CCF ADL讲座只有一位讲者,而是CCF ADL
讲者至少有一位讲者
带标注RDF:时间、不确定性、空间、信任等
RDF和RDFS(RDF Schema)
RDFS为RDF模型提供了一个基本的类型系统,是在RDF基础上提供了一个术语、概念等的定义方式,以及哪些属性可以应用到哪些对象上。
知识查询:
SPARQL简介
是RDF的查询语言,可以对不同的数据集撰写复杂的连接,由所有主流数据库支持
本体可以填充知识与查询之间的语义间隙
Thank you for your reading , welcome to correct my mistakes!!!