Neo4j在知识图谱中的应用（3）——PMP项目管理知识模型与数据的批量导入

模型概述

根据PMBOK指南（项目管理知识体系指南）第6版，首先建立三个核心概念之间的关系：项目管理过程、工具与技术、输入输出。
其中，每个过程(Process)有若干个输入（INPUT）、工具和技术（TT）和输出（OUTPUT），当然，各过程的输入输出工具与技术都可以复用，因此形成了复杂的多对多关系。
三个核心概念和它们之间的关系都事先写到文本文件中批量导入。

准备文件

文件process.csv记录了49个过程的信息，格式如下，

processId:ID,name,knowledgeArea,processGroup,describe,:LABEL
p01,"制定项目章程","整合","启动","编写...",Process
p02,"制定项目管理计划","整合","规划","协调项目...",Process
……

processId表示过程ID，在Neo4j全局这个ID必须唯一，跟任何类型的节点ID都不能重复。name,knowledgeArea,processGroup,describe是节点的属性，LABEL指出该节点类型，本文件中节点类型都是Process

文件TT.csv记录了136个工具与技术的信息，格式如下，

ttId:ID,name,sort,describe,:LABEL
tt001,"标杆对照","数据收集","指将实际...",TT
tt002,"头脑风暴","数据收集","用于在...",TT
……

本文件中节点类型都是TT

文件IO.csv记录了85个输入输出的信息，格式如下，

ioId:ID,name,sort,describe,:LABEL
io01,"范围管理计划","项目管理计划","确立...",IO
io02,"需求管理计划","项目管理计划","确定...",IO
……

本文件中节点类型都是IO

导入

下面把三个文件导入neo4j

进入neo4j根目录，删除原有data目录：

rm -rf data

把csv文件上传到服务器，我直接传到neo4j根目录，执行下面语句导入

bin/neo4j-admin import --nodes process.csv --nodes io.csv --nodes tt.csv --multiline-fields

multiline-fields参数表示字段中允许换行
重启neo4j服务

bin/neo4j restart

因为删除了data目录，再次登录时密码重置为neo4j,需要再次修改
执行

match(n) return n

结果如下，因为没有设置节点之间的关系，只展示了三类节点

1.png

建立节点之间关系

接下来写一个文件relation.csv记录节点之间的关系：

:START_ID,:END_ID,:TYPE
p01,io53,INPUT
p01,io54,INPUT
p01,io72,INPUT
p01,io55,INPUT
p01,io56,INPUT
p01,tt098,TT
p01,tt002,TT
p01,tt005,TT
p01,tt006,TT
p01,io57,OUTPUT
p01,io22,OUTPUT

:START_ID表示关系的开始节点，:END_ID表示结束节点，:TYPE表示关系类型。解释一下第一行，p01节点代表“制定项目章程”过程，io53节点代表“商业论证”这个文件，INPUT表示输入关系，因此这行表明制定项目章程的一个输入是商业论证

删除data节点，完整执行下面语句：

bin/neo4j-admin import --nodes process.csv --nodes io.csv --nodes tt.csv --relationships relation.csv

重启动neo4j服务器，可以查看完整关系图如下，展现出了各种关系。

1.jpg

查询

接下来就可以进行图查询了，
查询“制定项目章程”这个过程的工具和技术，语句如下：

match(p)-[:TT]-(t) where p.name="制定项目章程" return (p)-[:TT]-(t)

结果如图：

1.png

查询执行过程组中哪些过程输出了“变更请求”

match(p)-[:OUTPUT]-(io) where p.processGroup="执行" and io.name="变更请求" return p.name

2.png

注意事项

每次导入文件的时候都需要把原有data目录清空，然后把需要的节点、关系一次导入，不能分批导入。
后面如果更新的话还要把原有data全部情况，再把所有数据一次性导入，生产环境下切记保留原始数据！！！

后记

在项目管理知识体系中还有其他更复杂的关系，比如哪些概念易混淆、哪些概念之间有包含关系等等，这些信息都可以经过结构化之后加入知识图谱。

最后编辑于：2019.12.18 00:05:24