模型概述
根据PMBOK指南(项目管理知识体系指南)第6版,首先建立三个核心概念之间的关系:项目管理过程、工具与技术、输入输出。
其中,每个过程(Process)有若干个输入(INPUT)、工具和技术(TT)和输出(OUTPUT),当然,各过程的输入输出工具与技术都可以复用,因此形成了复杂的多对多关系。
三个核心概念和它们之间的关系都事先写到文本文件中批量导入。
准备文件
文件process.csv记录了49个过程的信息,格式如下,
processId:ID,name,knowledgeArea,processGroup,describe,:LABEL
p01,"制定项目章程","整合","启动","编写...",Process
p02,"制定项目管理计划","整合","规划","协调项目...",Process
……
processId表示过程ID,在Neo4j全局这个ID必须唯一,跟任何类型的节点ID都不能重复。name,knowledgeArea,processGroup,describe是节点的属性,LABEL指出该节点类型,本文件中节点类型都是Process
文件TT.csv记录了136个工具与技术的信息,格式如下,
ttId:ID,name,sort,describe,:LABEL
tt001,"标杆对照","数据收集","指将实际...",TT
tt002,"头脑风暴","数据收集","用于在...",TT
……
本文件中节点类型都是TT
文件IO.csv记录了85个输入输出的信息,格式如下,
ioId:ID,name,sort,describe,:LABEL
io01,"范围管理计划","项目管理计划","确立...",IO
io02,"需求管理计划","项目管理计划","确定...",IO
……
本文件中节点类型都是IO
导入
下面把三个文件导入neo4j
进入neo4j根目录,删除原有data目录:
rm -rf data
把csv文件上传到服务器,我直接传到neo4j根目录,执行下面语句导入
bin/neo4j-admin import --nodes process.csv --nodes io.csv --nodes tt.csv --multiline-fields
multiline-fields参数表示字段中允许换行
重启neo4j服务
bin/neo4j restart
因为删除了data目录,再次登录时密码重置为neo4j,需要再次修改
执行
match(n) return n
结果如下,因为没有设置节点之间的关系,只展示了三类节点
建立节点之间关系
接下来写一个文件relation.csv记录节点之间的关系:
:START_ID,:END_ID,:TYPE
p01,io53,INPUT
p01,io54,INPUT
p01,io72,INPUT
p01,io55,INPUT
p01,io56,INPUT
p01,tt098,TT
p01,tt002,TT
p01,tt005,TT
p01,tt006,TT
p01,io57,OUTPUT
p01,io22,OUTPUT
:START_ID表示关系的开始节点,:END_ID表示结束节点,:TYPE表示关系类型。解释一下第一行,p01节点代表“制定项目章程”过程,io53节点代表“商业论证”这个文件,INPUT表示输入关系,因此这行表明制定项目章程的一个输入是商业论证
删除data节点,完整执行下面语句:
bin/neo4j-admin import --nodes process.csv --nodes io.csv --nodes tt.csv --relationships relation.csv
重启动neo4j服务器,可以查看完整关系图如下,展现出了各种关系。
查询
接下来就可以进行图查询了,
查询“制定项目章程”这个过程的工具和技术,语句如下:
match(p)-[:TT]-(t) where p.name="制定项目章程" return (p)-[:TT]-(t)
结果如图:
查询执行过程组中哪些过程输出了“变更请求”
match(p)-[:OUTPUT]-(io) where p.processGroup="执行" and io.name="变更请求" return p.name
注意事项
每次导入文件的时候都需要把原有data目录清空,然后把需要的节点、关系一次导入,不能分批导入。
后面如果更新的话还要把原有data全部情况,再把所有数据一次性导入,生产环境下切记保留原始数据!!!
后记
在项目管理知识体系中还有其他更复杂的关系,比如哪些概念易混淆、哪些概念之间有包含关系等等,这些信息都可以经过结构化之后加入知识图谱。