定责知识图谱
1. 国际疾病分类标准ICD(实体:科目、一级分类、二级分类、身体部位一级、二级)
- 中国标准服务网 GB/T 14396-2016 【现行】疾病分类与代码 https://www.cssn.net.cn/cssn/productDetail/4d673aae36c13f6133a39835e8ac650d
2. 药物用品库:(属性:甲乙丙类、各地医保支付比例)
- 卫健委《国际基本药物目录》http://www.nhc.gov.cn/wjw/jbywml/list.shtml
- 医保科技从国家医保服务平台获取药品清单https://fuwu.nhsa.gov.cn/nationalHallSt/#/search/drug-directory
3. 卫健委标准临床路径库: 1010个临床路径清单,2016版1010个+2019版224个 (共1234个)
- https://www.cma.org.cn/art/2016/12/9/art_41_18009.html(可知识抽取实体:疾病、诊断、用药、治疗方案)
- 用于定责评估疾病用药、治疗方案是否合理
4. 全国医院库:属性(是否三甲、地区省市)
-
医学百科数据库+各地理赔机构实际整理修正
第三方医疗知识库
国外:
1. Linked Life Data
- 语义数据集成平台,包括结构化数据库、术语库、半结构化文档
- 40 多亿三元组(实体关系)
- 其知识内容涵盖基因、蛋白质、疾病、药物、分子相互作用、通路、靶点和临床试验相关信息
2. SNOMED CT
- 由2大医学术语库SNOMED RT 和 CTV3 (Clinical Terms Version 3)合并而来
- 35 万实体、125 万描述和 116 万关系
3. UMLS
- 超级叙词表(Metathesaurus)——词汇库,444 万实体和 1610 万实体名称
- 语义网络(Semantic Network)——为词汇库提供统一的分类,共有 127 种;提供实体类型关系,54种,包括等级关系和相关关系
- 专业词典和词汇处理工具(SPECIALIST Lexicon and Lexical Tools)——为词汇库提供构建和维护,包含约 45万条生物医学和常用英语词汇条目以及 80余万条词汇变化形式——类似外部标准知识库,用于本体的实体对齐和消歧
国内:
研究所:
1. 中文医学知识图谱CMeKG2.0版:
- 开发者:北京大学、郑州大学以及鹏城实验室联合研发
- 1万余种疾病、近2万种药物、1万余个症状、3千种诊疗技术的结构化知识描述,描述医学知识的概念关系及属性三元组达156万
- 实体范围:疾病、药物、诊疗技术及设备、有机体、解剖学等
2. 中文一体化医学语言系统(CUMLS)
- 开发者:中国医学科学院医学信息研究所基于 UMLS 开发的中文一体化医学语言系统,其包含医学词表、语义网、构建工具与平台
- 医学主题词 3 万多条、入口词 3 万多条、医学术语 10 万多条和医学词汇素材 30 万多条。
3. 中医药学语言系统(TCMLS)
- 开发者:中国中医科学院中医药信息研究所主持研究和创建的基于本体的中医药学术语系统。
- 约 12 万概念、30 万术语和 127 万语义关系
4. 医药卫生知识服务系统
- 开发者:中国医学科学院医学信息研究所承建,旨在建立具有公益性、开放性的医药卫生知识服务平台
- 1500 万条相关可检索资源
- 疾病和药品领域知识图谱,其中疾病:心脑血管疾病、呼吸系统疾病、免疫系统疾病、消化系统疾病、肿瘤
5. OMAHA 知识库
- 开发者:浙江数字医疗卫生技术研究院
- 包含医学相关的67 种语义类型和 488 种关系
- “七巧板”术语集:负责清晰定义医学概念,目前已积累发布了 98 万概念、125 万术语和 292 万关系,与主流医学术语集如 ICD-10、ICD-9-CM-3 和药品医保目录等建立映射的映射扩展集
- “汇知”图谱:丰富和延展医学概念相关的内容,如相关检查,包括15.4 万实体、97.8 万三元组,知识来源临床指南、临床路径、药品说明书、医学书籍和医学文献
专业公司:
1. 丁香园医学数据开放平台:
- 主实体:疾病、药品、医院、治疗方案
- 数据来源卫健委、WHO、药监局、人民卫生出版社教材、CNKI、UTD、维基百科
2. 医脉通
- 临床指南:全球全科室2000+机构的临床指南,文档检索,无知识图谱结构化
- 百科知识:医学检验、疾病诊断筛查、治疗流程,由编审团队各合作医院医生人工录入
- 用药大全app:层级(按国家基本药物目录):适应症》治疗靶向》具体药品,关系:相互作用、禁慎用群体
3. 百科名医
- 实体:疾病、症状、检查、治疗方案、预防、护理
- 百科知识库,来源于合作医生数据整理和参考医学文献、公开数据,以长文本数据为主,未形成结构化知识图谱
互联网大厂:
1. 腾讯医疗健康:
知识图谱:300万个实体、2100万条关系
CV:病理云影像分析、帕金森动作分析预防
2. 阿里Doctor you
CV对医学影像学习判断、糖尿病用药引擎(专病用药规律研究)
3. 百度灵医
系统精选疾病知识9700+,典型病例3600+,国家临床路径1200+,医学词典17万+,医学计算器270+,心电图760+,临床检验330+,临床决策知识2600+
4. 平安医疗科技:
60万医学概念、530万医学关系
养生健康知识图谱
中科院研究所刘焕勇
https://github.com/liuhuanyong/QASystemOnMedicalKG
实体类型 | 中文含义 | 实体数量 | 举例 |
---|---|---|---|
Check | 诊断检查项目 | 3,353 | 支气管造影;关节镜检查 |
Department | 医疗科目 | 54 | 整形美容科;烧伤科 |
Disease | 疾病 | 8,807 | 血栓闭塞性脉管炎;胸降主动脉动脉瘤 |
Drug | 药品 | 3,828 | 京万红痔疮膏;布林佐胺滴眼液 |
Food | 食物 | 4,870 | 番茄冲菜牛肉丸汤;竹笋炖羊肉 |
Producer | 在售药品 | 17,201 | 通药制药青霉素V钾片;青阳醋酸地塞米松片 |
Symptom | 疾病症状 | 5,998 | 乳腺组织肥厚;脑实质深部出血 |
Total | 总计 | 44,111 | 约4.4万实体量级 |