摘要
台湾国家健康保险研究数据库(NHIRD)举例说明了人口级别的数据源,用于生成现实世界的证据来支持临床决策和医疗保健决策。像所有索赔数据库一样,使用NHIRD进行的研究也存在一些有效性问题,例如诊断代码的准确性以及未测混杂因素的问题。努力验证诊断代码或开发解决未测混杂因素的方法已大大提高了NHIRD研究的可靠性。最近,台湾卫生福利部(MOHW)建立了一个卫生福利数据中心(HWDC),该数据存储站点集中了NHIRD和大约70个其他与健康相关的数据库,用于数据管理和分析。为了加强对数据隐私的保护,要求调查人员通过与MOHW服务器的远程连接在HWDC进行现场分析。尽管对现场分析的严格规定给分析人员带来了不便,并增加了研究所需的时间和成本,但HWDC通过将NHIRD与其他数据库连接起来,为丰富研究范围创造了机会。在不久的将来,研究人员将有更大的机会通过使用包括机器学习和自然语言处理在内的人工智能技术,从NHIRD提取与医院电子病历数据库相关的知识,该数据库包含非结构化的患者水平信息。我们相信,拥有多个数据源的NHIRD可以代表强大的研究引擎,具有丰富的维度,并且可以作为台湾现实世界中循证医学的指南。