1. 明确研究问题,选择研究类型
(1) 诊断类问题: 其预测因子与结局均在同一时点或很短的时间内,适合采用横断面研究数据构建诊断模型;诊断模型研究中,需要有“金标准”来单独诊断疾病,且“金标准”的诊断应该在“盲法”状态下进行,即“金标准”的诊断不能借助预测模型中的预测因子信息,以避免诊断评估偏倚。
(2) 预后类问题: 其预测因子与结局有纵向的时间逻辑,适合采用队列研究数据拟合预后模型。预后模型研究中,预测因子与结局的本质就是纵向关系,且研究者通常希望获得在自然状态下疾病的转归,因此前瞻性队列研究是预后模型最常见,也是最佳的研究设计类型。
2. 设计与实施,数据质控与管理
若为全新研究,则应从研究方案、研究者操作手册、病例报告表、伦理批件等相关文件的准备开始,并进行数据质控与管理;若为基于其它研究数据开展的研究,也应对数据质量进行评估。
3. 建立临床预测模型
建立模型前,应明了已知的、已报道的预测因子,确定入选预测因子的原则及方法、选用模型的类型(通常为Logistic模型或Cox模型)。拟合模型、估算模型参数后,需要借助区分度(discrimination),校准度(calibration)等指标评估模型的性能。
4. 验证临床预测模型
预测模型的效果很有可能因场景、人群的改变而变化。因此,完整的预测模型研究应包括模型的验证。验证的内容包括模型的内部效度和外部效度。内部效度体现模型的可重复性(reproducibility),利用研究项目本身的数据通过交叉验证(cross-validation)、Bootstrap 验证等方法来回答;外部效度体现模型的普遍性(generalizability),需利用研究项目本身以外的数据(从时间上、地理上独立或者完全独立的数据)来回答。
5.评价临床预测模型的应用与影响
临床预测模型的最终意义在于应用临床预测模型是否改变了医生/病人的行为、改善了病人的结局或者成本效应,此即临床预测模型的影响研究。与临床预测模型的验证不同,影响研究需要设计随机对照试验,且通常为整群随机对照试验来评估。
6.临床预测模型的更新
即便是经过良好验证的临床预测模型,由于疾病危险因素、未测量的危险因素、治疗措施以及治疗背景等随时间变化,模型性能因此下降,即校准度漂移(calibration drift)。因此,临床预测模型需要不断进化、动态更新。