在医学统计学当中,对诊断试验的定义,统计学原理、方法都有明确的说明。这里仅对学习中发现的容易混淆和忽略的问题进行阐明。帮助我们正确的运用诊断试验这一方法,以正确的思路设计诊断试验。
一、什么是诊断试验?
“运用临床资料、实验室检查、X线等较科学、准确的措施,将有病者与无病者鉴别开来。对于诊断实验“有病患者”可判定为病人,并及时进行下一步治疗。”----百度百科。
诊断试验,与实验室诊断等项目关系密切。诊断实验理论是实验诊断学的基础,而临床科研中的实验诊断的涵义远大于物理方法、化学方法、生物学方法。所有旨在区分几预判的研究都诊断试验的特征。
二、诊断试验的用途及要求
诊断试验,终极的作用是为了区分。把对象分为不同的种类,以便开展后续的诊疗工作。因此,诊断实验可以有多种用途,包括且不限于
- 患者或高危人群的发现。
- 治疗效果的评价。(判断预后)
- 药物副作用的监测。
统计学重要的意义,就是对现况的理解,并基于此对未来开展预判,以提升效能,减少损失。正是因此,诊断试验很难做到100%的准确和敏感,但基于不同的目的,我们可以选择更高敏感度的(用于筛查),更高特异度的(用于开展有创处置),以及量化能力较高的(开展效能分析)。
三、诊断试验的研究设计
Gold Standard。
多数诊断试验需要与金标准进行比较。金标准是公认最为可靠的,但因为其某些方面的弱点限制应用,如时效性、技术难度、费用等,因此采用某个,或某组指标建立模型,并进行比较。Control。
诊断试验的设计,一定要精心设置对照。以便检测诊断试验的效能。Sample。
基于不同的使用目的,诊断试验在针对不同的受试者会出现巨大的差异。试验对象需要有明确的代表性,也只有明确了研究对象的诊断试验,才能将研究方法应用在正确的人群,保证研究的可重复性。
四、统计学方法
通常,如果有金标准,试验方法都比较简单明确。但部分情况下,行业缺乏明确的金标准则设计研究会比较困扰。
首先,我们检测的样本则需要有明确的研究终点。需要对不同的模型之间开展Spearman相关系数的比较,并开展Z校验,比较两两差异。通常各种模型基于不同的样本,效能会存在差异。很难出现一种非常卓越的方法。这时就要对样本进行分组,降低样本的异质性。以降低使用范围来提升试验的信度。
而且,我们要采用标准方法,采用训练集与验证集(包括内部、外部)反复验证模型的科学性。对准确性、重复性、预测值等指标,都应该进行详细的交代。(validity,reliability,repeatability,predictive value)。
第三,通过单一模型难以取得突破时,还可以考虑采用串联试验,巧妙的提升诊断试验的效能。这一点需要多做常识。
以上,是对诊断试验的阶段性的思考。与大家共勉。