源数据与源文件
源数据和源文件是临床试验行业必须面对的两个概念,这两个概念都在ICH-GCP中有明确的概念。笔者无意于混淆视听,仅想在ICH-GCP的概念下和大家分享下自己对源数据与源文件的零思碎想,如有不对之处,还望各位同道批评指正。
一、源数据:
根据ICH-GCP的定义,源数据是在临床试验过程中的临床发现、观察和其他活动的原始记录或复印件(核证副本)上为重建和评估临床试验所必须的所有信息。从这一定义可以看出:
1、从来源看,源数据是临床试验中产生的,医学常规或实践中产生的不属于ICH-GCP中讨论的源数据。
2、从作用看,源数据是用于重建和评估临床试验的,临床试验中也可能产生其他一些医疗信息,如血常规中不属于研究搜集数据范围内的检查值。但也有特殊情况,一旦这检查值有了异常,研究者就需要对该些数值进行临床意义的判断了,无论判断结果有没有意义,都是为了对患者在参与临床试验中的安全性信息进行的评估,也就属于了源数据。这也指出了,源数据是具有相对性的,是相对于研究采集数据而言的。
3、从载体看,源数据是临床试验过程中的临床发现、观察和其他活动的原始记录或其复印件(核证副本)上的信息。
4、从本质看,源数据是…...信息,因此可以是数值、图像、文字、日期、语音、视频、声波等信息的任何形式。但临床试验中,常见到的或常规使用的主要是数值、图像、文字、日期这几项,语音或视频未来可能会越来越多,声波或超声波或其他访视也可能会随着人类探索世界或宇宙科技的不断发展逐渐加入进来。
5、从可预见性看,源数据是重建和评估临床试验所必须的所有信息,涵盖了临床试验所采集数据,方案设计初始能够而且应该确定出采集数据的源数据来。
6、从分类看,a,根据载体分类,可以将其分为纸质数据,电子数据或其他介质数据(比如光盘、U盘、磁带等)。b, 根据产生的类型,可以分为客观性数据和主观性数据(参考广东药学会《药物临床试验 源数据管理 广东共识》)。客观性数据属于客观情况产生的,无法修改,但客观性数据可能会因仪器设备的问题出现偏差,这时就需要使用经校准核验的仪器设备采集,以获取正确的客观性数据,数据一旦产生,便无法进行更改,除非有充足的原因和书面的说明。主观性数据,属于研究者、患者或其他临床试验参与人员根据客观性数据所做的诊断、评估或量表应答或信息交流,会因人的知识面,经验值和客观环境的影响而出现偏差和不一致,因此主观数据是可以也可能会被修改的,但修改一定要有一定的依据和原因,要有符合临床试验要求的修改轨迹。
7、从原始性看。源数据是…...原始记录或其复印件(核证副本)上…...。但由于某些研究的问卷直接由研究者问诊于患者且直接记录在研究数据收集系统(CRF或eCRF)中的,因此ICH-GCP也认可该些数据为源数据。如果真出现了这种情况,方案设计时应该提前在方案里面进行说明,或至少在采取该措施前向伦理委员会进行备案说明。
二、源文件:
根据ICH-GCP的定义,源文件是原始的文件、数据和记录。然后举了一系列的例子,说明哪些是源文件。笔者刚看到时是一头雾水:源文件是原始文件可以理解,源文件也可以是原始的数据和记录。那不就和源数据没啥区别了么?但笔者在扣字眼时发现这里的数据和记录是复数概念。因此笔者认为,源数据是对应一个研究采集数据项的,源文件可以同时涵盖多个研究采集数据项,属于源数据的存储载体。
源文件是源数据的载体,记录或承载源数据的一定是源文件,但源文件上承载的不一定全部是源数据。这也可以使用上面源数据所举的血常规的例子,血常规中还含有一些不属于研究搜集数据范围内的检查值,这些检查值属于医疗常规检查值,但对于重建研究和评估研究并不见得有什么意义。
源文件是源数据的载体,可以有纸质的和电子的,也可以有其他介质的(比如光盘、U盘、磁带等)。这里让笔者想起以前和同事讨论的一个问题:word打印版的病历可否作为源文件使用?根据ICH-GCP的定义,没有说明哪种类型的文件不可以作为源文件,但对源文件的要求以及源数据的要求都已经有了明确的说明——ALCOACCEA原则。如果经研究者签字签署日期确认的word打印病历被定位为源文件,那么它一定要:1、电脑里面未经签字的电子版本病历有时间序列的轨迹,以证明该文件是与所记录内容同时产生的,是第一手的;2、修改的部分必须在纸质版上面进行修改,而且修改轨迹清晰可循;3、该种源文件记录,必须在机构内部是认可的,如果机构都不承认,是为非法的数据。弱弱的提醒一下,在新修版的中国GCP中是有明确指出,研究者应该将研究相关信息记录在医院门诊或住院系统中的。
源文件是源数据的载体,任何源数据的修改,都意味着源文件内容的变化。但源文件是源数据的原始记录载体,不应该随意变动,任何原因的变动,都应该有相应的理由或说明的支持。有些医院的病历是记录在医院His系统,由研究者电子签字后存档,之后又打印了手写签字存档的。当发生医疗纠纷时,或一些医院的医疗系统声明中,纸质版的手写签字病历是作为具有法律效力的文件的,这样的情况下一定要有相关的说明或声明存档。有些医院因纸质文档存储空间的问题,甚至会对纸质版病历扫描后,以扫描版的电子病历作为源文件提供给申办方。这时监查员也一定要在选中心访视中及时获知该些情况,并进行相应的报告与存档。
当源数据直接记录在CRF或eCRF中时,该部分的CRF或eCRF即成为了源文件,但这一定要在方案中进行说明,或提前递交伦理进行备案。
当原始记录的源文件无法获取时,经核验的副本也可以被接受为源文件,但一定要有相应的核验(复印人签字和签署日期)或认证,文件内容必须清晰可辨,文件的修改必须有轨迹可循。
源数据定位表或定位协议的设计原则和使用的意义浅思
基于以上对源数据与源文件的思考,笔者也将对目前很多公司采用的源数据定位表类的文件的使用意义和设计原则的思考分享与诸位,敬请贻笑之批评之。
一、使用意义浅思:
有些公司虽然已经开始采用该种表格,但因对国家局现场核的恐慌和不同参与人员对源数据以及源文件理解的不一致,总是可以听到对这种表格的使用是否有必要的质疑:表格的使用很可能会给自己挖坑,因为不论用不用该表,国家局现场核查都会按照自己对source的理解进行。笔者原来也是浑浑噩噩使用该表的,以为该表格是各大医药公司或CRO应对7.22风暴的一种措施,一种不得已而为之的行为。殊不知,很多有经验和比较规范的大型医药研发公司或CRO早在2015年前就已经开始采用这样一种表格,他们大部分的依据是申办方对临床试验数据质量管理所承担的责任,也是申办方选择中心时评估中心源数据和源文件管理的一种现实措施和佐证。随着与不同背景、不同领域的领导和同事们的交流和探讨,随着在工作责任的驱动下对本表的修改过程中遇到种种问题的思考,笔者也在不断整理着自己的思路:
1、该类表格的使用,不是对源数据或源文件的定义,而是在坚持ICH-GCP中对源数据和源文件定义的基础上,对源数据和源文件确认的表格。因此,本表格所坚持的源数据和源文件的概念与国家局的核查员是一致的,不存在自挖坑的问题。
2、该类表格的使用,可以清晰勾勒出研究所需源数据和源文件在研究中心的图谱,为临床试验数据质量管理提供风险分析的依据,也可以为监查员SDV廓清范围,为SDR提供按图索骥的方便。
3、表格的提前设定与签署,也可以提醒研究者在研究过程中始终一致的记录源数据,避免不必要的随便记录、重复记录以及拖延记录。
4、表格的签署,也可以为核查、稽查时高效快速查询源数据和源文件提供依据,为研究数据的可信性和完整性提供参考依据。因此,笔者支持本表格的使用,也会不断努力完善本表格的内容。
二、设计原则浅思
临床试验是为了采集药物的有效性数据和安全性数据而开展的,因此一个合理设计的临床试验,应该清晰知晓需要采集的数据,而采集的任何数据都必须由一个源数据与之对应。没有源数据支持的研究数据的真实性是受到质疑的,而源数据需要一个载体——源文件进行保存,具体保存在哪种文件上则会因医院的主客观原因有所不同。因此很多公司都采用了一种类似源数据定位的表格或协议(广东药学会《药物临床试验 源数据管理 广东共识》里面也有专门讨论和建议)。该类表格的形式一般都会包含源数据、源数据的载体和备注三个部分,有些还会根据公司数据管理目的或研究目的设置一些其他栏,比如是否在医院系统查询到,源文件存储的科室或具体位置等,但无论如何,该表格都应该体现下原则:
1、协作性:该类表格的设计和完成是申办方和研究者共同参与完成的。申办方提前列清楚本研究所采集研究数据的源数据,并对特殊情况的数据项进行说明,比如直接填写到CRF或eCRF中的源数据的说明,比如说必须搜集哪种源文件作为病史资料的证据。研究者负责确认研究采集数据的源数据在本中心的载体——源文件,并对特殊情况进行说明,比如多个源文件上出同一个研究采集数据的情况时对源数据的辨认和澄清或根据患者研究访视方式等的不同造成的同一个源数据项出现在不同的源文件上的情况的解释说明。在笔者看来,源数据定位表的确定和完成还离不开研究中心临床试验管理方的机构办公室。因为有些源数据的定位研究者可能也不熟悉,机构的加入可以从医院方给以更精确的定位。况且,有些医院的源文件不一定是最先产生的,比如以扫描件为源文件或以打印签字版的His文档为源文件的医院,如果没有和机构协商清楚,研究者如果也没有很好的知晓,机构有时会是不会承认申办方与研究者的单方的签字表的。因此笔者理解本表格最还好是称为协议,即使机构不参与签字,监查员也应该在自己的报告中清楚记录与机构沟通情况及不签字原因。
2、开放性:该类表格的源数据是申办方的项目组根据研究采集数据提供的,但源数据应该罗列到何种程度,多少个则需要根据各研究的实际情况而定。原则上来说,越详细的源数据罗列越有利于定位的精准。但笔者不建议事无巨细都罗列上去,举个例子,比如说实验室检测值,是否有必要罗列到血常规检测值或生化常规检测值呢?或再详细点到血小板或肌酐值呢?笔者建议以源数据项——相同类型、同时采集或同时报告在相同的源文件上——来设置源数据项,没有必要再进行细分,否则罗列的数据那可就多了去了。当然,这些要和研究的实际采集数据情况相一致。另一方面,研究者对源数据的定位——源文件的探寻也是开放性的,研究者在理解了申办方提供的源数据项时,确认本中心源数据最先记录的文件——源文件。
开放性还体现在另外的方面,本表格一般来说是相对稳定使用的,最好始终如一。但万一某中心出现了源文件的更改信息时,研究者有义务提醒监查员该情况,并及时更新该表格,表格更新的原因,应该以书面的形式记录下来。监查员在监查过程中如果发现实际的源数据所在的源文件与研究者确认的不一致时,也应该及时与研究者确认原因,如有必要,应启动本表格的更新,并书面记录原因。如无必要更新本表格,应将该不一致书面记录并与本表存档。
3、互补性:针对于源数据项的设置,申办方的项目组应该根据本研究的数据采集情况进行设定,但应该坚持各源数据项设置的互补性,尽量不要出现重复的源数据项。如真是出现了互相间有重复的源数据项,项目组应该增加该源数据项采集源数据的说明。比如:入排标准,可以设置成入排标准评估,无法获取佐证或客观数据支持的入排标准记录,有客观数据或佐证资料(验单或影像学,病理学资料等)支持的入排标准。如果设置入排标准、实验室结果和影像学报告和病理学报告,往往就会造成源数据的重复出现,这时就应该对入排标准源数据项进行说明,说明所涵盖的具体源数据而不与实验室结果、影像学报告和病理学报告重复。
4、唯一性:根据源数据和源文件的定义,源数据与源文件应该是唯一且一一对应的。但现实中往往因研究情况或研究中心情况的复杂性会出现一些不一致的现象。比如,患者知情过程记录源数据项,因为患者有些是门诊访视知情,有些是住院病历知情,因此源数据项在一个中心可能就会因患者访视方式的不同出现了不同的载体——源文件。同一个患者的研究访视,可能是住院访视,也可能是门诊访视,因此研究过程或相关内容的记录,可能是住院病历也可能是门诊病历。这时就需要对本源数据项和源文件的对应关系进行备注说明,以清晰的了解不一致情况和具体原因。