实体瘤疗效评估,一言以蔽之,将肿瘤定量、定性的观察结果转化为对肿瘤疗效的定性评估。
临床试验数据分析中,与肿瘤相关的SDTM数据集为TU、TR以及RS,这篇文章将从RECIST 1.1标准出发,梳理这3个数据集的内容。文章分为两部分,第一部分为RECIST 1.1内容的简述,第二部分为肿瘤相关SDTM的内容处理。
1. RECIST 1.1 简述
RECIST 1.1,Response Evaluation Criteria in Solid Tumours (Version 1.1),实体瘤疗效评估标准 1.1版。
相关内容描述如下:
- 定量观察,指的是各靶病灶的直径以及所有靶病灶直径总和,以此表征肿瘤负荷的大小;
- 定性观察,指的是非靶病灶的存在状态,以及新病灶出现与否;
- 定性评估,指的是结合定量、定性观察,按一套既定标准进行判定单个时点的肿瘤疗效,以及综合所有时点疗效判定最佳总体疗效。
实体瘤评估的具体过程是,在基线选定一定数量的靶病灶与非靶病灶,并计算所有靶病灶的直径总和。在基线后的各时点上,计算靶病灶的直径总和,并与基线相比较,评估该时点靶病灶的疗效;同时,研究人员也会定性评估非靶病灶的疗效,观察并记录是否有新病灶出现。
结合各时点的靶病灶、非靶病灶疗效以及是否出现新病灶,评估出受试者在该时点的总体疗效,进而综合所有时间点疗效评估出最佳总体疗效。
这就是RECIST 1.1的整体脉络,完整内容参考临床试验-肿瘤:RECIST 1.1 中文版 (v1.0)。
1.1 肿瘤病灶与淋巴结病灶
在RECIST 1.1标准中,实体瘤有2类,肿瘤病灶与病理性淋巴结。如果在影像学某一维度上的测量,发现了肿瘤病灶,就可以说明实体瘤存在。而淋巴结是人体的正常组织,当淋巴结在某一维度上测量的短径<10mm时,被认为是正常淋巴结;当短径≥10mm时,被认为是病理性淋巴结,这种情况可以说明实体瘤存在。
1.2 可测量与不可测量
长径≥10mm的肿瘤病灶,以及短径≥15mm的淋巴结病灶,定义为可测量的病灶,其余病灶定义为不可测量。对于病灶可测量的直观理解是,病灶够大,方便后续随访测量。(参考RECIST 1.1,3.1节)
关于长短径的理解,对于非淋巴结病灶评估较为严格,选择影像学某一维度上的长径作为观察记录结果(长径记录使肿瘤“更大”);由于淋巴结是人体正常组织,淋巴结病灶评估较为宽松,选择短径作为观察结果(短径记录使肿瘤“更小”)。
1.3 靶病灶与非靶病灶 (Target and Non-target lesions)
当基线(给药之前)存在可测量病灶时,总共最多有5个可测量病灶会被认定为靶病灶(每个器官最多2个);其余可测量病灶以及不可测量病灶,会被认定为非靶病灶(数量不限)。
靶病灶选择的标准是,足够大、可以重复测量、具有代表性。在基线以及随后的随访中,靶病灶的直径都会被测量与记录(非淋巴结病灶使用长径,淋巴结病灶使用短径)。同时,也会计算所有靶病灶直径之和,以此表征肿瘤负荷,用于衡量肿瘤病情的严重程度。靶病灶直径之和越大,表示肿瘤越大,病情越严重。
非靶病灶,不管是可测量病灶还是不可测量病灶,无需测量具体径长,只需在基线以及随后各个时点对其进行定性判断——存在 (Present)、不存在 (Absent)、疾病进展 (Unequivocal Progression)。(参考RECIST 1.1,4.2节)
1.3.1 靶病灶的评估
通过基线后各时点的靶病灶直径总和与基线直径总和的比较,可以确定靶病灶的客观疗效,即将所有靶病灶的定量数据转化为单一的、定性的疗效评估,评估结果如下:
- 完全缓解(Complete Response, CR): 所有靶病灶消失。任何病理性淋巴结 (无论是否为靶病灶) 的短径必须缩短至 <10 mm。
- 部分缓解(Partial Response, PR): 以基线直径总和作为参考值,靶病灶的直径总和至少减小30%。
- 疾病进展(Progressive Disease, PD): 以研究中的直径总和的最小值作为参考值,靶病灶的直径总和至少增加20% (如果基线总和是研究中的最小值,则参考值为基线总和)。除了相对增加20%,总和增加的绝对值还必须至少是5毫米 (注意:出现一个或多个新病灶也被认为是疾病进展)。
- 疾病稳定(Stable Disease, SD): (直径总和) 既没有减少得足够多,以达到PR;也没有增加得足够多,以达到PD (以研究中的直径总和的最小值作为参考值)。
1.3.2 非靶病灶的评估
在试验各个时点上,只需对非靶病灶进行定性评估,即使一些非靶病灶是可测量的。研究人员会综合所有非靶病灶的情况,给出非靶病灶的总体定性评估,评估结果如下:
- 完全缓解(Complete Response, CR):
所有非靶病灶消失,肿瘤标志物水平正常化。所有淋巴结的大小必须是非病理性的(短轴<10mm) 。- Non-CR/Non-PD: 一个或多个非靶病灶持续存在和/或肿瘤标志物水平维持在正常值上限以上。
- 疾病进展(Progressive Disease, PD): 现有非靶病灶的明确进展(见下文评论)。(注意:一个或多个新病灶的出现也被认定为是进展)。
1.4 新病灶 (New lesions)
新的恶性病灶的出现意味着疾病进展,在基线后的各时点中,新病灶的出现都将会被记录。(参考RECIST 1.1,4.3.5节)
1.5 肿瘤的疗效评估
1.5.1 时间点疗效 (Time point response)
在基线后的每一个访视时间点,会结合靶病灶评估、非靶病灶评估以及是否出现新病灶,对肿瘤状态进行总体性评估。
当患者在基线有可测量病灶时(即有靶病灶),时间点总体疗效评估如下:
当患者在基线仅有不可测量病灶时(即无靶病灶),时间点总体疗效评估如下:
1.5.2 最佳总体疗效:所有时间点 (Best overall response: all time points)
一旦获取患者所有时间点疗效,就可以综合确定最佳总体疗效。直观地讲,最佳总体疗效就是所有时点中疗效最好的评估。评估的优先级为:CR > PR > SD > PD > NE。
不过,在疾病缓解作为主要终点的非随机试验中,需要确认PR和CR,以确保疾病缓解不是由测量误差造成的。如果疗效需要确认,最佳总体疗效的确定就会复杂得多,通常会在ADaM中进行处理,这里就先不展开。
1.6 独立审查
对于以客观缓解(CR + PR)为主要终点的试验,建议所有得出的疗效应由独立于研究的专家进行审查。进行独立审查的试验,所有影像学扫描都会进行存档,将会由处于盲态的独立中心审查 (Blinded Independent Central Review, BICR ) 团队进行疗效评估。Site现场进行肿瘤评估的研究人员称为Investigator,独立中心审查人员称为Independent Assessor。
评估人员的角色信息,会保存在--EVAL变量中。一般试验方案会指明,研究分析的终点是基于Investigator的判断结果,还是基于Independent Assessor的判断结果。
1.7 疗效评估结果的获取
通常,CRF数据会直接收集各时点的靶病灶疗效、非靶病灶疗效以及时间点总体疗效,所以不需要申办方进行单独衍生。关于最佳总体疗效,数据供应商不一定提供, 如不提供,试验方案或SAP需详细描述其衍生规则,申办方自行衍生。
2. 肿瘤相关的SDTM数据集
在SDTM标准中,与肿瘤相关的数据集为TU、TR、RS。SDTM是按照一定规则,对原始数据进行整理,即内容来源于原始数据,但形式更加“标准”, 方便后续核查与分析。
2.1 TU (Tumor Identification)
在SDTMIG v3.2中文版中,TU翻译为肿瘤标识,这里可以给它一个昵称——肿瘤身份证,即TU收集肿瘤的“身份证明”信息。
2.1.1 “身份证号”——TULNKID
对于肿瘤,一个关键的信息是“身份证号”,其作为肿瘤存在的标志,会保存在TULNKID变量中。
变量TULNKID 的值是复合值,可能包含评估者角色 (Investigator or Independent Assessor)、肿瘤分类信息(靶病灶、非靶病灶、新病灶)、肿瘤记录编号以及肿瘤分裂或融合信息。
在RECIST 1.1标准中,随访过程中的肿瘤被分为3类:靶病灶、非靶病灶以及新病灶。靶病灶与非靶病灶由研究人员在基线时进行选择与判定,在基线后的随访中,新病灶会被观察记录。在CRF对应页面中,3类病灶会有对应的标号(不同公司,标号名称可能不同),例如:
Target Lesion: T01-- T05;
Non-target Lesion: NT01--NT99;
New Lesion: NEW01--NEW10.
如果试验中不存在独立评估者,TULNKID可以直接取CRF上的肿瘤标号,如T01, NT01, NEW01。
如果试验中存在独立评估者,不同评估者判定的记录所对应的TULNKID需要包含评估者角色信息。例如,对于现场研究人员评估的肿瘤结果,TUEVAL = "INVESTIGATOR",TULNKID = "T01-INV"
;对于独立评估者的结果,TUEVAL = "INDEPENDNT ASSESSOR",TULNKID = "T01-ICR"
。
2.1.2 主题变量TUTESTCD
主题变量的主要取值为 TUTESTCD = "TUMIDENT",TUTEST = "Tumor Identification"
。其对应的结果取值TUORRES一般有3个,对应3个肿瘤分类:
- TARGET
- NON-TARGET
- NEW
这三个变量可以基于CRF的Form信息或者收集的肿瘤标号,进行Mapping。CDISC标准CT中,TUTESTCD有17个取值,若项目中还有其他肿瘤标志信息,可以以此参考。
2.1.3 肿瘤的分裂与融合
在RECIST 1.1中,肿瘤的分裂与融合仅在靶病灶范围内进行讨论(参考RECIST 1.1,4.3.2节)。试验研究期间,一个病灶可能会分裂成一个或者多个不同的病灶,两个或者多个病灶也可能会合并形成一个新的单一病灶。在TU数据集中,肿瘤分裂与融合的处理依赖于原始数据的收集方式。
2.1.3.1 分裂或融合前后,病灶相互关联
如果原始数据中收集了肿瘤分裂或融合前后的病灶关联信息,即保留了病灶前后的对应关系,则可以在TU数据集中展示肿瘤的分裂与融合。例如,SDTMIG v3.2中给出的示例:
SCREEN时的病灶T04在WEEK16分裂成T04.1、T04.2,如果收集的数据保留了T04.1、T04.2与T04的关联信息,则可以如下图Mapping。肿瘤融合同理。
2.1.3.2 分裂或融合前后,病灶无法关联
如果原始数据中未收集肿瘤分裂或融合前后的病灶关联信息,则无需在TU数据集中展示肿瘤的分裂与融合。
举例1,对于T1时点的病灶A,在T2时点分裂成A1、A2。但收集的数据,在T2时点仅有1条关于病灶A的记录,其径长取病灶A1、A2的径长之和,而无A1、A2的信息。这种情况下,无法从数据中获取分裂信息,TU数据集无法展示分裂。
举例2,对于T1时点的病灶A、B,在T2时点中融合成病灶C。但收集的数据,在T2时点只有病灶A、B的记录,无病灶C的记录。此时病灶A的径长取融合后的病灶C的径长,病灶B的径长设为0,并附以备注信息——肿瘤融合。这种情况下,可以知晓病灶A、B发生了融合,但对病灶C没有标记,TU数据集无法展示融合。
综上,TU数据集中,靶病灶的分裂与融合的展示取决于数据的收集方式。不过,不管靶病灶的分裂或融合如何展示,都不影响肿瘤的疗效评估。因为疗效评估是基于靶病灶的直径总和,两种展示方式,直径总和都是相同的。
2.2 TR (Tumor Results)
TR,肿瘤测量,保存肿瘤定量或定性的观察结果。文章开头有过描述,定量观察,指的是各靶病灶的直径以及所有靶病灶直径总和;定性观察,指的是非靶病灶的存在状态以及新病灶出现与否。
2.2.1 “身份证号”——TRLNKID
在TU数据集中记录的肿瘤,会进行一系列的定量或定性观察,观察结果会保存在TR数据集中,两数据集的记录通过同一“身份证号”相关联,即TULNKID = TRLNKID
。
这一点可以类比USUBJID,在DM中,每个受试者都有单一的ID标记,通过ID与其他数据集记录相关联。在TU中,每一个肿瘤都有单一的ID标记,通过ID变量与TR数据集记录相关联。
2.2.2 观察结果与其对应评估的关联——TRLNKGRP
在各时点收集的肿瘤定量、定性的观察结果,会保存在TR数据集中;研究人员基于各时点的观察,会评估出肿瘤的时点疗效,这部分内容会保存在RS数据集中。时点观察结果与时点疗效之间的关联,通过--LNKGRP
变量来表现,即TRLNKGRP = RSLNKGRP
。
具体来讲,某一时点多个靶病灶的定量观察结果,会综合成靶病灶评估;该时点多个非靶病灶的定性观察,会综合成非靶病灶评估;该时点靶病灶、非靶病灶评估以及是否出现新病灶,会综合成肿瘤时间点总体疗效。
时点的观察结果与对应的评估结果是多对一关系,这种关系可以通过为各时点赋上一个唯一值来表示,这个唯一值保存到--LNKGRP
中。
在SDTM IG示例中,--LNKGRP
的取值是一个有序序列,如A1, A2,...An (SCREEN-->A1, WEEK 6-->A2, WEEK 12-->A3...)。我当前项目中--LNKGRP
的值是直接取RawData收集的、用于记录时间窗的变量值,没有进行额外赋值,取值如:SCR, C2D1, C2D15... 。
2.2.3 靶病灶的定量观察
对于靶病灶,其可能是非淋巴病灶, 也可能是淋巴病灶。按照RECIST 1.1,靶病灶的数目不超过5个。通常,CRF收集的信息会包含单个靶病灶的直径,以及受试者所有靶病灶的直径总和。
我当前项目CRF数据集形式是,一条靶病灶记录会包含当前病灶直径以及所有靶病灶直径求和。举例如下:
径长的Mapping
关于单个病灶径长的Mapping,SDTMIG的示例没有区分是否为淋巴结病灶,统一使用 TRTESTCD = "DIAMETER" / TRTEST = "Diameter"
。目前项目中的处理是通过 TRTESTCD 值来进行区分:
- 淋巴结病灶:
TRTESTCD = "LDIAM" / TRTEST = "Longest Diameter"
- 非淋巴结病灶:
TRTESTCD = "LPERP" / TRTEST = "Longest Perpendicular"
相关CDISC标准CT信息如下 (2022-06-24) :
直径总和的Mapping
以当前项目为例,在基线时会计算所有靶病灶直径总和 (LSSUM);在基线后各时点,除了收集靶病灶直径总和外,还会收集仅为确认PD的靶病灶直径总和 (LSSUM_PD)。LSSUM为所有靶病灶直径总和,若靶病灶直径测量存在缺失值,LSSUM值也会缺失;LSSUM_PD为所有非缺失直径的求和,如果靶病灶直径测量不全为缺失值,该变量不会为空。
这里可以参考RECIST 1.1关于缺少评估与不可评估的说明,当在特定时间点完全没有影像/测量时,受试者在该时间点是不可评估的(NE)。如果在评估中只测量了部分病灶,该病例在该时间点通常也被认为是NE,除非有令人信服的依据,即单个缺失病灶的贡献不会改变指定时间点的疗效。(RECIST1.1,4.4.2节)
LSSUM_PD可用于辅助确认受试者达到PD,例如,如果一个患者基线的三次测量总和为50mm,在随访时仅评估了两个病灶,但这些评估的总和为80mm,无论缺失病灶的贡献如何,受试者都将达到PD状态。
具体的Mapping如下:
- LSSUM 记录为
TRTESTCD = "SUMDAEVAL" / TRTEST = "Sum of Diameter All Evaluated"
;- LSSUM_PD 记录为
TRTESTCD = "SUMDIAM" / TRTEST = "Sum of Diameter"
。
其他说明
除了CRF数据,一般独立中心审查也会提供病灶的相关指标信息。不同的数据供应商,提供数据的结构可能有所不同。具体的Mapping需结合Vendor数据结构,这里就不展开。
SDTMIG强调了一点,如果检测结果未收集,申办方不得在TR数据集中衍生任何测试结果(例如,“直径总和中最低点的百分比变化”),数据的衍生须在ADaM中进行。
2.2.4 非靶病灶的定性观察
在RECIST 1.1中,非靶病灶有3种描述状态:存在 (Present)、不存在 (Absent)、疾病进展 (Unequivocal Progression)。前两者信息会保存在TR数据集中,后者属于疗效评估信息将保存在RS数据集中。
在基线时,非靶病灶具有相应标号即意味着非靶病灶的存在;在基线后的各时点,会对基线存在的非靶病灶进行定性随访,判断其是否还存在 (Present/Absent)。
非靶病灶的定性观察信息对应的主题变量为,TRTESTCD = "TUMSTATE" / TRTEST = "Tumor State"
,结果变量取值为TRORRES = Present/Absent
。
不同角色的评估人员的观察结果,通过TREVAL变量进行区分 (Investigator or Independent Assessor)。
2.2.5 新病灶的定性观察
在RECIST 1.1中,对于新病灶只需判断其在基线后是否出现,出现与否的结果会纳入肿瘤时间点疗效的评估。而具体TR数据集的Mapping,需结合数据的收集形式。
SDTMIG中,新病灶的处理是,TRTESTCD = "TUMSTATE" / TRTEST = "Tumor State",TRORRES = EQUIVOCAL/UNEQUIVOCAL
。可以推测,这种处理对应的原始数据会收集新病灶的两种状态。
而在我当前项目中,CRF中会收集新病灶是否可测量的信息,如果可测量还会收集相关径长信息。具体的Mapping如下:
- 是否可测量:
TRTESTCD = "LMEASIND" / TRTEST = "Lesion Measurable", TROEERS = Y/N
- 不可测量时:
TRTESTCD = "TUMSTATE" / TRTEST = "Tumor State", TUORRES = "PRESENT"
- 可测量时-淋巴结病灶:
TRTESTCD = "LDIAM" / TRTEST = "Longest Diameter"
- 可测量时-非淋巴结病灶:
TRTESTCD = "LPERP" / TRTEST = "Longest Perpendicular"
不管新病灶的观察结果如何Mapping,研究人员在进行肿瘤时点疗效评估时,只关注其是否存在。
2.2.6 Independent Assessor的记录选择——TRACPTFL
当进行独立中心审查时,可能不止一个评估人员,例如:Radiologist 1, Radiologist 2, Adjudicator。当两个Radiologist评估结果不一致时,Adjudicator会做出裁决,从2个结果中选择一个作为最终结果。对于选定的那条记录,TRACPTFL = "Y"
;未选定的那一条,TRACPTFL = "N"
。
评估出现分歧时,Adjudicator选择记录,一般有两种方式。常规方式是,选择某一Radiologist 的所有时点评估结果(选人);非常规方式是,在每个时点上选择某一Radiologist 的评估结果(选时点结果)。
前者正常分析,没有特别需要注意的点;后者会出现受试者时点评估结果来自不同的Radiologist的情况,这涉及到基线值认定等问题,会影响后续分析,影像学章程或SAP中需要具体说明。
2.3 RS (Disease Response)
2.3.1 RS简介
RS,疾病疗效评估,收集疾病评估的信息。在SDTMIG v3.2中,RS归类于肿瘤相关域;在SDTMIG v3.3中,RS归类于QRS相关域,具体名称也有所变化,Disease Response and Clin Classification。
在IG v3.2中,关于RS会收集除肿瘤之外的疾病评估内容一笔带过;在IG v3.3中,RS会应用于更加广泛的临床分类 /分级。这里主要介绍肿瘤评估相关内容,RS的其他内容,可以参考CDISC网站中QRS的众多示例,这里不再展开说明。
2.3.2 RS收集肿瘤评估
前文1.3.1节、1.3.2节介绍了各时点靶病灶与非靶病灶的评估规则,1.5.1节介绍了肿瘤时间点总体疗效的评估规则。对于肿瘤的疗效评估,CRF会有单独页面进行收集,一般包括靶病灶评估、非靶病灶评估、新病灶出现与否以及肿瘤总体疗效。
通常评估结果直接由研究人员提供,无需申办方进行单独衍生。
2.3.3 时点疗效评估与肿瘤观察的关联——RSLNKGRP
前面2.2.2节谈到,时点的观察结果与对应的评估结果是多对一关系,这种关系可以通过为各时点赋上一个唯一值来表示,这个唯一值保存到--LNKGRP
中。时点观察结果保存在TR中,使用TRLNKGRP
进行标记;对应的评估结果保存在RS中,使用RSLNKGRP
进行标记。
RSLNKGRP
取值与TRLNKGRP
相同,具体参考2.2.2节。
这里额外提及一点,在SDTM IG的示例中,只为肿瘤总体评估记录赋值了RSLNKGRP
变量,对于靶病灶、非靶病灶评估以及新病灶结果的记录,该变量都是置空;而在我当前项目中,RS中所有肿瘤评估结果记录都为RSLNKGRP
赋值。这一点影响不大,看各自项目如何决定。
2.3.4 主题变量的Mapping
RS中对应的主题变量Mapping如下:
- 靶病灶疗效:
RSTESTCD = "TRGRESP"/RSTEST = "Target Response"
- 非靶病灶疗效:
RSTESTCD = "NTRGRESP"/RSTEST = "Non-target Response"
- 是否为新病灶:
RSTESTCD = "NEWLIND"/RSTEST = "New Lesion Indicator"
- 总体疗效:
RSTESTCD = "OVRLRESP"/RSTEST = "Overall Response"
这4组值都是CDISC标准CT值 (2022-06-24),肿瘤疗效评估编码ONCRTSCD (Oncology Response Assessment Test Code)总共有35个值,如果项目中还收集其他评估结果,参考CDISC CT进行Mapping。
2.3.5 Independent Assessor的记录选择——RSACPTFL
当进行独立中心审查时,可能不止一个评估人员,评估结果可能不一致。内容同2.2.6节TRACPTFL
的处理,可参考前文。
总结
本文简述了RECIST 1.1中与肿瘤的SDTM Mapping相关的内容,同时也介绍了相关变量的具体处理。信息从RawData到SDTM的处理是一个“形式变换”的过程,肿瘤相关信息有其自身特点,了解肿瘤评估标准的内容,对整个SDTM Mapping处理的理解会更加深刻。
希望这篇文章,对读者日常的肿瘤相关工作有所帮助。
感谢阅读, 欢迎关注:SAS茶谈!
若有疑问,欢迎评论交流!