关于SDTM Define 各部分的介绍

Define.xml 文件是临床试验需要提交的重要文件之一,该文件支持以机器可读的格式进行数据集元数据的交换。Define文件中有几个重要部分,我下面来一一介绍。

Define标签

1. Tabulation Datasets

Tabulation Dataset

Tabulation Dataset 的内容包括用于提交的SDTM域的列表(图片中只截取了一小部分数据集)、域的结构、域的关键变量以及链接至SAS传输文件的链接。这里要注意域的展示顺序,按域的类别依次排列: TRIAL DESIGN, SPECIAL PURPOSE, INTERVENTIONS, EVENTS, FINDINGS, FINDINGS ABOUT, RELATIONSHIP。域的结构(Structure),我们可以参考SDTM IG中的说明,如下图:

Domain Structure

2. Tabulation Dataset Overview

Tabulation Dataset Overview 1

每一个提交的SDTM数据集,都会有对应的Overview。这部分内容包括变量定义、域的关键变量、变量类型(text, integer, float, datetime, date),来源(Origin)和受控术语(Controlled Terminology)。变量可以链接至VLM(Value Level Metadata),也可以了连接至CT(Control Terminology)。以TI数据集为例,上图展示了TI数据集的Overview的情况。变量IECAT具有受控术语,内容为INCLUSIONEXCLUSION,点击对应链接,Define文件会跳转到Controlled Terminology模块的对应位置,如下图:

IECAT CT

3. Value Level Metadata (VLM)

VLM提供了变量在具体条件下元数据的信息,包括变量名,where语句(变量子集的条件),变量类型,长度,来源,受控术语。VLM可以应用到任何具有取值列表的变量中,通常有,--TESTCD,--ORRES,--ORRESU,--STRES,--STRESU。举个例子,对于不同的LB.LBTESTCD,LB.LBORRESU具有不同类型的值。

LBORRES VLM

4. Controlled Terminology (CT)

受控术语包含一个临床试验变量的所有允许取值,通常取值范围与CRF中变量的所有可能取值一致。CT包含Code(原始值),Decode(编码值,如果有就提供);对于CDSIC变量,还包含Alias List Code(Codelist),Alias Value Code(C-code)以及Extensible list values(扩展列表值)。

对照着例子,来讲解下。以下内容是SDTM Terminology 2020-06-26中UNIT的内容。矩形标记的值C71620,是Codeist UNIT的Alias List Code值,即CDSIC对UNIT的编码;标注1 C25613,是 '%' 的Alias Value Code值,即CDSIC对UNIT具体值的编码;标注3 “Yes” 说明UNIT这个Codelist是可扩展的,如果研究中所用单位不在CDSIC提供的列表中,可以在Define中UNIT CT列表中添加这个值,但这个值是没有CDSIC的标准编码Alias Value Code。

SDTM CT - UNIT

数据来源: SDTM Terminology 2020-06-26

我们来看一下某个项目中 LBSTRESU 的CT列表。标注1是这个CT的CDSIC的编码;标注2是 ‘%’ 这个值的CDSIC的编码;标注3处,‘ng/mL’的编码为 ‘*’,因为CDSIC提供的CT列表中并没有这个值,所以它为扩展值(Extended Value)。

LBSTRESU

5. Computational Algorithms

Computation Algorithm描述产生变量值的方法,这些变量的来源为“Defived”。CA包括方法名称、方法类型以及方法的具体描述。

Computational Algorithms截选

6. Comment

Comments是对变量的描述。如果描述的内容较短,描述就在Define.xml文件中展示;如果描述的内容较长,描述就保存在附件中作为外部文件中引用。

Comment截选
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342