简谈Define.XML

什么是Define.XML?《FDA数据标准目录》中详述了SDTM,SEND,ADaM,Define-XML以及Controlled Terminology等标准被指定用于药物注册申报递交的数据标准。简单讲,Define.XML是一种数据标准格式。这种格式有什么特点呢?

XML指可扩展标记语言( EXtensible Markup Language)
XML被设计用来结构化、存储以及传输信息,而非显示数据
XML数据以纯文本格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法
XML可以通过各种不兼容的应用程序来轻松交换数据数据
在不损失数据不中断应用程序的情况下,XML更容易扩展或升级到新的操作系统、新应用程序或新的浏览器
由于XML独立于硬件、软件以及应用程序XML使您的数据更可用,也更有用。几乎所有的主流浏览器均支持XML和XSLT
XML是W3C的推荐标准

XML这一文件格式特点,可以满足临床试验对数据递交的一些期望:

机器可读
中立的平台
不要依赖于系统或供应商
完整的阐释临床试验
标准化的数据传输、交换和使用
符合监管要求的数据递交/存档
便捷的端对端的CDISC实施
与电子健康记录的整合
......

XML文档形成了一种树结构,它从“根部”开始然后扩展到“枝叶”。根元素必须包含,是所有其他元素的父元素。XML文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。所有元素均可拥有子元素。

这是Define.XML的一些介绍。下面我来谈一下,我生成Define.XML过程中遇到的一些问题。不同的公司、机构使用的工具肯定会不太一样,这里的问题仅供参考。整个制作流程分为四大块:相关文件的准备、ADePT文件的生成、Define文件的生成、进行验证

相关文件的准备
相关文件包括:SDTM/ADaM数据集、SDTM/ADaM Specifications、Annotated CRF。这些文件都需要按照CDISC标准进行设计,整体框架一般没问题。主要问题是一些Spec信息太过简略,导致在生成ADeP文件时发生ERROR。为避免这个问题,可以在生成ADeP之前就把Spec文中信息补全,保证材料的完整性,这是最稳妥的方法;其次,也可以在生成的ADept文件中进行修改,将Spec缺失的信息,补充到ADeP中。

ADeP文件的生成
这一过程的顺利与否,取决于操作者是否遵循程序的操作流程。新手最好多观看相关的Help文档和教学视频,避免步骤性出错。在生成ADeP过程中,程序会对issue进行高亮提示,辅助修改Spec或ADeP文件。

Define文件的生成
这一部分也是步骤性操作,生成文件之后要仔细查看文件,可能出现的问题有

  • 数据集中Controlled Terms or Format列缺失(Spec中Outformat列的信息未填写)
  • Controlled Terms or Format列引用未显示Label名(Codelist页cl_name列是变量名非Label名)
  • Derivation/Comment列内容过多(将内容保存到PDF中,使用超链接观看)
  • Codelist中的按名称排序可能无逻辑顺序(需要在Adept文件中进行手动调整)
  • ......

进行验证
我们公司是用Pinnacle 21软件进行验证。在软件界面,确定好相关版本,导入XPT和define文件开始验证。验证报告结果以Excel格式输出。报告文件中总共有四张表单:Dataset Summary、Issue Summary、Details、Rules。四张表单依次查看,确定issue的位置以及解决方法。

文章前半部分关于Define文件的论述,参考微信公众号:好数据《220 数据•标准 Define.XML 和dataset.xml 的基本介绍》;后半部分是自己的生成Define的一些认识。
----2019年3月17日

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容

  • ORA-00001: 违反唯一约束条件 (.) 错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。 O...
    我想起个好名字阅读 5,156评论 0 9
  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 11,083评论 1 32
  • mean to add the formatted="false" attribute?.[ 46% 47325/...
    ProZoom阅读 2,689评论 0 3
  • 1. 简介 1.1 什么是 MyBatis ? MyBatis 是支持定制化 SQL、存储过程以及高级映射的优秀的...
    笨鸟慢飞阅读 5,423评论 0 4
  • 七律/假龙头花 作者:心博、图片:网络 饱满芝麻遍体稠,条条虎尾舞鞭柔。 棉铃风里无声响,囊萼身边有伴羞。 蜀客应...
    心博1阅读 1,547评论 0 1