statTarget-基于QC样本的代谢组学数据校正

导读

质量控制是基于质谱组学数据获得可重复性和准确性结果的必要步骤。重复使用相同的QC样本在MS run order序列中对信号漂移的评估和校正越来越被接受,尤其有利于提高批次间实验数据的质量,statTarget是一个流线型的工具,它为基于质量控制的信号校正、多批实验的MS数据集成以及基于MS的组学数据的综合统计分析提供了图形化的用户界面。本文档旨在指导用户使用函数执行数据分析,如shiftCor、statAnalysis、statTargetGUI函数等。

Fig.1

概述

statTarget一个精简的可以提供图形用户界面,基于质QC样本进行信号校正,可以整合不同批次之间的代谢组学和蛋白质组学数据,并进行全面的统计分析。

statTarget是如何工作的

statTarget包括两方面内容

  • 一个是信号校正(见后面的shiftCor函数)。其包括基于QC样本进行信号校正的集成学习方法。比如:
  1. 基于QC样本的随机森林校正(QC-based random forest correction, QC-RFSC);
  2. 基于QC样本的LOESS(locally weighted scatterplot smoothing)信号校正(QC-based LOESS signal correction, QCRLSC)
  • 第二部分内容是统计分析(详见后面介绍的statAnalysis函数)。提供了较为全面的用于分析组学数据的计算和统计方法,并且为生物标志物的发现提供多种结果。另外还提供了一个statTargetGUI功能,可以交互界面进行上述功能的操作。

statTarget包的功能列表

  • 数据前处理(Data preprocessing):80%的原则,总丰度归一化(sum normalization),概率系数归一化(probabilistic quotient normalization),glog转化(glog transformation),K-近邻算法数据填充[3]、中位数、最小值填充都是针对缺失数据进行填充的方法。
  • 数据描述:比如平均值、中位数、和、四分位数及标准差等
  • 多元统计分析:如PCA, PLSDA, VIP, Random forest, Permutation-based feature selection。
  • 单变量分析:Welch t检验,Shapiro-Wilk normality test(数据正态性检验) and Mann-Whitney test。
  • 生物标记物分析:ROC, Odd ratio(优势比), P值多重校正,箱线图和火山图

statTargetGUI

因为该函数提供了一个交互式界面分析的功能statTargetGUI,所以先看下如何使用

## Examples Code for graphical user interface 

library(statTarget)

statTargetGUI()

#For mac PC,  the GUI function 'statTargetGUI()' need the XQuartz instead of X11 support. Download it from https://www.xquartz.org. R 3.3.0 and RGtk2 2.20.31 are recommended for RGtk2 installation.

工作界面如下图所示

Fig.2 statTargetGUI工作界面

  • 另外关于statTargetGUI的参考手册见官网[4]

信号校正

  • 文件准备
    Meta file
    该文件包含样品名称,分组信息,批次和进样顺序。
    1.Class:QC样品此处标为NA
    2.Order:进样顺序
    3.Batch:样本的批次信息
    4.Meta文件和Profile文件的样品名称必须一致
Fig.3 Meta文件格式

Profile file
就是组学数据的丰度表

Fig.4 Profile文件格式
  • 代码
## Examples Code

library(statTarget)

datpath <- system.file('extdata',package = 'statTarget')
samPeno <- paste(datpath,'MTBLS79_sampleList.csv', sep='/')
samFile <- paste(datpath,'MTBLS79.csv', sep='/')
shiftCor(samPeno,samFile, Frule = 0.8, MLmethod = "QCRFSC", QCspan = 0,imputeM = "KNN")

  • 该步运行的结果会得到校正后的文件以及图形展示


    Fig.5 质控前后丰度分布和相对标准偏差分布

    image

统计分析

  • 文件准备
    Stat File
    该文件包含样品名称,分组(处理or未处理),丰度数据
Fig.6 Stat File数据格式
  • 代码
## Examples Code

#library(statTarget)

datpath <- system.file('extdata',package = 'statTarget')
file <- paste(datpath,'data_example.csv', sep='/')
statAnalysis(file,Frule = 0.8, normM = "NONE", imputeM = "KNN", glog = TRUE,scaling = "Pareto")
  • 结果展示
    包括PCA, PLS-DA, 火山图,随机森林等


    Fig.7 结果展示

处理质谱数据

  • 另外还提供了XCMS,MZmine2,SIEVE和SKYLINE
  • 下面以xcms处理后的数据为例
Fig.8 xcms处理后的数据
## Examples Code

library(statTarget)

datpath <- system.file('extdata',package = 'statTarget')
dataXcms <- paste(datpath,'xcmsOutput.tsv', sep='/')
#dataSkyline <- paste(datpath,'skylineDemo.csv', sep='/')
transX(dataXcms,'xcms')
#transX(dataSkyline,'skyline')
  • 处理后的数据也同上述数据分析步骤

参考

[1] Luan H., Ji F., Chen Y., Cai Z. (2018) statTarget: A streamlined tool for signal drift correction and interpretations of quantitative mass spectrometry-based omics data. Analytica Chimica Acta. dio: https://doi.org/10.1016/j.aca.2018.08.002
[2] Luan H., Ji F., Chen Y., Cai Z. (2018) Quality control-based signal drift correction and interpretations of metabolomics/proteomics data using random forest regression. bioRxiv 253583; doi: https://doi.org/10.1101/253583
[3] KNN,k-临近算法
[4] statTarget官网

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 196,264评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,549评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,389评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,616评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,461评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,351评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,776评论 3 387
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,414评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,722评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,760评论 2 314
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,537评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,381评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,787评论 3 300
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,030评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,304评论 1 252
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,734评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,943评论 2 336

推荐阅读更多精彩内容