基因芯片数据分析-2: Quantile normalization

分位数归一化就是将多种分布映射到同一种分布。可以指定一个参考分布,将其映射到其它的统计分布;或者从需要处理的这些不同数据中计算出一个参考分布。

原理实现:

  1. 存在一个原始数组如下,每一列代表一个分布,最终我们将它们转换为同一个分布
A    5    4    3
B    2    1    4
C    3    4    6
D    4    2    8
  1. 原始数组每列中按从小到大排序
A 2 1 3
B 3 2 4
C 4 4 6
D 5 4 8
  1. 获得原始数组中每个元素在所属列中按从小到大的排序之后的序号
A    iv    iii   i
B    i     i     ii
C    ii    iii   iii
D    iii   ii    iv
  1. 获取原始数组每列中按从小到大排序之后每行的算术平均数
A (2 1 3)/3 = 2.00 = rank i
B (3 2 4)/3 = 3.00 = rank ii
C (4 4 6)/3 = 4.67 = rank iii
D (5 4 8)/3 = 5.67 = rank iv
  1. 利用第4步的对应关系,对第三部的数据进行替换
A    5.67    5.17    2.00
B    2.00    2.00    3.00
C    3.00    5.17    4.67
D    4.67    3.00    5.67
  1. 查看每列数据的统计情况
Min.   :2.000   Min.   :2.000   Min.   :2.000  
1st Qu.:2.750   1st Qu.:2.750   1st Qu.:2.750  
Median :3.833   Median :4.083   Median :3.833  
Mean   :3.833   Mean   :3.833   Mean   :3.833  
3rd Qu.:4.917   3rd Qu.:5.167   3rd Qu.:4.917  
Max.   :5.667   Max.   :5.167   Max.   :5.667  

分位数归一化这种方法常用于芯片测序数据,但这种方法也过于粗暴,结果往往不是很好;在芯片数据预处理时,可以使用R中preprocessCore包中打包好的分位数归一化函数。

# 安装

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("preprocessCore")

# 使用

library("preprocessCore")
data <- data.frame(a = sample(c(1:20),5),
                b =  sample(c(1:20),5),
                c = sample(c(1:20),5)
)
data
   a  b  c
1  7 10 11
2 20 11 16
3  6  8  7
4  8 13  9
5 17  3 14
normalize.quantiles(x=as.matrix(df))
          [,1]      [,2]      [,3]
[1,]  8.000000  9.666667  9.666667
[2,] 16.333333 14.000000 16.333333
[3,]  5.333333  8.000000  5.333333
[4,]  9.666667 16.333333  8.000000
[5,] 14.000000  5.333333 14.000000

normalize.quantiles()使用的参考分布是数据的算术平均数;需要指定参考分布,可以参考DAVE TANG'S BLOG: Quantile normalisation in R从头写的代码

下面是我稍微改动了一下的代码,添加指定指定参考分布的参数。

df <- data.frame(one=c(5,2,3,4),
                 two=c(4,1,4,4),
                 three=c(3,4,6,8)
)
quantile_normalisation <- function(df, ref_distribute){
  df_rank <- apply(df,2,rank,ties.method="min")
  df_sorted <- data.frame(apply(df, 2, sort))
  
  if(missing(ref_distribute)){
    df_mean <- apply(df_sorted, 1, mean)
  }else{
    df_mean <- ref_distribute
  }
  
  index_to_mean <- function(my_index, my_mean){
    return(my_mean[my_index])
  }
  
  df_final <- apply(df_rank, 2, index_to_mean, my_mean=df_mean)
  rownames(df_final) <- rownames(df)
  return(df_final)
}
quantile_normalisation(df)
       one      two    three
1 5.666667 3.666667 2.000000
2 2.000000 2.000000 3.666667
3 3.666667 3.666667 4.666667
4 4.666667 3.666667 5.666667

test = c(1,2,3,4)
quantile_normalisation(df, ref_distribute=test)
  one two three
1   4   2     1
2   1   1     2
3   2   2     3
4   3   2     4

参考:
Quantile normalization
DAVE TANG'S BLOG: Quantile normalisation in R

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343

推荐阅读更多精彩内容