WGCNA(二)WGCNA的步骤和原理

链接:http://genek.tv/,本文是该课程的学习记录。

1.共表达

两条基因的表达模式相似,即在某些样本中两条基因表达量都高,某些样品中表达量都低。



用相关性系数r量化
-1<r<1
负值代表负相关,0代表不相关,正值代表正相关

2.网络

1.相关概念

节点(node):图上的圆点,每个圆点代表一个基因。
连接(link):图上的线,每条线代表两个基因的关系(可设置阈值,例如>0.7即标记相关)
加权网络(weighted network)与无权网络(unweighted network)的区别是:加权网络的线条有粗细之分,粗细表示权重。
邻接度:节点之间的关系强弱。一个网络里的所有基因形成一个邻接矩阵(adjacency matrix)。
连通性(connectivity):反映节点的重要程度,与多少其他节点有关,以及关系的强弱。
无权网络不显示权重,它的连通性只是连接基因的数目。
加权网络的连通性是所有有关节点的关系强弱的叠加。

2.随机网络与无尺度网络


无尺度网络中,多数节点都只与几个节点有关(红色点);极少数节点与很多节点有关(蓝色点)。如果将每个节点的连接数进行排序,会发现无尺度网络的连通性符合幂律分布。
因此,一个模块中有很多基因,但关键基因只有几个。

3.分析步骤

第一步:数据预处理

(1)行名是样本名,列名是基因名。如果拿到的是表达矩阵,需要转置。
(2)去掉所有样本中表达量都很低的基因
(3)去掉所有样本中表达量几乎没有差异的基因,可用sd筛选,但不建议只保留差异基因(备注:这里说的差异基因,是指差异显著的基因)。

第二步:构建相关性矩阵

相关系数范围是-1~1,WGCNA分析要求转换为0-1范围。
有两种转换方式:
unsigned:不区分正相关和负相关
signed:区分正负相关


第三步:构建邻接矩阵

多大的相关系数算相关?需要设置阈值。
软阈值:soft threshold,用power函数将相关性矩阵转换成邻接矩阵,需要确定power的参数β。


迭代一系列值,看β等于哪个值时:(1)这个网络更接近于无尺度网络
(2)尽可能保留连通性信息。


左右两张图的横坐标都是软阈值,👈左图纵坐标是无尺度网络的评价指标r2,r2越接近1,该网络就越接近无尺度网络,通常要求>0.8或0.9。
👉右图纵坐标是平均连通性,该值随β的增加而降低
综合两张图,通常选r^2第一次达到0.8或0.9以上时的β值。
有了β值就可以根据公式将相关性矩阵转换为邻接矩阵。

第四步:构建拓扑重叠矩阵

简称TOM(Topological Overlap Matrix),相关系数只考虑到两个节点之间的线性关系,而TOM则是考虑到中间节点的(间接的)计算方法。


总结:基因之间的关系/距离


第五步:构建共表达网络

对基因进行聚类,每条线代表一个基因,相似的基因被聚到一个分支。


第六步:模块划分

Dynamic Tree Cut,不同模块用不同颜色表示,同一模块的基因通常据有类似的功能。


第七步:合并相似模块

第8步,模块与性状关联

相关系数只能计算对应的两列,而表达矩阵是一个表格,而非一列。
方法是对一个模块里的基因表达矩阵进行主成分分析,用第一个主成分(PC1)的的指标--特征向量(ME)代表一个模块,得到模块MEs矩阵。



可以计算每个模块的特征向量与三个性状之间的相关系数,形成一个矩阵,可做热图。


第九步:GS和MM

GS代表模块里的每个基因与形状的相关性
MM代表单条基因和所在模块之间的相关性,表示是否与模块的趋势一致。

第十步:Cytoscape可视化

微信公众号生信星球同步更新我的文章,欢迎大家扫码关注!


我们有为生信初学者准备的学习小组,点击查看◀️
想要参加我的线上线下课程,也可加好友咨询🔼
如果需要提问,请先看生信星球答疑公告

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,783评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,360评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 142,942评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,507评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,324评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,299评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,685评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,358评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,652评论 1 293
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,704评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,465评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,318评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,711评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,991评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,265评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,661评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,864评论 2 335

推荐阅读更多精彩内容

  • 条件反射2014-1-26 20:51 习惯成自然是条件反射的通俗说法。孩子三两天就可以惯出来了,…… 这不我们这...
    甘怀阅读 131评论 0 0
  • go下载地址点击下载GO 选择对应的版本进行下载 下载完成后进行环境变量配置 指定到bin目录就好 在D盘D:\a...
    a十二_4765阅读 170评论 0 0
  • 一、一月整体分析没有完成。 二、各领域情况分析工作:完成吴哥窟之行,和同事有了更多的接触;生活:1月份过年,和亲戚...
    青苗妈2016阅读 125评论 3 0
  • 信息爆炸的时代已经来临,每天我们阅读着大量的信息,很多人都想从里面挑出重点,其实根本没有重点而言,你觉得一个不重要...
    醒醒老师阅读 545评论 0 0