网址:http://www.sxdyc.com/zeroCodeTool
文章解读的链接:https://mp.weixin.qq.com/s?__biz=MzkxMjMxOTcyNQ==&mid=2247486770&idx=1&sn=29871428cbe7e2ed6feb580342883a2c&chksm=c10ff8b0f67871a69aa90527797e473899e2065fe2119bbc5228a134cfcbec2eb55642f1876b&token=833996379&lang=zh_CN#rd
话不多说,直接开始
共分为16步,对文章进行复现
1、TCGA数据整理
选择需要研究的肿瘤名称如LUAD,从豆芽官网下载生存数据,记得整理后,第一列是样本名,第二列为生存时间,第三列为生存状态(记得样本名不要重复,不要重复)
选好参数后,直接上传,提交,输入任务名即可。
运行完成后会跳出运行成功的弹窗
我们点击下载文件的位置,查看生成的文件
第一个为癌组织+癌旁组织的样本的表达谱,第二个为癌组织和癌旁组织的样本分组文件,第三个为样本的生存数据,第四个癌组织的表达谱数据
2、差异的anoikis相关基因集筛选
该anoikis相关的基因集来自于PMC10449303文章附件中,可以自己替换成自己关注的基因集
选择相关的参数,这里需要导入第一步写入的任务名,上传anoikils相关的基因集,差异分析中,我们使用limma包进行差异分析,并自行输入差异倍数,选择p值筛选的类型和范围如下所示:
直接提交即可,等待运行成功
在这次的分析中,总共有10000多个差异基因,Anoikis差异的基因有272个基因,这些基因的信息叫表com.gene.txt,表tcga.diff.fit.txt为阈值筛选后差异基因差异分析的结果
其中fig1a为差异分析的火山图
3、一致性聚类构建分子亚型
基于第二步筛选到272个差异的Anoikis基因选择特定的方法进行一致性聚类
以下就是一致性聚类的结果,这里只要选择亚型的个数,一般是通过KM曲线和热图一起选择的,这里不做多描述,KM曲线的p值一定要小于0.05,热图得到的亚型的分布不能过于弥散。
4、降维分析亚型的分布
选择亚型聚类的个数提交就可以了
5、亚型之间通路的不同特征
选择合适的参数,反复进行分析,默认做两两比较的差异通路的筛选
6、不同亚型22种免疫细胞比较
这里使用CIBERSORT的方法计算22种免疫细胞评分,并使用统计方法进行检验,记得wilcox.test和t.test这两种方法,只能针对两个亚型进行比较,而kruskal.test和anova一般是针对三个分子亚型进行比较。
7、差异分析筛选差异基因
选择两两亚型差异分析的基因,这里只有两个亚组,所以默认做的是C1vsC2,如果是三个亚组,可以选择两两做差异,C1vsC2.C1vsC3,C2vsC3筛选出的差异基因取并集,复制在一个txt表格中
类似于这样
8、WGCNA筛选肿瘤发生相关的基因集1
选择上一步筛选到的差异基因,进行WGCNA分析
9、WGCNA筛选肿瘤发生相关的基因集1
第八步运行得到最优的软阈值,这里的软阈值是R2>0.85下的最小的软阈值,在该软阈值下构建无尺度拓扑网络,设置最小module的基因数量,并选择75的相似度进行融合
10、基因富集分析
11、Anoikis相关基因簇的鉴定
选择一个WGCNA分析中筛选到最相关的基因集,将该基因集复制上传,进行一致性聚类
12、Anoikis相关基因簇PCA和基因表达谱分布
13、拆分TCGA数据集构建风险模型1
将TCGA数据集按照比例拆分为训练集和验证集,在训练集中以p<0.001筛选预后相关的基因,通过lasso,逐步回归,多因素cox分析构建风险模型。
14、拆分TCGA数据集构建风险模型2
选择合适的随机种子,并配置颜色,等到运行结果
15、关键基因的预后和在高低风险组中表达
风险模型构建成功后,针对这些module的基因,查看其预后价值(高低表达的KM曲线),及高低风险组中的表达差异。
16、风险得分和关键基因与免疫细胞的相关性分析
目前也有视频讲解:
https://www.bilibili.com/video/BV1Xp421m7VD/?spm_id_from=333.999.0.0
原文链接:
https://mp.weixin.qq.com/s/JMKvyHxypLgY7_SetvcvZg