本次选择的细胞系是GSE5610人类细胞系
首先GEO下载细胞系,获得counts数
1.转格式为csv格式
2.打开,构建数据透视表
好,代码块又来了,哈哈
代码如下:为了方便拷贝,我设置了程序框
us_count<-read.csv("巴拉巴拉.csv",head=T,row.names=1) #输入表达矩阵数据路径
us_count<-round(us_count,digits=0) #将输入数据取整
#准备
us_count<-as.matrix(us_count) #将数据转换为矩阵格式
condition<-factor(c("C","C","T","T")) ## 设置分组信息,建立环境(8个样本,2组处理)
coldata<-data.frame(row.names=colnames(us_count),condition)
coldata
condition
library(DESeq2) #使用library函数加载DEseq2包
##构建dds矩阵
dds<-DESeqDataSetFromMatrix(us_count,coldata,design=~condition)
head(dds) #查看构建好的矩阵
##进行差异分析
dds<-DESeq(dds) #对原始的dds进行标准化
resultsNames(dds) #查看结果名称
res<-results(dds) #用results函数提取结果,并赋值给res变量
summary(res) #查看结果
plotMA(res,ylim=c(-2,2))
mcols(res,use.names=TRUE)
plot(res$log2FoldChange,res$pvalue) #绘制火山图
#提取差异基因
res <- res[order(res$padj),]
resdata <-merge(as.data.frame(res),as.data.frame(counts(dds,normalize=TRUE)),by="row.names",sort=FALSE)
deseq_res<-data.frame(resdata)
up_diff_result<-subset(deseq_res,padj < 0.05 & (log2FoldChange > 1)) #提取上调差异表达基因
down_diff_result<-subset(deseq_res,padj < 0.05 & (log2FoldChange < -1)) #提取下调差异表达基因
write.csv(up_diff_result,"上调_day0_VS_day1_diff_results.csv") #输出上调基因
write.csv(down_diff_result,"下调_day0_VS_day1_diff_results.csv") #输出下调基因
好啦,就这样了