1.go富集分析
横坐标 比例 纵坐标 个数
2.排序
a.实现倒序
reverse <- as.character(rev(factor(a)))
b.按照levels排序
sort(factor(a),levels=c("a","d","c","b"))
3.数据框中的行和列调序
a.行 arrange(faithful,waiting)
b.列 select(faithful,2,1)
c.如果只想把某列提前,后面可加everthing
select(flights,3,everything())
d. str_length
向量中包含元素个数
e. substring
提取第几的到第几个向量中的元素
4.倒序
f<-c("abc","bca","xyz")
reverse<-str_replace(f,"([^ ]+)([^ ]+)([^ ]+)","\\3\\2\\1")
[1] "cba" "acb" "zyx"
匹配不包含空格的出现一次或者多次的字符串
5.倒序
f <- c("abcdefgh","bcdefghi","cdefghij")
n=str_length(f[1])
g <- c(rep("([^ ]+)",times=n))
g2 <- str_c(g,collapse = "")
h <- str_c(n:1,collapse = "\\")
h2 <- str_c("\\",h)
str_replace(f,g2,h2)
6.substring
a <- "abcd"
d <- substring(a,1:n,1:n)
[1] "a" "b" "c" "d"
7.函数
创建函数的关键步骤:命名、参数、函数体
8.函数
doodle <- function(x){
range(x)-3
}
doodle(c(1, 2, 3, 5))
[1] -2 2
9.条件执行
if(i<5){
"doudou"
}else{
"huahua"
}
10.ifelse(x>5,x+3,x-3)
11.NA就只是没萝卜,而NULL
则是没坑的.
12.列表 list
可以嵌套的
13.列表取子集
[] 提取子列表
[[]]或$提取元素 降低一个层级
14.循环模式
数值、元素、名称
15.正则表达式
[^ ]+表示长度为1或多的任意非空字符,也就是1个及以上的任何字母都可以.
16.limma
核心就是利用线性模型去估计各个分组的基因表达量的均值与方差。