DAY4 生信入门-函数和R包

.Rmd文件,注释+代码+运行结果一起显示。

函数与参数

1.形式参数与实际参数


参数

2.写函数的函数
把变的地方作为了函数的参数,把不变的地方作为了函数的主体。


写函数的函数

复习:绘图函数plot()
思考:plot画iris的前四列?

test = iris
plot(test[,1],col = test[,5])
plot(test[,2],col = test[,5])
plot(test[,3],col = test[,5])
plot(test[,4],col = test[,5])
col表示颜色,不是缩写。test[,5]有三种数据,所以有三种默认颜色。

当一个代码需要复制粘贴三次,就应该写成函数或使用循环

test=iris
g <- function(i){
  plot(test[,i],col=test[,ncol(test)])
}

g(1)
g(2)
g(3)
g(4)

plot()

3.默认参数
作者会设计很多参数,但只有前1~n个是必须填的,其他的参数都有默认值
默认参数

练习4-1
2、写一个函数,输入参数为一个数值型向量,输出结果为:该向量的“中位数”和“平均数”,并写出用户使用该函数的代码 。

#我的错误代码,不知道如何使两个函数一起输出。
g <- function(x){median(x),mean(x)}

用c()组织了多个数据。
一般来说,函数只有一个返回结果。

#回车和分号效果一样。这样默认返回最后一个函数的值。
> tony <- function(x){
+   mean(x)
+   median(x)
+ }
> tony(a)
[1] 0.2808704
#正确答案
> mdm <- function(x){ 
+     c(mean = mean(x),  #给向量起名字
+       median = median(x)) 
+ } 
> 
> a = rnorm(10)
> mdm(a)
     mean    median 
0.3630620 0.2808704 
> mdm2 <- function(x){ 
+     paste0("mean :",mean(x),
+            ",median:",median(x))
+ } 
> 
> mdm2(a)
[1] "mean :0.363062004529344,median:0.280870440925975"

tips: 有多个输出结果时,将输出的结果组成一个向量; 当一个函数里需要返回多个值(比如有变量,有向量,有矩阵)时,我们要用list,而不是return
函数中常用:retun()/print(),生成多个,最终返回几个,告诉最后要返回/输出的值是谁。

> tony <- function(x){
+   print(c(mean(x),median(x)))
+ }
> tony(a)
[1] 0.3630620 0.2808704

记得检查
函数运行是否成功取决于目的是否达到,而不是取决于是否报错。
函数的括号里不要有赋值语句。
不重要的拓展:制定输入必须为数值型向量。

> mdm <- function(x){ 
+   if(!is.numeric(x))stop("dnflsdkjflskdjfls")
+   c(mean = mean(x),
+     median = median(x)) 
+ }
> mdm("a")
Error in mdm("a") : dnflsdkjflskdjfls

R包(R package)介绍

R程序包是多个函数的集合,具有详细的说明和示例
也有的R包只有数据,没有函数
包含R函数、数据、帮助文件、描述文件等
特定的分析功能,需要用相应的程序包来实现
目的不是学会某个具体的R包,而是找所有R包使用的规律。

R包来源

(1)CRAN网站
http://cran.r-project.org/web/views/
(2)Bioconductor
http://bioconductor.org/
(3)github
http://github.com

R包来源决定安装使用的代码
CRAN:install.packages()
Biocductor: BiocManager::install()
Github:devools::install_github()
github本地安装:devtools::install_local("AnnoProbe-master.zip",upgrade = F)
来源未知?
谷歌、必应搜索包名,即可找到。
前两个命令逐个试一下,一个命令不成功就用另一个。

安装后需要加载才能用
一次安装,每次打开新的session都要加载。
加载:二选一,不加引号,library()或require()

library() 
require()

(国内)R包安装前需设置镜像

方法1:tools–global option-packages-选择中科大或清华
方法2:代码设置
每次下载安装R包的时候都要运行。

options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")

R包安装和使用的逻辑

1.安装包-加载包-使用包里的函数


R包安装和使用的逻辑

如报错:找不到函数,则加载函数所在的包,重试。
如报错:不存在叫xx名字的包,则安装xx包,重试。
library()是检查是否安装成功的标准

2.已安装、不加载,直接使用

BiocManager::install() 
dplyr::filter()

包名 ::函数名,表示显式的指定用某个包里的某个函数,通常用于实战中仅用一次的函数,也适用于两个包中的函数名有冲突的情况。

常见疑问

(1)大片提示信息
检查是否有error,没有就忽略
(2)packages not available
原因1:包名写错
原因2:安装命令使用错误
原因3:本机的R语言版本与包所要求的版本不符(极少)
(3)是否更新?
懒惰策略,能不更新就不更新,除非一直报错。
不想回答:安装命令加参数:update = F, ask = F
(4)加载A包,报错B包不存在
问是否更新的、“不存在”的是依赖包
R包之间存在复杂的依赖关系 使用A包,就必须同时用B、C, 而C又依赖了D包
理论上: 安装A,就会自动安装BCD ;加载A,就会自动加载BCD
实际上: 常会因为一两个依赖包的安装失败,导致你想安装的那个包安装失败。
(5)报错中有connection或url、404、http
问题可能是没联网,校园网限制,镜像没设置,镜像崩了。
切换镜像,检查网络连接。如果都没有问题,运行

options(download.file.method = 'libcurl')
options(url.method='libcurl')

再重新下载。


满分操作:判断式安装
if(!require(stringr))install.packages("stringr")

R包的使用场景

  • 某流程代码中用到某些包
  • 学绘图,用到ggplot2
  • 别人的代码套自己的数据,报错不会改
  • 大多数包里的函数规律一致,不需要单独学习,用到哪个函数学习哪个函数
  • 少部分包的函数自有语法,例如ggplot2, dplyr等

R包如何使用-获取帮助

1.快速查看函数帮助文档

?max
help(max)
example(seq) #看实例

2.找R包介绍页面(必应直接搜/CRAN/Bioconductor)
3.少数R包有 Cheat Sheets
https://www.rstudio.com/resources/cheatsheets/
补充
网页版说明书:作者写的,详细,类似于教程,不是每个R包都有。

browseVignettes("clusterProfiler") #Vignettes小插图

列出某个包里所有的函数:

> ls("package:clusterProfiler") #前提:包加载并安装。不能自动补齐。
[1] "%<>%" 
[2] "%>%" 
[3] "arrange" 
[4] "bitr" 
[5] "bitr_kegg" 
[6] "browseKEGG" 
[7] "buildGOmap" 
[8] "cnetplot" 
[9] "compareCluster" 
[10] "dotplot"

ls()  #环境里有哪些变量
dir()  #工作目录下的文件

R语言里的符号

() 函数
[] 向量、数据框取子集
[[]] 列表取子集
$ 数据框取列
= ,<- 赋值
== 判断是否相等
!=判断是否不相等
! 否定
{} 多行代码
井号# 注释
"" 字符串
:: 包::函数

认清函数与数据

函数
形式函数:括号里面,等号左边。
实际函数
数据框或矩阵
列表 @:类似于列表取子集的$,R语言里狭义的对象取子集的符号。
文件名

只有像save这样专门为文件设置的函数,才能识别文件名。像class只能将数据识别为字符串。

作者:Ruizheng
链接:https://www.jianshu.com/p/70be54ac9065
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容