问题背景
https://mp.weixin.qq.com/s/DFIwVwrgN4s-FK4WjWuO3Q
在这一篇推文里,我写了怎么正确显示坐标轴顺序。
不调整的话横坐标默认是这样:
调整正确的是这样:
然而有位学员搬砖的时候报了错。
示例流程
1.生成示例数据
if(!require(tidyr)) install.packages("tidyr")
#> Loading required package: tidyr
library(tidyr)
x=matrix(rnorm(2200,mean=1.5,sd = 0.2),ncol = 22)
test=as.data.frame(x)
colnames(test)=paste0("chr",1:22)
test2 <- gather(test,key = "chr",value = "values")
head(test2,3)
#> chr values
#> 1 chr1 1.173558
#> 2 chr1 1.749868
#> 3 chr1 1.374387
table(test2$chr)
#>
#> chr1 chr10 chr11 chr12 chr13 chr14 chr15 chr16 chr17 chr18 chr19 chr2
#> 100 100 100 100 100 100 100 100 100 100 100 100
#> chr20 chr21 chr22 chr3 chr4 chr5 chr6 chr7 chr8 chr9
#> 100 100 100 100 100 100 100 100 100 100
2.调整横轴对应列的顺序
关键代码是:
test2$chr <- factor(test2$chr,levels=paste0("chr",1:22),ordered = TRUE)
3.出图
顺利做出了正确的图
if(!require(ggplot2))install.packages("ggplot2")
#> Loading required package: ggplot2
library(ggplot2)
p1 <- ggplot(test2,aes(x = chr, y = values)) +
geom_boxplot()+
theme_bw()+
theme(axis.text.x = element_text(angle=50,vjust = 0.5))
p1
翻车现场
这么简单的代码,发生了报错。
错误代码
options(stringsAsFactors = F)
a <-data.frame(case=paste("S",c(1:50)),values=runif(50))
a$case <- factor(a$case,levels=paste0("S",1:50),ordered = TRUE)
plot(a$case,a$values)
warning和报错信息
#> Warning in min(x): no non-missing arguments to min; returning Inf
#> Warning in max(x): no non-missing arguments to max; returning -Inf
#> Error in plot.window(xlim = xlim, ylim = ylim, log = log, yaxs = pars$yaxs): need finite 'ylim' values
有报错,请搜索
直接复制到必应搜索,可以看到这个链接:
https://stackoverflow.com/questions/21349368/error-in-plot-window-need-finite-xlim-values
总结一下答案的意思,其实就是数据全是NA。一检查,果不其然,全是NA。
a$case
#> [1] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
#> [15] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
#> [29] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
#> [43] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
#> 50 Levels: S1 < S2 < S3 < S4 < S5 < S6 < S7 < S8 < S9 < S10 < ... < S50
为何都是NA
这样一个简单的报错竟然花了我十几分钟时间去解决,我先后测试了这个数据有没有问题,分别用ggplot2和plot作图,plot支不支持因子型数据,然后又看了因子水平是不是不能有空格。
(叫苦不迭,我根本没有学过基础包作图,我是直接学的ggplot2啊啊啊啊,而且因子挖的坑,早就被哈德雷叔叔填平了,如果不是在后面的教学中必须要讲基础包,我可能碰都不碰它。)
火眼金睛
全是NA的原因非常简单,因子水平和内容完全不对应,内容用的函数是paste,水平用的函数却成了paste0。
paste0("S",1:50)
#> [1] "S1" "S2" "S3" "S4" "S5" "S6" "S7" "S8" "S9" "S10" "S11"
#> [12] "S12" "S13" "S14" "S15" "S16" "S17" "S18" "S19" "S20" "S21" "S22"
#> [23] "S23" "S24" "S25" "S26" "S27" "S28" "S29" "S30" "S31" "S32" "S33"
#> [34] "S34" "S35" "S36" "S37" "S38" "S39" "S40" "S41" "S42" "S43" "S44"
#> [45] "S45" "S46" "S47" "S48" "S49" "S50"
paste("S",1:50)
#> [1] "S 1" "S 2" "S 3" "S 4" "S 5" "S 6" "S 7" "S 8" "S 9" "S 10"
#> [11] "S 11" "S 12" "S 13" "S 14" "S 15" "S 16" "S 17" "S 18" "S 19" "S 20"
#> [21] "S 21" "S 22" "S 23" "S 24" "S 25" "S 26" "S 27" "S 28" "S 29" "S 30"
#> [31] "S 31" "S 32" "S 33" "S 34" "S 35" "S 36" "S 37" "S 38" "S 39" "S 40"
#> [41] "S 41" "S 42" "S 43" "S 44" "S 45" "S 46" "S 47" "S 48" "S 49" "S 50"
改正
其实想让这个代码正确运行异常简单,就加一个零而已。
a<-data.frame(case=paste0("S",c(1:50)),values=runif(50))
a$case <- factor(a$case,levels=paste0("S",1:50),ordered = TRUE)
plot(a$case,a$values)
后记
对于新手来说很多细微的小错误,却是越不过去的大坎。当你回过头去看看,会发现曾经的错误其实特别简单。
看别人的错误代码真要命啊。前面写paste,后面写paste0。虽然单独拿出来都没错,但是凑在一起就不对了。
/(ㄒoㄒ)/~~
如果一个人愿意花时间帮你找你写的代码报错原因,那。。。她心情一定很好。
看完这代码,心情怎么样就不一定了。比如我现在就想暴走。