R语言-数据结构入门-2

R语言的学习

开始

开始R语言的学习已经有一段时间了，正在按计划开始学习，虽然年底有点忙还是坚持按计划进行学习，这是学习的第一个节点时间，也该总结一下学习的成果，同时也勉励一下自己坚持，就像笑来老师说“短期期望不要太高，长期期望不要太低”。

第一章 R语言介绍

1.1为何要使用R

优势：

免费，开源的社群模式，支持各种图标创作，是一个可进行交互式数据分析和探索的强大平台，从多个数据获取数据转化为可用，各种图形界面支持GUI，支持各种系统

难点：

由于许多功能都是由独立贡献者编写的可选模块提供的，这些文档可能比较零散而且很难找到。事实上，要掌握R的所有功能，可以说是一项挑战。

1.2 R的获取和安装

R可以在CRAN（Comprehensive R Archive Network）http://cran.r-project.org上免费下载

疑问：CRAN下载和安装？？？已经见解决（见R语言分享第一篇文章）

1.3 R的使用

注意：rnorm(5)-> x与x<-rnorm(5)的语句等价，注释由符号#开头。在#之后出现的任何文本都会被R解释器忽略

1.3.2获取帮助

实例：

1.4包

R提供了大量开箱即用的功能，但它最激动人心的一部分功能通过可选模块的下载和安装来实现的。

使用命令 install.packages()安装包 update.packages()更新安装包 installed.packages()例出安装包。

1.5批处理

outfile是接收输出文件的文件名，options部分则列出了控制执行细节的选项。依照惯例，infile的扩展名是.R，outfile的扩展名为.Rout。

图来源于R语言实战

第二章创建数据集

2.1数据集的概念

R可以处理的数据类型（模式）包括数值型、字符型、逻辑型（TRUE / FALSE）、复数型（虚

数）和原生型（字节）。在R中，PatientID、AdmDate和Age为数值型变量，而Diabetes和Status则为字符型变量。另外，你需要分别告诉R：PatientID是实例标识符，AdmDate含有日期数据，Diabetes和Status分别是名义型和有序型变量。R将实例标识符称为rownames（行名），将类

别型（包括名义型和有序型）变量称为因子（factors）。

图来源于R语言实战

2.2数据结构

注意：

1，单个向量中的数据必须，拥有相同的类型或模式（数值型、字符型或逻辑型）。同一向量中无法混杂不同模式的数据。

2，标量是只含一个元素的向量，例如f <- 3、g <- "US"和h <- TRUE，它们用于保存常量。

3，通过在方括号中给定元素所处位置的数值。

4，最后一个语句中使用的冒号用于生成一个数值序列

实例向量:

2.2.2矩阵

矩阵是一个二维数组，只是每个元素都拥有相同的模式（数值型、字符型或逻辑型）。可通

过函数matrix()创建矩阵。

实例

#矩阵

y<-matrix(1:20,nrow = 4,ncol = 5) #创建矩阵行4例5

cells <-c(1,2,3,4)

rnames <-c("r1","r2")

cnames <-c("c1","c2")

newmatrix <-matrix(cells,nrow = 2,ncol = 2,byrow = T,dimnames =list(rnames,cnames))#按行填充

newmatrix

twomatrix <-matrix(cells,nrow = 2,ncol = 2,byrow = F,

dimnames =list(rnames,cnames))#按例填充

Twomatrix

注意：

其中vector包含了矩阵的元素，nrow和ncol用以指定行和列的维数，dimnames包含了可选

的、以字符型向量表示的行名和列名。选项byrow则表明矩阵应当按行填充（byrow=TRUE）

还是按列填充（byrow=FALSE）

实例：

YY <- matrix(1:10,nrow = 2)

> YY

[,1] [,2] [,3] [,4] [,5]

[1,]13579

[2,]246810

> YY[2,]#取行

[1]2468 10

> YY[,2]#取例

[1] 3 4

> YY[2,4]#取只定行列

[1] 8

YY[2,c(3,5)]#确制定行的多例

[1]6 10

2.2.3数组

数组（array）与矩阵类似，但是维度可以大于2。数组可通过array函数创建，形式如下：

myarray <-array(vector, dimensions, dimnames)

其中vector包含了数组中的数据，dimensions是一个数值型向量，给出了各个维度下标的最大值，而dimnames是可选的、各维度名称标签的列表。

注意创建顺序为：行例表顺创建

示例

> sheet1 <- c("A1","A2")# 创建向量

> sheet2 <- c("B1","B2","B3") #创建向量

> sheet3 <-c("c1","c2","c3","c4")# 创建向量

> E <- array(1:24,c(2,3,4),dimnames = list(sheet1,sheet2,sheet3))#创建2x3x4 行例表顺创建

> E

, , c1

B1 B2 B3

A1135

A2246

, , c2

B1 B2 B3

A179 11

A28 10 12

, , c3

B1 B2 B3

A1 13 15 17

A2 14 16 18

, , c4

B1 B2 B3

A1 19 21 23

A2 20 22 24

> E [1,1,1]# 行列表

[1] 1

2.2.4数据框

由于不同的列可以包含不同模式（数值型、字符型等）的数据，数据框可通过函数data.frame()创建：mydata <- data.frame(col1, col2,col3,...)

实例

#创建数据框

> #创建数据框

> MYID <- c(1,2,3,4)

> age <- c(21,23,23,25)

> diabetes <-c("T1","T2","T1","T2")

> sad <- c("poor","improved","excellent","poor")

> patientdata <- data.frame(MYID,age,diabetes,sad)

> patientdata

MYID age diabetessad

1121T1poor

2223T2improved

3323T1 excellent

4425T2poor

注意：每一列数据的模式必须唯一，不过你却可以将多个模式的不同列放到一起组成数据框。Attach注意当名称相同的对象不止一个时，这种方法的局限性就很明显了

> summary(mtcars$mpg)

Min. 1st Qu.MedianMean 3rd Qu.Max.

10.4015.4219.2020.0922.8033.90

> attach(mtcars)

> summary(mpg)

Min. 1st Qu.MedianMean 3rd Qu.Max.

10.4015.4219.2020.0922.8033.90

> plot(mpg,disp)

> plot(mpg,wt)

> detach(mtcars)

> mpg <-c(25,36,47)

> attach(mtcars)

with用法示例

with(mtcars,{print(summary(mpg))#输出到屏幕统计概要

+plot(mpg,disp)#对其绘tu

+plot(mpg,wt)})#对其绘tu

Min. 1st Qu.MedianMean 3rd Qu.Max.

10.4015.4219.2020.0922.8033.90

注意：

Attach语句的注意：在数据框mtcars被绑定（attach）之前，你们的环境中已经有了一个名为mpg的对象。在这种情况下，原始对象将取得优先权，这与你们想要的结果有所出入。由于mpg中有3个元素而disp中有32个元素，故plot语句出错。函数attach()和detach()最好在你分析一个单独的据框，并且不太可能有多个同名对象时使用。任何情况下，都要当心那些告知某个对象已被屏蔽（masked）的警告。

wish

函数with()的局限性在于，赋值仅在此函数的括号内生效，你需要创建在with()结构以外存在的对象，使用特殊赋值符<<-替代标准赋值符（<-）即可，它可将对象保存到with()之外的全局环境中

> with(mtcars,{N<- summary(mpg)

+ keepstats <<- summary(mpg)})#赋值仅在此函数的括号内生效

> N

Error: object'N' not found

>keepstats

Min. 1st Qu.MedianMean 3rd Qu.Max.

10.4015.4219.2020.0922.8033.90

注意：将patientID指定为R中标记各类打印输出和图形中实例名称所用的变量。

2.2.5因子

类别（名义型）变量和有序类别（有序型）变量在R中称为因子（factor）。

示例

> #因子

> D <- factor(diabetes)#类别变量

> D

[1] T1 T2 T1 T2

Levels: T1 T2

> status <-c("poor","improved","excellent","poor")#顺序变量

> status <- factor(status,ordered = T,levels =c("poor","improved","excellent"))

> status

[1] poorimprovedexcellent poor

Levels: poor < improved < excellent

数值型变量可以用levels和labels参数来编码成因子。如果男性被编码成1，女性被编码成2，则以下语句：

示例

> sex <- c(1,2)

> sex

[1] 1 2

> sex <- factor(sex, levels=c(1, 2),labels=c("Male", "Female"))#数值型变量

> sex

[1] MaleFemale

Levels: Male Female

2.2.6列表

列表（list）是R的数据类型中最为复杂的一种。一般来说，列表就是一些对象（或成分，component）的有序集合。

对R语言的学习总结分享，发现在自己自学方面的问题和经验

1，学习笔记缺乏一定逻辑性，日后回看的时候没发看出清晰逻辑思路，笔记应该本节重要内容，实例、需要注意地方，有疑问地方这方向进行记录，第一章和第二章自学笔记太混乱。

2，R语言学习确实枯燥，所以一定抓住高效注意力的时候进行学习，比如早上注意力明显高于晚上，这种需要大量注意力的学习应该反正在自己注意力高效时段。

3，学以致用，要结合实际工作需求加以练习才是掌握语法高效手段。

4，学习进度还低于自己预期，过于关注点上的东西，不懂的可以先放一放，选过记录之后往后看，后面可能会豁然开朗。

5，身心疲惫时候可以听听别人讲座，这种有意想不到的收益。

最后编辑于：2017.12.05 07:24:43

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342

R语言-数据结构入门-2

推荐阅读更多精彩内容