R数据科学第三章

filter(flights, arr_delay >= 120)
??nycflights13
library(nycflights13)
install.packages("nycflights13")
library(tidyverse)
flights
?flights
View(flights)
calss(flights)

鍙橀噺绫诲瀷

int 鏁存暟锛宒bl 鍙岀簿搴︽诞鐐规暟銆佸疄鏁帮紝dttm 鏃ユ湡+鏃堕棿锛宭gl 閫昏緫鍨嬪彉閲忥紝浠呭寘鎷琓RUE鍜孎ALSE, fctr 鍥犲瓙锛宒ate 鏃ユ湡鍨嬪彉閲?

filter 鎸夎绛涢€?
arrange 缁欒鎺掑簭
select 鎸夊垪绛涢€?
mutate鏍规嵁鐜版湁鐨勫彉閲忓垱寤烘柊鐨勫彉閲?
summarize鎽樿缁熻

浣跨敤filter杩涜绛涢€?

filter(flights, month == 1, day == 1)
jan1 <- filter(flights, month == 1, day == 1)
jan1
(dec25 <- filter(flights, month == 12, day == 25))
dec25
姣旇緝杩愮畻绗?

,>=,<,<=,!+,==
filter(flights, month == 11 | month == 12)
a <- filter(flights, month == 11 | month == 12)
View(a)
filter(flights, month %in% c(11,12))
df <- tibble(x = c(1, NA, 3))
filter(df, x > 1)
filter(df, is.na(x) | x >1)
arrange(flights, year, month, day)
arrange(flights, desc(dep_delay))##闄嶅簭
鏃犺姝e簭鍜屽€掑簭锛岀┖鍊兼帓鍦ㄦ渶鍚?
df <- tibble(x = c(5, 2, NA))
arrange(df, x)
arrange(df, desc(x))
arrange(flights, desc(is.na(dep_time)), dep_time)

select鎸夊垪绛涢€?

select(flights, year, month, day)#鏍规嵁鍒楀悕鍗曢€夋嫨鏌愬嚑鍒?
select(flights,year:day)#杩為€夊嚑鍒?
select(flights, -(year:day))#杩為€?+鍙嶉€?
starts_with("abc")#閫夋嫨abc寮€澶寸殑鍚嶇О
ends_with("eyz") #鍖归厤浠モ€渆yz鈥濈粨灏剧殑鍚嶇О
contains("ijk") #鍖归厤鍖呭惈ijk鐨勫悕绉?
matches("(.)\1") #鍖归厤姝g‘琛ㄨ揪寮忕殑閭d簺鍙橀噺
num_range("x",1:3) #鍖归厤x1,x2,x3
rename(flights,tail_num = tailnum) #閲嶅懡鍚嶏紝淇敼tailnum鏀逛负tail_num
select(flights, time_hour, air_time, everything())#鏌愬嚑鍒楃Щ鍔ㄥ埌寮€澶达紝everyting鏄叾浣欏嚑鍒椼€?
缁冧範
vars <- c("year", "month", "day", "dep_delay", "arr_delay")
select(flights, one_of(vars))
var 鏄痗haracter vector(鐗瑰緛鍚戦噺)銆傝繖鏍峰啓鍑虹殑select锛堬級涓嶉渶瑕佸啓澶氫釜鍚戦噺鍚?
select(flights,contains("YEAR",ignore.case = FALSE)) #鏈潵鏄拷鐣ュぇ灏忓啓锛岃繖鏍锋槸涓嶅拷鐣ュぇ灏忓啓

5. mutate()鐢熸垚鏂板垪

mutate鐢熸垚鏂板垪鍚庯紝娣诲姞鏂板垪鍒版暟鎹鏈熬锛岀敓鎴愭柊鐨勬暟鎹銆倀ransmute鍒欐槸鍙繚鐣欐柊鐢熸垚鐨勫垪锛屽師鏈夌殑鍒楀姞鍑忎箻闄ょ瓑璁$畻鍑虹殑缁撴灉浣滀负鏂板垪

鐢熸垚gain鍜宻peed

flights_sml <- select(flights,
year:day,
ends_with("delay"),
distance,
air_time)
flights_sml
mutate(flights_sml,
gain = dep_delay - arr_delay,
speed = distance / air_time * 60)
鏂板垪鍙互鐩存帴鍙備笌鍙︿竴鏂板垪鐨勭敓鎴?
mutate(flights_sml,
gain = dep_delay - arr_delay,
hours = air_time / 60,
gain_per_hour = gain / hours)
transmute()鍙繚鐣欐柊鍒?
transmute(flights,
gain = dep_delay - arr_delay,
hours = air_time /60,
gain_per_hour = gain / hours)
summarise()##杩涜鍒嗙粍鎽樿
summarise(flights, delay = mean(dep_delay, na.rm = TRUE))
group_by()鍑芥暟浼氫娇summarize鏇存湁鐢?
by_day <- group_by(flights, year, month, day)
summarise(by_day, delay = mean(dep_delay, na.rm = TRUE))

绠¢亾鎿嶄綔

绠¢亾鎿嶄綔浼氱畝鍖栦唬鐮侊紝鏁版嵁妗嗗悕涓嶅繀閲嶅鍐欏娆?

level1鈥斺€旂敓鎴愪腑闂翠骇鐗?

by_day <- group_by(flights, year, month, day)
summarise(by_day, delay = mean(dep_delay, na.rm = TRUE))

level2鈥斺€?

summarise(group_by(flights, year, month, day), delay = mean(dep_delay, na.rm = TRUE))

level3鈥斺€旂閬撴搷浣滈摼鎺ヤ袱姝ワ紝鏁版嵁妗嗗悕鍦ㄦ嫭鍙烽噷闈?

group_by(flights, year, month, day) %>% summarise(delay = mean(dep_delay, na.rm = TRUE))

level4_

flights %>% group_by(year, month, day) %>% summarise(delay = mean(dep_delay, na.rm = TRUE))
锛?2锛夌己澶卞€?
濡傛灉鏁版嵁涓湁NA锛岃绠楃粨鏋滃氨鍏ㄩ儴涓篘A锛屾墍浠ヤ唬鐮佷腑闇€瑕? na.rm = TRUE. 璁$畻鍓嶇Щ闄ょ己澶卞€?
锛堣鏁帮級

璁℃暟

渚嬪瓙锛氭壘鍑哄钩鍧囧欢璇椂闂存渶闀跨殑椋炴満
锛堟牴鎹畉ailname杩涜鍒嗙粍锛屽緱鍒扮殑鏄叏骞村悓涓€鏋堕鏈虹殑鍚勭鏁版嵁锛?
carriers <- group_by(flights, carrier)
s1 <- summarise(carriers, n())
s1
s2 <- count(flights, carrier)

s2
mu <- mutate(carriers,n = n())
s3 <- distinct(mu, n)
s3
s4 <- distinct(mu, carrier, n)
s4
鍥涚鏂规硶缁熻鐨勭粨鏋滄槸涓€鑷寸殑锛宒istinct鏄幓閲嶅銆?

写在最后,学习了好几天,还看了小洁老师的笔记,最后保存时用UTF8,然后就成这样了,弄的自己都不认识,我也是人才,还有我也转换不过去了。这次当交学费了。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容