2021-06-19第二章第二节数据重构

2.4 数据合并

2.4.1载入数据

截屏2021-06-19 13.01.24.png

  • text_left_up=pd.read_csv('./titanic/data/train-left-up.csv')
    text_left_down=pd.read_csv('./titanic/data/train-left-down.csv')
    text_right_up=pd.read_csv('./titanic/data/train-right-up.csv')
    text_right_down=pd.read_csv('./titanic/data/train-right-down.csv')
    发现:四个数据都是train.csv的一部分合并起来将会是一个完整的train.csv

2.4.2合并数据
concat不仅可以指定连接的方式(outer join或inner join)还可以指定按照某个轴进行连接。
join:合并的时候索引的对齐方式,默认是outer join,也可以是inner join
ignore_index:是否忽略掉原来的数据索引

截屏2021-06-19 13.27.29.png

2.4.3合并result_down \ result

  • list_2 = [text_left_down, text_right_down]
    result_down = pd.concat(list_2, axis=1, join='outer', ignore_index=False)
    result_down
  • list_3 = [result_up, result_down]
    result = pd.concat(list_3, axis=0, join='outer', ignore_index=False)
    result
    2.4.4 任务四:使用DataFrame自带的方法join方法和append
  • append是默认(axis = 0)
  • result_up = text_left_up.join(text_right_up)
    result_up
  • result_down = text_left_down.join(text_right_down)
    result_down
  • result = result_up.append(result_down)
    result
    2.4.5 任务五:使用Panads的merge方法和DataFrame的append
  • result = df1.append(df2)
  • merge用于表内部基于 index-on-index 和 index-on-column(s) 的合并,但默认是基于index来合并。
  • result_up = pd.merge ( text_left_up,text_right_up, left_index=True, right_index=True)
    result_up
    参考:https://blog.csdn.net/stevenkwong/article/details/52540605
    截屏2021-06-19 14.14.53.png

    参考:https://zhuanlan.zhihu.com/p/45442554

2.5 换一种角度

2.5.1 任务一:将我们的数据变为Series类型的数据

  • stack()即“堆叠”,作用是将列旋转到行

数据运用

2.6.1 任务一:groupby
Groupby的作用是进行数据的分组以及分组后地组内运算
https://www.cnblogs.com/Yanjy-OnlyOne/p/11217802.html
https://www.jianshu.com/p/42f1d2909bb6

截屏2021-06-19 14.44.39.png

2.6.2 任务二:计算泰坦尼克号男性与女性的平均票价

截屏2021-06-19 14.49.19.png

mean()为平均值
sum()为总和
groupby('分的组类')['被分的数'].mean()
2.6.3 任务三:统计泰坦尼克号中男女的存活人数

  • text.groupby('Sex')['Survived'].sum()

2.6.4 任务四:计算客舱不同等级的存活人数

  • text.groupby('Pclass')['Survived'].sum()

agg更加简洁, 而且传给它的函数可以是字符串,也可以自定义,参数是column对应的子DataFrame
参考:https://zhuanlan.zhihu.com/p/109820274

2.6.5 任务五:统计在不同等级的票中的不同年龄的船票花费的平均值

  • text.groupby(['Pclass','Age'])['Fare'].mean()

2.6.6:任务六:将任务二和任务三的数据合并,并保存到sex_fare_survived.csv

截屏2021-06-19 15.38.33.png

pd.merge 形成了一个新的dataframe

2.6.7:任务七:得出不同年龄的总的存活人数,然后找出存活人数的最高的年龄,最后计算存活人数最高的存活率(存活人数/总人数)

  • Python中的str可以表示字符串类,也可以是将变量强制转换为字符串的函数,写作str()
  • precetn = Survived_sum.max()/Sum_survived
    print("最大存活率:"+str(precetn))


    截屏2021-06-19 22.06.55.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容