Python 学习笔记 Lesson 05(Pandas入门)

​这个编程系列我采用的方法是,照着老师课件一步步跟做,遇到问题就记录,能搜索解决就搜索解决,搜不到的去提问,尽量找到解答。

简书专栏里有非常完备的新手上路指南(从下载软件开始),我就不一步步搬运了。


Pandas入门

Pandas和NumPy一样,也是在Python基础上开发的另一个工具包,里面有各种工具,解决对应问题。不同于Numpy只能存储一种数据形式,Pandas可以处理多种不同类型的数据。

整体来说,我感觉Pandas是个专注处理批量表格类数据的强大工具包,你可以用它进行数据分析,输出结果也都是正儿八经的表格形式,就像通常办公软件做出来的那样(行、列标签清晰明了)。(仅以目前学到的来看,它旗下有些功能有点像进阶版的excel,以后应该还会有更多更强大的延伸)

一. 知识点提取

1.就像Numpy的操作对象是数组,这节主要介绍Pandas下的两个对象,一个是DataFrame(数据框),另一个是Series。

DataFrame就是一个数据表格

Series只是一列数据表格,类似于一个一维数组,只是前面多了一列索引

2.如何选择数据

选列

[‘列标签’] --- 生成series(一列带索引的数)

.列标签 --- 生成series(一列带索引的数)

[[‘列标签’ ,’列标签’]] --- 选一列,或者多列,生成DataFrame(表格)

.loc[‘列标签’, ’列标签’, …] --- 选一列,或者多列,生成DataFrame(表格)

.loc[:, [‘列标签’, ’列标签’, …] ] --- 选某几列(:代表所有行),生成DataFrame(表格)

.iloc[ : , [‘列索引’, ’列索引’, …] ] --- 选某几列(:代表所有行),生成DataFrame(表格)

说明:以上所指列标签即列名(表头),索引指的是数字(0,1,2…)。

选行

例如[2: 5] , 使用行索引(数字),类似于二维数组切片,是使用[ ]的唯一方法

.loc[‘行标签’, ’行标签’] --- 使用行标签(可用专门的字符缩写,行标签从某种程度上也表示了每行数据主要按照什么进行区分和排列,比如国家、年代等)

.iloc[ [‘行索引’, ’行索引’, …] ] --- 使用索引

说明:以上所选均为对应行的所有列,故都生成DataFrame(表格)。

选行和列

.loc[ [‘行标签’, ’行标签’, …], [‘列标签’,’列标签’, …] ]  --- 某几行某几列,标签是列名(多为字符)

.iloc[ [‘行索引’, ’行索引’, …], [‘列索引’,’列索引’, …] ]  --- 某几行某几列,索引是数字

总结:.loc用标签,.iloc用索引

布尔索引筛选

布尔索引的使用和Numpy二维数组类似,即先采用判断条件获得一个Boolean Series,然后以此为筛子,筛选对应满足条件(True)的数据。

此处应注意,虽然『筛子』是Series类型,但是筛选之后返回的数据,则是跟原数据一致的,即DataFrame返回DataFrame,Series返回Series。

二. 作业问题总结:

1、or在这里是错误用法,要用 | ,同理 &。

2、采用『: 』选择数据时,这部分不加[ ],直接写。

3、使用布尔索引时[ ]内的条件判断外,不需要再加()

4、很多语句不熟悉,猜导致不会使用,比如 isin,Python的语法形式真的非常简单直接,虽然是代码,但是感觉是精简版的人类语言表达式,一点也不拐弯抹角,比如这个isin。

5、不另外设变量,直接用[ ]套[ ]的模式也能出结果,但是容易出错,比如括号对不上,或是长句子不容易检查错误。胜在一句话搞定,少写一行代码。到底哪种方式更适用,需要以后使用中再感受。

三. 体会:

这部分内容看起来比较碎,但是实际上核心就讲了一个,即数据的选取。对待这种非常零散的东西,最好的方法就是自己归纳总结,然后对应薄弱的地方,练习练习再练习。

将散碎的东西穿成串虽然略繁琐,但是慢慢捋顺的过程也是跳出这些,逐渐给自己建立一个框架的过程,不然,脑袋里越糊越多就越想放弃。不识庐山真面目,只缘身在此山中,大概有点这个意思。

从上往下看就会发现,俯视图往往藏奥义。


Python笔记系列(不只是笔记):

Python 学习笔记 Lesson 04

Python 学习笔记 Lesson 02 & 03

Python 学习笔记 Lesson01

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容