python :pandas

Pandas知识点总结


Series

Seires类似一维数组,由数组及与之相关的标签组成。

Series的创建:

val=Series(['blue','red','yellow'],index=['a','b','c'])

val2=Series(np.arange(5),index=['a','b','c','d','e'])

//获取数组部分信息:

1.直接根据索引获取

print(val['b])

print(val2[[1,3]])

2.根据条件获取

print(val2[val2<3])

3.闭合切片

print(val['b':'c'])


DataFrame

DataFrame是表格型数据。

创建DataFrame:

import pandas as pd

import numpy as np

data={'state':['ohio','ohio','nevada'],'year':[2001,2003,3004],'pop':[1.3,1.4,1.5]}  //设置一个数据集

df=pd.DataFrame(data,columns=['state','year','pop'],index=['one','two','three'])  //创建DF

data2=pd.DataFrame(np.arange(9).reshape((3,3)),index=['a','b','c'],columns=['num1','num2','num3'])

print(df)

pop  state  year

0  1.3    ohio  2001

1  1.4    ohio  2003

2  1.5  nevada  3004

//获取部分信息的方法

1.根据索引提取

print(df.year) print(df['year'])

print(df.ix['three'])     print(df[2])      //获取横行的方法

print(data2[:2])/   //2是指第2行

print(data.ix('a',['num1','num2']))

2.根据条件提取

print(data.num2>2)  print(data2>5)  //这样输出的是True或False

若要输出数值,则要写print(data[data.num2>2])

//修改

df['year']=2005

df.year=2005

df.year=np.arange(3)

//利用Series修改

val=Series([2003,2004],index=['two','three'])

df.year=val

//赋值于新列

df.economy=['105','108','12']

//重新指定索引

索引是不可以修改的,但可以通过重新引用重新制定索引

obj3=Series(['blue','purple','yellow'],index=[0,2,4])

obj4=obj3.index(range(6),method='ffill')

//删掉某一列或行

data=pd.DataFrame(np.arange(16).reshape((4,4)),index=['onio','colorado','utah','new york'],columns=['one','two','three','four'])

data.drop(['onio'])

data.drop('two',axis=1)  //axis=1代表列

//相互运算

df之间使可以想加或者想见的,但是行数或者列数会相对于原来的发生变化

data=pd.DataFrame(np.arange(9).reshape((3,3)),index=list('123'),columns=['a','b','c'])

a  b  c

1  0  1  2

2  3  4  5

3  6  7  8

data2=pd.DataFrame(np.arange(16).reshape((4,4)),index=list('1234'),columns=['a','b','c','d'])

a  b  c  d

1  0  1  2  3

2  4  5  6  7

3  8  9  10  11

4  12  13  14  15

data+data2

a    b    c  d

1  0.0  2.0  4.0 NaN

2  7.0  9.0  11.0 NaN

3  14.0  16.0  18.0 NaN

4  NaN  NaN  NaN NaN

DF数据类型可以和Series相加

//匿名函数条件的应用

data6=pd.DataFrame(np.arange(16).reshape((4,4)),columns=list('abcd'),index=list('1234'))

a  b  c  d

1  0  1  2  3

2  4  5  6  7

3  8  9  10  11

4  12  13  14  15

def f(x):

      return Series([x.min(),x.max()],index=['min','max'])

print(data6.apply(f,axis=1))

format=lambda x: '%.2f'%x

print(data6.applymap(_format))

//排序

1.按索引排序

print(data6.sort_index())

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容