pandas和numpy使用小记

numpy数组不可以扩展

可是它最大的缺点就是不可动态扩展——“NumPy的数组没有这种动态改变大小的功能,numpy.append()函数每次都会重新分配整个数组,并把原来的数组复制到新数组中。

http://blog.chinaunix.net/uid-23100982-id-3164530.html

numpy数组的展平

可以用flatten,也可以用numpy.ravel()

比如下面这个数组

arr = np.arange(10).reshape(1,2,5)
Out[40]:
array([[[0, 1, 2, 3, 4],
[5, 6, 7, 8, 9]]])
可以使用fatten和ravel函数进行展平

arr.flatten()

numpy.ravel(arr)

Out[41]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

numpy数组合并

如果只有两个元素,那么用append合并就行

如果有三个或者以上的元素,那么用numpy.concatenate这个函数

numpy.concatenate((a1, a2, ...), axis=0)
把n个数组放到一个tuple里面,作为一个大参数(a1, a2, ...)放到concatenate这个函数里面

python list 合并

python list合并,可以用append,extend,也可以直接用+号进行

z=x+y

numpy 数组的初始化和循环填充

有的时候想新建个array,然后通过循环不断append补充这个数组。后来看到stackoverflow上说这个是非常低效率的。

numpy的array一般是先初始化好尺寸的数组,全附上0,然后再一个一个修改这个值。而不是不断的扩充数组结构。

比如下面这个就是不太推荐的写法

big_array # Initially empty. This is where I don't know what to specify
for i in range(5):
array i of shape = (2,4) created.
add to big_array
参考http://stackoverflow.com/questions/4535374/initialize-a-numpy-array

python目录遍历

一个用os库

一个用glob库

list,array,dataframe,mat 几个容器的使用

list如果能用就用,最底层,效率也最高的元素,而且支持字符和数字混搭

np的array付给他更多的操作,但是不支持字符,需要chararray才能混搭,chararray其实功能不是特别强大,所以不推荐numpy的数组里面混搭文字和数字

np的dataframe适合大小规模的选择和操作,但是不适合一点点增添,最好是先把一个大的array都鼓捣好了一个,一整个array直接全塞进去。

所以基本是简单的数据用list,需要做处理的中低层的数据用array,然后烩成一锅全装进dataframe做大规模范围的数据分析。 如果需要矩阵操作的时候才使用numpy的mat

这是我的理解。

许多python和numpy对某个数据的处理,不会改变数据本身,而是把结果拷贝出来输出给其他对象

比如s.join('something')

arr.append(arr2)

对dataframe columns的选择

dataframe一般都是根据标签选择列,比如dataframe['feature1']

同时也可以使用ix,按照列数进行选择,比如选择第一列和第二列 df.ix[:,0:2]

如果选择的是多个列,那么会返回的是dataframe对象

而如果只选择一个列,那么会返回series对象,这个比较蛋疼。

python format字符串的输出

str.format() //str是字符串

  1. format函数前的str字符串可以用{}来做占位符

‘a is {},b is {}’.format(a,b)

  1. 也可以在{}里面加数字用来和后面的变量进行对应

‘a is {1},b is {2}, a is {1}’.format(a,b)

  1. 还可以用讲里面的数字视为对象本身
    比如lis=['xiaoming','xiaowang']
    ‘my name is {0[0]},his name is {0[1]}’.format(lis)

  2. {}里面还可以对输出的精度和进制进行输出

'the number is {:.2f}'.format(332.245)

'the binary value of the number is {:b}'.format(332.245)

dataframe之间做运算,要用到.values 除法
for i in range(len):
df3[i]=df1[i]-df2[i].values
一个dataframe,和另一个dataframe的values才可以做直接的运算

dataframe的slicing
df=pd.DataFrame()
df[1] #这个是不行的
df[1:2] #这样才行 有头有尾才行 或者写成df.ix[1,:] #最好用index进行slice的,都用.ix这个函数进行slice,这样规范一些。

dataframe每行都减去前一行 怎么实现(第一行保持原值
方法一:用index进行整体减法
df[:-1] -df[1:]
方法二: 自己笨笨的写循环呗。
for i in range(1,length):
df.ix[i,:]-df.ix[i-1,:]
方法三:调用shift方法,
df-df.shift(1) #df.shift(1) 就是df整体下移的结果,至于新dataframe的首行则为nan,需要自己再手动赋0

df.fillna(inplace=True, method='ffill') inplace就是自己替换自己了

两个120的数组如何合成一个220的数组?用asarray

np.asarray(np.random.randn(10),np.random.randn(10))

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容