标签: 读书笔记 python 数据分析
1. 创建ndarray(多维数组对象)
函数 | 说明 |
---|---|
array | 将参数数据(列表,元祖,数组等序列类型)转换为ndarray,可指定dtype |
arange | 类似range,但返回的是一个ndarray而不是列表 |
ones | 根据指定的形状和dtype创建一个全1数组 |
ones_like | 以另一个数组为参数,根据其形状和dtype创建一个全1数组 |
zeors,zeros_like | 全0数组 |
empty,empty_like | 创建新数组,只分配内存空间但不填充任何值 |
eye,identity | 创建一个正方的N*N单位矩阵(对角线为1,其余为0) |
astype(type) | 数组转换为dtype为type的数组 |
In: import numpy as np
#array
In: np.array([[1,2,3],[4,5,6]])
Out:
array([[1,2,3],
[4,5,6]])
In: np.array([1,2,3],dtype=np.int32)
Out: array([1,2,3])
#arange
In: np.arange(3)
Out: array([0,1,2])
#ones
In: np.ones((2,3))
Out:
array([[1,1,1],
[1,1,1]])
2. 数组和标量之间的运算
- 大小相等的数组之间的算数运算会将运算应用的元素级,各个相同位置的元素进行各自运算
- 数组与标量的算术运算会将标量值传播到各个元素进行运算
3. 基本的索引和切片
- 按索引访问元素
In: arr = arange(10)
In: arr
Out: array([0,1,2,3,4,5,6,7,8,9])
In: arr[5]
Out: 5
In: arr[5:8]
Out: array([5,6,7])
#将一个标量值赋值给一个切片时,该值会自动传播(广播)到整个选区
In: arr[5:8] = 12
In: arr
Out: array([0,1,2,3,4,12,12,12,8,9])
In: arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])
In: arr2d[2,2]
Out: 9
In: arr2d[2]
Out: array([7,8,9])
- 与python普通列表切片的区别:普通列表的切片是列表切片部分的复制;数组切片是原始数组部分的引用(考虑到大数据量数组的性能问题),即切片上的任何修改都会直接反映到源数组上。
In: arr1 = arr[5:8]
In: arr1
Out: array([0,1,2,3,4,12,12,12,8,9])
In: arr1[1] = 12345
In: arr
Out: array([0,1,2,3,4,12,12345,12,8,9])
- 如果需要数组切片的副本而非引用,需要显示进行复制操作
arr2 = arr[5:8].copy()
- 多维数组切片
In: arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])
#从第一个轴切片
In: arr2d[:2]
Out:
array([[1,2,3],
[4,5,6]])
#一次从多个轴切片
In: arr2d[1:2,1:]
Out:
array([[5,6]])
#某一个轴直接用索引,得到的结果数组的维度将降低一维
In: arr2d[1,:2]
Out:
arrary([4,5])
#只有冒号,表示选取整个轴
In: arr2d[:,:1]
Out:
array([[1],
[4],
[7]])
#对切片的赋值会传播到整个切片区域
In: arr2d[:2,1:] = 0
In: arr2d
Out:
array([[1,0,0],
[4,0,0],
[7,8,9]])
- 通用函数
待续...