数组类型和类型之间的转换
NumPy比Python支持更多的数据类型,本文主要介绍哪些可用,以及如何修改数组的数据类型。
支持的基本类型与C中的基本类型紧密相关:
由于许多具有平台相关的定义,因此提供了一组固定大小的别名:
NumPy数值类型是dtype(数据类型)对象的实例,每个对象都有其独特的特征,导入NumPy后,可使用
在dtypes可作为np.bool_、p.float32等等
有5种基本的数值类型,分别代表布尔(bool),整数(int),无符号整数(uint)浮点(float)和复数。名称中带有数字的,数字则表示该类型的位大小(即,需要多少位来表示内存中的单个值)。某些类型(例如int和 intp)具有不同的位大小,具体取决于平台(例如32位和64位计算机)。在与寻址原始内存的低级代码(例如C或Fortran)接口时,应当考虑到这一点。
数据类型可以用作将python数字转换为数组标量的函数,数字的python序列至该类型的数组,也可以用作许多numpy函数或方法接受的dtype关键字的参数。例如:
数组类型也可以使用字符代码来指代,主要是为了保持与诸如Numeric之类的旧程序包的向后兼容性。一些文档可能仍然引用这些文档,例如:
建议改为使用dtype对象。
要转换数组的类型,请使用.astype()方法(首选)或将类型本身用作函数。例如:
请注意,在上面,我们将Python
float对象用作dtype。NumPy知道int表示np.int_,bool表示np.bool_,float是np.float_,complex是np.complex_。 其它数据类型没有Python等效项。
要确定数组的类型,就要查看dtype属性:
dtype对象还包含有关类型的信息,例如其位宽和字节顺序。数据类型也可以间接用于查询该类型的属性,例如是否为整数:
数组标量
NumPy通常以数组标量(具有关联的dtype的标量)的形式返回数组的元素。数组标量与Python标量不同,但是它们在大多数情况下可以互换使用(主要的例外是v2.x之前的Python版本,其中整数数组标量不能用作列表和元组的索引)。但有一些例外,例如,当代码需要标量的非常特定的属性时,或者当代码专门检查某个值是否为Python标量时。通常,存在的问题很容易被显式转换阵列标量到Python标量,采用相应的Python类型功能固定的(例如,int,float,complex,str,unicode)。
使用数组标量的主要优点是它们保留了数组类型(例如,Python可能没有可用的匹配标量类型int16)。因此,使用数组标量可以确保数组和标量之间的行为相同,而不管该值是否在数组内部。NumPy标量也具有许多与数组相同的方法。
溢出错误
当值需要的数据量大于数据类型中可用的内存时,NumPy数值类型的固定大小可能会导致溢出错误。例如, 正确numpy.power评估64位整数,但给出32749整数的1874919424(不正确)。100 * 10 ** 8
NumPy和Python整数类型的行为对于整数溢出有显著差异,并且可能会使期望NumPy整数的行为类似于Python int的人感到困惑。与NumPy不同,Python int的大小很灵活。这意味着Python整数可以扩展以容纳任何整数,并且不会溢出。
NumPy提供numpy.iinfo并numpy.finfo分别验证NumPy整数和浮点值的最小值或最大值。
如果64位整数仍然太小,则结果可能会强制转换为浮点数。浮点数提供了更大但不精确的可能值范围。
如果你想学习Python,但是找不到学习路径和资源,欢迎来指尖编程。