《Python数据分析》一2.4 NumPy的数值类型

    xiaoxiao2024-03-06  132

    本节书摘来自异步社区《Python数据分析》一书中的第2章,第2.4节,作者【印尼】Ivan Idris,更多章节内容可以访问云栖社区“异步社区”公众号查看

    2.4 NumPy的数值类型

    Python自身虽然支持整型、浮点型和复数型,但对于科学计算来说,还远远不够。现实中,我们仍然需要更多的数据类型,来满足在精度和存储大小方面的各种不同的要求。为此,NumPy提供了更加丰富的数据类型。注意,NumPy跟数学运算有关的数据类型的名称都以数字结尾。而这个数字指示了该类型的变量所占用的二进制位数。表2-1(改编自《NumPy用户指南》)概述了NumPy的各种数值类型。

    每一种数据类型都有相应的转换函数(请参考本书代码包中的numericaltypes.py文件),如下所示:

    In: float64(42) Out: 42.0 In: int8(42.0) Out: 42 In: bool(42) Out: True In: bool(0) Out: False In: bool(42.0) Out: True In: float(True) Out: 1.0 In: float(False) Out: 0.0

    许多函数都带有一个指定数据类型的参数,该参数通常是可选的:

    In: arange(7, dtype=uint16) Out: array([0, 1, 2, 3, 4, 5, 6], dtype=uint16)

    谨记:不允许把复数类型转化成整型。当你企图进行这种转换时,将会触发TypeError错误,就像下面这样:

    In: float(42.0 + 1.j) Traceback (most recent call last):  File "numericaltypes.py", line 45, in    print float(42.0 + 1.j) TypeError: can't convert complex to float

    同样,也不允许把复数转化成浮点数。另外,复数的分量j是其虚部的系数。不过,允许把浮点数转换成复数,如complex(1.0)是合法的。复数的实部和虚部分别使用real()函数和imag()函数提取。

    2.4.1 数据类型对象

    数据类型对象是numpy.dtype类的实例。数组是一种数据类型。严格来讲,NumPy数组中的每个元素都要具有相同的数据类型。数据类型对象表明了数据占用的字节数。所占用字节的具体数目一般存放在类dtype(详见dtypeattributes.py文件)的itemsize属性中。

    In: a.dtype.itemsize Out: 8

    2.4.2 字符码

    NumPy之所以提供字符码,是为了与其前身Numeric向后兼容。一般不建议使用字符码,这里为什么又提供这些代码呢?因为我们会在许多地方碰到它们,但是,编写代码时应当使用dtype对象。表2-2展示了一些数据类型及其相应的字符码。

    下面的代码(代码取自本书代码包中的charcodes.py文件)将生成一个单精度浮点型的数组:

    In: arange(7, dtype='f') Out: array([ 0., 1., 2., 3., 4., 5., 6.], dtype=float32)`

    类似地,下列代码将创建一个负数类型的数组:

    In: arange(7, dtype='D') Out: array([ 0.+0.j, 1.+0.j, 2.+0.j, 3.+0.j, 4.+0.j, 5.+0.j, 6.+0.j])

    2.4.3 Dtype构造函数

    创建数据类型时,手段有很多,下面以浮点型数据为例进行说明(以下代码取自本书代码包中的dtypeconstructors.py文件)。

    可以用Python自带的常规浮点型,代码如下所示:`

    In: dtype(float)   Out: dtype('float64')

    可以用字符码规定单精度浮点数,代码如下所示:

    In: dtype('f')   Out: dtype('float32')

    可以用字符码定义双精度浮点数,代码如下所示:

    In: dtype('d')   Out: dtype('float64')

    可以向dtype构造函数传递一个双字符码。其中,第一个字符表示数据类型,第二个字符是一个数字,表示该类型占用的字节数(数字2、4和8分别对应于16位、32位和64位浮点数):

    In: dtype('f8')   Out: dtype('float64')

    可以通过sctypeDict.keys()函数列出所有数据类型的字符码,代码如下所示。注意,由于输出内容过多,这里只截取了部分内容。

    In: sctypeDict.keys() Out: [0, … 'i2', 'int0']

    2.4.4 dtype属性

    类dtype提供了许多有用的属性,如可以通过dtype的属性获取某种数据类型对应的字符码(以下代码取自本书代码包中的dtypeattributes2.py文件):

    In: t = dtype('Float64') In: t.char Out: 'd'

    类型属性相当于数组元素对象的类型:

    In: t.type Out: <type 'numpy.float64'>

    dtype的属性str中保存的是一个表示数据类型的字符串,其中第一个字符描述字节顺序,如果需要,后面会跟着字符码和数字,用来表示存储每个数组元素所需的字节数。这里,字节顺序(endianness)规定了32位或64位字内部各个字节的存储顺序。对于大端(big-endian)顺序,先存放权重最高的字节,用符号>指出。当使用小端(little-endian)顺序时,先存放权重最低的字节,用符号<指出。下面以代码为例进行说明:

    In: t.str Out: '<f8' 相关资源:敏捷开发V1.0.pptx
    最新回复(0)