numpy&pandas函数总结

    xiaoxiao2022-07-07  196

    导入numpy

    属性:

    ndarray 多维数组属性如下itermsize 每个项占用多少个字节dtype 多维数组是整体什么类型size 多维数组有多少项shape 多维数组的形状 几行几列ndim 数组的维数nbytes 数组中所有数据消耗的字节数

    方法:

    np.array([0,1,2,3]) 创建一个数组 []或()

    np.mat([[1,2],[3,4]) 生成一个矩阵

    np.arange(5) 从0开始5个数字当做数组

    np.random.rand(100) 返回一个或一组 “0-1”均匀分布的随机样本值。随机样本取值范围是[0,1)

    np.random.randn(100,1) 返回一个或一组服从标准分布0为均数、以1位标准差的正太分布 N(0,1) -1.96~+1.96 95%,-2.58~+2.58 99%

    np.random.randint(low,high=None,size=None,dtype=‘I’) 返回随机整数或整数型数组,范围区间为[low,high)

    np.concatenate([a,b],axis=-1) 合并多个ndarray 按照列来合并

    numpy.random.normal(loc=0,scale=1e-2,size=shape)

    参数loc(float):正态分布的均值,对应着这个分布的中心。loc=0说明这一个以Y轴为对称轴的正态分布,参数scale(float):正态分布的标准差,对应分布的宽度,scale越大,正态分布的曲线越矮胖,scale越小,曲线越高瘦。参数size(int 或者整数元组):输出的值赋在shape里,默认为None。

    np.meshgrid(x,y) 网格点矩阵x和y为ndarray

    a = a.reshape((5, 5)) 将a设置成5行5列的二维数组

    a.dot(b) 矩阵乘法 也是两个数组的点积

    a.sum() 累加所有项

    a.min() 找到最小值

    a.max() 找到最大值

    a.cumsum() 累加函数//a = np.arange(10) print(a.cumsum()) # >>>[ 0 1 3 6 10 15 21 28 36 45]

    x = np.linspace(-np.pi, np.pi, 256, endpoint=True) 返回-pi到pi连续256个数包含结尾结点

    c = np.where(a >= 50)[0] 找出大于50的数

    a = np.arange(0, 100, 10) b = np.where(a < 50) c = np.where(a >= 50)[0] print(b) # >>>(array([0, 1, 2, 3, 4]),) print(c) # >>>[5 6 7 8 9]

    导入pandas

    df:DateFrame

    方法:

    nvda = pd.read_csv(“data/NVDA.csv”, index_col=0, parse_dates=[0]) 导入csv文件设置索引,nvda为DataFrame类型df.corr() 两个维度的关联程度df.describe() 查看数据详情df.plot.bar(figsize=(8,6)) 画条形图设置大小为df.plot() 画图 如果在juypter notebook下 导入%matplotlib inline即可 kind参数 bar或barh为条形hist为直方图box为盒型图 上边缘(Q3+1.5IQR/“箱子高度”)、下边缘(Q1-1.5IQR/“箱子高度”)、IQR=Q3-Q1上四分位数(Q3)、下四分位数(Q1)中位数异常值处理异常值时与3 ? 标准的异同:统计边界是否受异常值影响、容忍度的大小 area为“面积”scatter为散点图 散点图需要设置x与ypie 为饼状图 按y来分需要指定y figsize=(8,6) 设置图像大小stacked = True 将图像进行堆积(用于bar条形图)alpha=0.5 设置透明度为0.5x scatter需要设置x轴 y轴y scatter需要设置x轴 y轴
    最新回复(0)