数据分析基础

一、numpy 库

1.简介

numpy 是一个Python 包,是由一个多维数组对象和利用于数组的列程集合组成的库

2.安装

 pip install numpy

3.导入

import numpy as np

4.numpy对象

numpy 的主要对象是同种元素的多维数组。这是一个所有元素都是一种类型、通过一个正整数元组索引的元素表格(通常元素是数字)。在numpy中维度(dimensions)叫做轴(axes),轴的个数叫做秩(rank)

  numpy.array(object,dtype=None,copy=True,order=True,subok=False,ndmin=0)

参数解析

object : 任何暴露组接口方法的对象都会返回一个数组或任何(嵌套序列)
dtype :数组的所需数据类型,可选
copy: 可选,默认为True,对象是否被复制
order : c(按行) f(按列) a(任意,默认)
subok : 默认情况下,返回的数组被强制为基类数组。如果为True ,返回子类
ndmin:指定返回的数组的最小维数

numpy.array() 多维示例

import numpy as np
a = np.array([
        [1,2,3,4],
        [5,6,7,8],
        [9,10,11,12]
])
print(a,type(a))

最小维度示例:

import numpy as np
a = np.array([3,2,1],ndmin=1)
b = np.array([3,2,1],ndmin=2)
c = np.array([3,2,1],ndmin=3)
print(a,type(a))
print(b,type(b))
print(c,type(c))

指定数据类型

import numpy as np
a = np.array([3,2,1],dtype=int)
b = np.array([3,2,1],dtype=complex)

print(a,type(a))
print(b,type(b))

5.对象属性

ndarray.ndim:数组轴的个数,称为秩

ndarray.shape:数组的维度。这是一个指示数组在每个维度上大小的整数元组,元组的长度称为秩 及维度或者 ndim

ndarray.size:数组元素的总个数,等于shape属性中元组元素的乘积

ndarray.dtype : 一个用来描述数组中元素类型的对象,可以通过的创造或指定dtype使用的标准Python类型

ndarray.itemsize: 数组中每个元素字节的大小

ndarray.data :包含实际数组元素的缓冲区

6.numpy 的填充函数

  • zeros():创建一个全是0 的数组

      import numpy as np
      a= np.zeros((3,4))
      b=np.zeros((3,4),dtype = int)
      print(a,a.dtype)
      print(b,b.dtype)
    
  • ones():创建一个全是1 的数组

      import numpy as np
      a = np,ones((3,2,4))
      print(a,a.dtype)
  • empty():创建一个内容随机并且依赖与内存状态的数组

      import numpy as np
      a = np.empty((2,2,2))
      print(a,a.dtype)
  • arange():返回的是一个数组

      import numpy as np
      a = np.arange(2,30,3)
      print(a,type(a))

7.numpy 随机函数

rand(*nd):创建多维随机组,浮点数(范围是[0,1]),均匀分布

randint(low,high=None,size=None,dtype=’l’):创建随机整数数组,浮点数(范围【low,high】),size是数组尺寸,可以是单个值,可以是数组

numpy.random.choice(a,size=None,replace=True,p=None):从一个给定的一维数组中产生随机数。a为一维数组类似数据或整数;size为数组维度;p为数组的数据出现的概率

所有的范围,包含区间最小值,不包含最大值