数据分析基础
一、numpy 库
1.简介
numpy 是一个Python 包,是由一个多维数组对象和利用于数组的列程集合组成的库
2.安装
pip install numpy
3.导入
import numpy as np
4.numpy对象
numpy 的主要对象是同种元素的多维数组。这是一个所有元素都是一种类型、通过一个正整数元组索引的元素表格(通常元素是数字)。在numpy中维度(dimensions)叫做轴(axes),轴的个数叫做秩(rank)
numpy.array(object,dtype=None,copy=True,order=True,subok=False,ndmin=0)
参数解析
object : 任何暴露组接口方法的对象都会返回一个数组或任何(嵌套序列)
dtype :数组的所需数据类型,可选
copy: 可选,默认为True,对象是否被复制
order : c(按行) f(按列) a(任意,默认)
subok : 默认情况下,返回的数组被强制为基类数组。如果为True ,返回子类
ndmin:指定返回的数组的最小维数
numpy.array() 多维示例
import numpy as np
a = np.array([
[1,2,3,4],
[5,6,7,8],
[9,10,11,12]
])
print(a,type(a))
最小维度示例:
import numpy as np
a = np.array([3,2,1],ndmin=1)
b = np.array([3,2,1],ndmin=2)
c = np.array([3,2,1],ndmin=3)
print(a,type(a))
print(b,type(b))
print(c,type(c))
指定数据类型
import numpy as np
a = np.array([3,2,1],dtype=int)
b = np.array([3,2,1],dtype=complex)
print(a,type(a))
print(b,type(b))
5.对象属性
ndarray.ndim
:数组轴的个数,称为秩
ndarray.shape
:数组的维度。这是一个指示数组在每个维度上大小的整数元组,元组的长度称为秩 及维度或者 ndim
ndarray.size
:数组元素的总个数,等于shape属性中元组元素的乘积
ndarray.dtype
: 一个用来描述数组中元素类型的对象,可以通过的创造或指定dtype使用的标准Python类型
ndarray.itemsize
: 数组中每个元素字节的大小
ndarray.data
:包含实际数组元素的缓冲区
6.numpy 的填充函数
zeros():创建一个全是0 的数组
import numpy as np a= np.zeros((3,4)) b=np.zeros((3,4),dtype = int) print(a,a.dtype) print(b,b.dtype)
ones():创建一个全是1 的数组
import numpy as np a = np,ones((3,2,4)) print(a,a.dtype)
empty():创建一个内容随机并且依赖与内存状态的数组
import numpy as np a = np.empty((2,2,2)) print(a,a.dtype)
arange():返回的是一个数组
import numpy as np a = np.arange(2,30,3) print(a,type(a))
7.numpy 随机函数
rand(*nd):创建多维随机组,浮点数(范围是[0,1]),均匀分布
randint(low,high=None,size=None,dtype=’l’):创建随机整数数组,浮点数(范围【low,high】),size是数组尺寸,可以是单个值,可以是数组
numpy.random.choice(a,size=None,replace=True,p=None):从一个给定的一维数组中产生随机数。a为一维数组类似数据或整数;size为数组维度;p为数组的数据出现的概率
所有的范围,包含区间最小值,不包含最大值