一、Numpy与数据
对ndarray类型,其中的所有元素都是同一类型的,如果不是同一类型的,向下转换成同一类型
操作
np.array()
myarray.dtype 元素的数据类型
myarray.itemsize 每个元素的大小 (字节数)
.shape
.size 元素个数
.ndim 维数
.fill(0) 填充为0
.nbytes 占内存空间字节数
索引与切片
从0开始的
narray[1:3]
narray[-2:]
narray[1,1]
narrya[:,1] 第一列
narrya[1] 第一行
narray1 = narray2
两个指向现一个数据
改narray2 ,narrya1跟着变
narray2 = narray1.copy() 两份数据
np.arrange(0,100,10) 构造等差数组
mask = new np.array([1,0,1,1,0],dtype = bool)
narrya[mask] 可以按mask取数据
np.where()
myarray=np.array([1,2,3,4,5],dtype=np.float32)
myarray=np.array([1,2,3,4,'str'],dtype=np.object)
np.asarray(array1,dtype=np.float)
array2 = array1.astype(np.float32)
二、数值运算与排序操作
数值计算
np.sum(array1) 求和
按维度求和
np.sum(array1,axis=0)
np.sum(array1,axis=1)
np.sum(array1,axis=-1) 最后一个轴
array1.sum()
array1.prod(axis=0)乘积
array1.min(axis=0) 最小值
array1.max(axis=0) 最大值
array1.argmin(axis=0) 最小值的索引
array1.argmax(axis=0)
array1.mean(axis=0) 均值
array1.std(axis=0) 标准差
array1.var(axis=0) 方差
array1.clip(2,4) 做限制最大、最小值
array1.round(decimals=1)
排序
np.sort(array1,axis=0) 默认轴是-1
np.argsort()
array1=np.linspace(0,10,10)
values = np.array([2.5,6.5.9.5])
np.searchsorted(array1,values) array1必须是排充好的数组
np.lexsort()
3. 数组形状操作与生成函数
3.1数据形状操作
myarray= np.arange(10)
myarray.shape = 2,5
myarray.reshape(1,10)
增加维度
myarray2 = myarra[:,np.newaxis]
myarray2 = myarra[np.newaxis,:]
压缩
myarray2 = myarray.squeeze()
转置
myarray.transpose()
myarray.T
数组的连接
c=np.concatenate((a,b),axis=0)
np.vstack((a,b))
np.hstack((a,b))
拉平
a.flatten() a.reval()
3.2 数据的生成
np.arange(10)
np.arange(2, 10, 2,dtype=np.float32) 不包括尾
np.linespace(0,10,50) 从0到10,平均分布50个数, 包括头尾
np.logspace(1,10) 默认是以10为底
print(help(logspace(1,10))) 查找帮助
x,y = np.meshgrid(x,y) 构造一个表格
np.r_[0:10:1] 构造一个行向量
np.c_[0:10:1] 构造一个行向量
4. 生成函数、四则运算与随机模块
4.1 常用生成函数
np.zeros(3) np.zeros((3,3)) np.ones((3,3),dtype=np.float32)
np.ones((3,3))*8 全是8的
a = np.empty(5)
a.fill(8)
np.zeros_like(a) np.ones_like(a)
np.identity(5) 对角线全为1
4.2 四则运算9分钟39秒
np.multiply(a,b) 对应位置乘法
np.dot(a,b) 矩阵乘法
a * b 对应位置乘法,会补全
a == b 对应位置比较
np.logical_and(x,y) np.logical_or(x,y) np.logical_not(x,y)
4.3 随机模块
np.random.rand(3,2)
np.random.randint(10,size=(3,2)) 0-10 3*2
np.random.randint(0,10,3) 0-10三个数
np.random.rand()
np.random.rand_sample()
np.random.normal(mu,segma,10) 10个数的高斯分布
np.set_printoptions(precision=2) 设置打印精度
洗牌
np.random.shuffle(b)
随机的种子
np.random.seed(0)
种子一样,生成的随机数会一样。
5. 文件读写与数组保存
5.1 文件读写
写文件
%%writefile myfile.txt
1 2 3 4 5
6 7 8 9 10
data = []
with open ("myfile.txt") as f:
for line in f.readlines():
fields = line.split()
cur_data = [float(x) for x in fields]
data.append(cur_data)
data = np.array(data)
#使用numpy读文件
data = np.loadtxt("myfile.txt", delimiter=',' skiprows =1)
#设置分隔符 ,跳过标题行等参数 usecols = (0,1,4)指定哪几列
#写文件
np.writetext('myfile2.txt', myarray, fmt="%d", delimiter = ',')
5.2 数组保存
读写array结构
myarray = np.array([[1,2,3],[4,5,6]])
np.save('myarray.npy',myarray)
myarray2 = np.load('myarray.npy')
# 保存多个数据到一个文件中
np.savez('ttt.npz',a=myarray,b=myarray2)
data = np.load('ttt.npz')
data.keys() #列出Key值
data['a'] #访问数据
data['b']