Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy、matplotlib一起使用。其实,list已经提供了类似于矩阵的表示形式,不过numpy为我们提供了更多的函数。
numpy下载
- Anaconda自带
- pip install -i https://pypi.douban.com/simple numpy
numpy创建数组
另外还有linspace函数,可以在范围内创建数组,randn和rand也可以生成数组。具体看下面代码
import numpy as np
print('使用zeros/empty/ones')
print(np.zeros(10))# 生成包含10个0的一维数组
print(np.zeros((3, 6)))# 生成3*6的二维数组
print(np.empty((2, 3, 2)))# 生成2*3*2的三维数组,所有元素未初始化
print(np.ones_like(np.arange(6).reshape(2,3)))#生成两行三列形状的用1填充的数组
#array和asarray都可以将结构数据转化为ndarray
# 但是主要区别就是当数据源是ndarray时,array仍然会copy出一个副本,占用新的内存,但asarray不会
#在这个例子中array和asarray没有区别,都对元数据进行了复制
data1=[[1,1,1],[1,1,1],[1,1,1]]
arr2=np.array(data1)
arr3=np.asarray(data1)
data1[1][1]=2
print('data1:\n',data1)
print('arr2:\n',arr2)
print('arr3:\n',arr3)
arr1=np.ones((3,3))
arr2=np.array(arr1)
arr3=np.asarray(arr1)
arr1[1]=2
print('arr1:\n',arr1)
print('arr2:\n',arr2)
print('arr3:\n',arr3)
#np.identity只能创建方形矩阵
#np.eye可以创建矩形矩阵,且k值可以调节,为1的对角线的位置偏离度,0居中,1向上偏离1,2偏离2,以此类推,-1向下偏离
#numpy.eye(N,M=None, k=0, dtype=<type 'float'>)
#第一个参数:输出方阵(行数=列数)的规模,即行数或列数
#第三个参数:默认情况下输出的是对角线全“1”,其余全“0”的方阵,如果k为正整数,则在右上方第k条对角线全“1”其余全“0”,k为负整数则在左下方第k条对角线全“1”其余全“0”。
print(np.identity(3))
print(np.eye(3))
print(np.eye(3,k=1))
#补充numpy.linspace方法,例如,在从1到3中产生9个数:
print(np.linspace(1,3,9).reshape(3,3))
#numpy中有一些常用的用来产生随机数的函数,randn()和rand()就属于这其中。
#numpy.random.randn(d0, d1, …, dn)是从标准正态分布中返回一个或多个样本值。
#numpy.random.rand(d0, d1, …, dn)的随机样本位于[0, 1)中
arr1 = np.random.randn(2,4)#2行4列数组
print(arr1)
print('******************************************************************')
arr2 = np.random.rand(2,4)
print(arr2)
numpy数据类型
数据类型的操作
- 创建ndarray时指定dtype类型
- 使用astype显示转换类型
print('生成数组时指定数据类型')
arr = np.array([1, 2, 3], dtype = np.float64)
print(arr)
print(arr.dtype)
arr = np.array([1, 2, 3], dtype = np.int32)
print(arr)
print(arr.dtype)
print('使用astype复制数组并转换数据类型')
int_arr = np.array([1, 2, 3, 4, 5])
float_arr = int_arr.astype(np.float)
print(int_arr.dtype)
print(float_arr.dtype)
print('使用astype将float转换为int时小数部分被舍弃')
float_arr = np.array([3.7, -1.2, -2.6, 0.5, 12.9, 10.1])
int_arr = float_arr.astype(dtype = np.int)
print(int_arr)
print('使用astype把字符串转换为数组,如果失败抛出异常。')
str_arr = np.array(['1.25', '-9.6', '42'], dtype = np.string_)
float_arr = str_arr.astype(dtype = np.float)
print(float_arr)
print('astype使用其它数组的数据类型作为参数')
int_arr = np.arange(10)
float_arr = np.array([.23, 0.270, .357, 0.44, 0.5], dtype = np.float64)
print(int_arr.astype(float_arr.dtype))
print(int_arr[0], int_arr[1]) # astype做了复制,数组本身不变。
NumPy的ndarray 数组和标量之间的运算
不用编写循环即可对数据执行批量运算
大小相等的数组之间的任何算术运算都会将运算应用到元素级
数组与标量的算术运算也会将那个标量值传播到各个元素
# 数组乘法/减法,对应元素相乘/相减。
arr = np.array([[1.0, 2.0, 3.0], [4., 5., 6.]])
print(arr * arr)
print(arr - arr)
print
# 标量操作作用在数组的每个元素上
arr = np.array([[1.0, 2.0, 3.0], [4., 5., 6.]])
print(1 / arr)
print(arr ** 0.5) # 开根号
NumPy的ndarray 基本的索引和切片
- 数组切片
a = np.array([2, 0, 1, 5, 8, 3])
#类似于列表的切片
print(a[:-2])#[2 0 1 5]
print(a[-2:])#[8 3]
print(a[:1])#[2]
print(a[::-1])#反转[3 8 5 1 0 2]
print(a[0:-1:2])#[2 1 8]
print('使用切片访问和操作数组')
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print(arr[1:6]) # 打印元素arr[1]到arr[5]
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr[:2]) # 打印第1、2行
print(arr[:2, 1:]) # 打印第1、2行,第2、3列
print(arr[:, :1]) # 打印第一列的所有元素
arr[:2, 1:] = 0 # 第1、2行,第2、3列的元素设置为0
print(arr)
- 通过索引操作
# 通过索引访问二维数组某一行或某个元素
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr[2])
print(arr[0][2])
print(arr[0, 2]) # 普通Python数组不能用。
print
# 对更高维数组的访问和操作
arr = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
print(arr[0]) # 结果是个2维数组
print(arr[1, 0]) # 结果是个2维数组
old_values = arr[0].copy() # 复制arr[0]的值
arr[0] = 42 # 把arr[0]所有的元素都设置为同一个值
print(arr)
arr[0] = old_values # 把原来的数组写回去
print(arr)
- ndarray 布尔型索引、
import numpy as np
import numpy.random as np_random
print('使用布尔数组作为索引')
name_arr = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
rnd_arr = np_random.randn(7, 4) # 随机7*4数组
print(rnd_arr)
print(name_arr == 'Bob') # 返回布尔数组,元素等于'Bob'为True,否则False。
print(rnd_arr[name_arr == 'Bob']) # 利用布尔数组选择行,显示第一行和第四行
print(rnd_arr[name_arr == 'Bob', :2]) # 在上一个的基础上增加限制打印列的范围
print(rnd_arr[-(name_arr == 'Bob')]) # 对布尔数组的内容取反,布尔数组选择行反转
mask_arr = (name_arr == 'Bob') | (name_arr == 'Will') # 逻辑运算混合结果
print(rnd_arr[mask_arr])
rnd_arr[name_arr != 'Joe'] = 7 # 先布尔数组选择行,然后把每行的元素设置为7。
print(rnd_arr)
- ndarray 花式索引
print('Fancy Indexing: 使用整数数组作为索引')
arr = np.empty((8, 4))
for i in range(8):
arr[i] = i
print(arr)
print(arr[[4, 3, 0, 6]]) # 打印arr[4]、arr[3]、arr[0]和arr[6]。
print(arr[[-3, -5, -7]]) # 打印arr[5]、arr[3]和arr[1]行
arr = np.arange(32).reshape((8, 4)) # 通过reshape变换成二维数组
print(arr)
print(arr[[1, 5, 7, 2], [0, 3, 1, 2]]) # 打印arr[1, 0]、arr[5, 3],arr[7, 1]和arr[2, 2]
print(arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]) # 1572行的0312列
print(arr[np.ix_([1, 5, 7, 2], [0, 3, 1, 2])]) # 可读性更好的写法
NumPy的ndarray 数组转置和轴对换
import numpy as np
import numpy.random as np_random
print('转置矩阵')
arr = np.arange(15).reshape((3, 5))
print(arr)
print(arr.T)
print
print('转置矩阵做点积')
arr = np_random.randn(6, 3)
print(arr)
print(np.dot(arr.T, arr))
print
print('高维矩阵转换')
arr = np.arange(16).reshape((2, 2, 4))
print(arr)
'''
详细解释:
arr数组的内容为
- a[0][0] = [0, 1, 2, 3]
- a[0][1] = [4, 5, 6, 7]
- a[1][0] = [8, 9, 10, 11]
- a[1][1] = [12, 13, 14, 15]
transpose的参数为坐标,正常顺序为(0, 1, 2, ... , n - 1),
现在传入的为(1, 0, 2)代表a[x][y][z] = a[y][x][z],第0个和第1个坐标互换。
- a'[0][0] = a[0][0] = [0, 1, 2, 3]
- a'[0][1] = a[1][0] = [8, 9, 10, 11]
- a'[1][0] = a[0][1] = [4, 5, 6, 7]
- a'[1][1] = a[1][1] = [12, 13, 14, 15]
'''
print(arr.transpose((1, 0, 2)))
print(arr.swapaxes(1, 2)) # 直接交换第1和第2个坐标
NumPy的ndarray 快速的元素级数组函数
- 一元函数 I
- 一元函数 II
- 二元函数 I
- 二元函数 II
import numpy as np
import numpy.random as np_random
print('求平方根')
arr = np.arange(10)
print(np.sqrt(arr))
print('数组比较')
x = np_random.randn(8)
y = np_random.randn(8)
print(x)
print(y)
#取两个举证相同位置的最大值
print(np.maximum(x, y))
print('使用modf函数把浮点数分解成整数和小数部分')
arr = np_random.randn(7) * 5 # 统一乘5
print(np.modf(arr))