一、引入Numpy
默认的方式是:
import numpy as np
一般不推荐采用其他方式,上面是默认的方法。
二、ndarray
n维数组对象,是一个大数据集容器,是一中同构数据多维容器,也即是说,ndarray中的数据都是相同类型的。
创建ndaray的方法
array函数是最重要的方法,接受一切序列型的对象。
import numpy as np
data1=[6,7.5,8,0,1]
arr1=np.array(data1)
print(arr1)
[ 6. 7.5 8. 0. 1. ]
ndim属性会返回array的维度,shape属性会返回array的构型,比如说是(2,3)的数组。dtype属性会返回array中元素的数据类型,比如int32.
arr1.ndim
arr1.shape
arr1.dtype
zeros和ones函数分别可以创建指定长度或形状的全0或全1的数组。empty函数可以创建没有任何具体数值的数组。eye函数可以创建一个正方的N*N单位矩阵。
print(np.zeros(10))
print(np.ones((3,6)))
print(np.empty((2,3,2)))
arange函数类似于内置的range,但返回一个ndarray。
print(np.arange(15))
print(np.arange(1,10).reshape(3,3))
数组和标量的运算
大小相等的数组之间的任何运算都会应用到元素层面,比如:
arr=np.arange(1,10).reshape(3,3)
print(arr*arr)
print(arr-arr)
-------------------
[[ 1 4 9]
[16 25 36]
[49 64 81]]
[[0 0 0]
[0 0 0]
[0 0 0]]
基本的索引和切片
arr=np.arange(0,10)
print(arr)
print(arr[5])
print(arr[5:8])
arr[5:8]=12
print(arr)
--------------------------
[0 1 2 3 4 5 6 7 8 9]
5
[5 6 7]
[ 0 1 2 3 4 12 12 12 8 9]
如果将一个值赋给一个切片,这个值就会自动传播给这个切片里面的所有值。
对于二维数组,基本上是同样的方式,比如:
arr2d=np.arange(15).reshape(3,5)
print(arr2d)
print(arr2d[2])
print(arr2d[2,4])
---------------------------------
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]]
[10 11 12 13 14]
14
在多维数组中,如果省略了后面的索引,那么会返回一个维度低的ndarray,比如:
arr3d=np.arange(12).reshape(2,2,3)
print(arr3d)
print(arr3d[0])
print(arr3d[1,0])
----------------------------
[[[ 0 1 2]
[ 3 4 5]]
[[ 6 7 8]
[ 9 10 11]]]
[[0 1 2]
[3 4 5]]
[6 7 8]
二维数组的切片索引范例如下图:
布尔型索引,将存储数据的数组以及存储字符的数组对应起来,比如:
names=np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe'])
data=np.random.randn(7,4)
print(names)
print(data)
假如每个名字都对应data数组中的一行,而我们想要选出对应‘Bob’的所有行。数组的比较运算==也是矢量化的。
print(names=='Bob')
返回的将是一个布尔型数组:
[ True False False True False False False]
这个布尔型数组可用于数组索引:
print(data[names=='Bob',2:])
返回的将是这样的一个数组:
[[-0.74744123 0.14274993]
[ 1.04196354 -0.48137007]]
又比如将data的所有负值都设置为0,如此操作:
data[data<0]=0
print(data)
可以看出array后的[]中可以设置的内容太多了。
数组转置和轴对换
arr.T是最简单的方法。矩阵运行的点乘方法是np.dot。