1.numpy基础:数组和矢量计算
- ndarray 可进行矢量运算并节省空间的多维数组
- 无需写循环即可进行标准数学函数
- 可以读写磁盘
- 线性代数、随机数生成以及傅里叶变换功能(暂不做研究)
2.ndarray:一种多维数组对象
#一个ndarray数据的创建
import numpy as np
a = np.array([[0,1,2,3]])
#这样便会得到一个一维数组
print a*10
#输出结果为[[0,10,20,30]]
print a.shape
#输出结果为(1,4)
print a.dtype
#输出结果为int32
a = np.zeros(10)
print a
#输出结果为[0. ,0. , …… ,0. ]
a = np.zeros((3,6))
#可以通过这种方式创建指定形状的数组
#与该方法类似的还有ones
a = np.arange(15)
#该方法是Python内置函数range的数组版
numpy中常用函数有以下函数表:
numpy中的数据类型不再进行阐述
numpy中的索引:
对numpy数组的索引数据进行操作将会对其原本数据产生影响
import numpy as np
a = np.zeros(10)
a[1:5] = 1
print a
#输出结果为:[ 0. 1. 1. 1. 1. 0. 0. 0. 0. 0.]
对多为数组的索引方式如下:
import numpy as np
a = np.zeros((2,4))
a[0][2] = 1 #或者a[0,2] = 1
print a
#输出结果如下:
#[[ 0. 0. 1. 0.]
#[ 0. 0. 0. 0.]]
numpy中的切片索引和Python中的切片索引有相同处,所以不再进行阐述,此处只阐述不同之处。
import numpy as np
name = np.array(['a','b','c'])
data = np.arange(12).reshape((3,4))
print data[name == 'a']
#输出结果为:[[0 1 2 3]]
data[data > 2] = 0
print data
'''
输出结果如下:
[[0 1 2 0]
[0 0 0 0]
[0 0 0 0]]
'''
numpy中的sort可以对数组进行排序
numpy中的unique方法可以找到数组中的唯一数并返回排序结果
import numpy as np
name = np.array(['a','b','c'])
data = np.arange(12).reshape((3,4))
data[data > 2] = 0
print np.unique(data)
#输出结果为:[0 1 2]
数组的常用集合运算:
代码示例:
import numpy as np
x = np.array([1,2,3,4,5,6])
y = np.array([4,5,6])
print np.intersect1d(x,y)
#[4 5 6](计算交集)
print np.union1d(x,y)
#[1 2 3 4 5 6](计算并集)
print np.in1d(x,y)
#[False False False True True True](计算x元素是否包含于y元素,并返回布尔类型数组)
print np.setdiff1d(x,y)
#[1 2 3](计算在x中不在y中的元素)
print np.setxor1d(x,y)
#[1 2 3](两个集合的对称差即元素只存在其中的一个集合中)
numpy存取文本文件:
import numpy as np
a = np.arange(50).reshape((5,10))
np.savetxt('test.txt',a,delimiter=',',fmt='%d')
#以int形式存文件(默认是float)
a = np.loadtxt('test.txt',delimiter=',',int)
print a
#以int数据类型读文件(默认是float)
3.numpy中的线性代数
矩阵的点积运算
import numpy as np
a = np.arange(1,7).reshape((2,3))
b = np.arange(1,7).reshape((3,2))
print a.dot(b) #或者np.dot(a,b)
'''
输出结果为:
[[22 28]
[49 64]]
具体的过程为:
a:
[[1 2 3]
[4 5 6]]
b:
[[1 2]
[3 4]
[5 6]]
[[1*1 +2*3 + 3*5 4*1 + 5*3 + 6*5]
[同上省略]]
'''
线性代数只做以上介绍,有兴趣的可以自行了解
随机数的生成不再进行阐述,现实意义不大
部分内容引用《利用Python进行数据分析》
2017-9-11