Python科学计算:用NumPy快速处理数据
一、ndarray:解决多维数组的问题
1.ndarray: 对象ndarray 实际上是多维数组的含义。在 NumPy 数组中,维数称为秩[zhì](rank),
一维数组的秩为 1,二维数组的秩为 2,以此类推。在 NumPy 中,每一个线性的数组称为一个轴(axes)
其实秩就是描述轴的数量。
2.创建数组:
import numpy as np
a = np.array([1, 2, 3])
b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
b[1,1]=10
print a.shape #数组的大小
print b.shape
print a.dtype #数组的属性
print b
3.结构数组:
import numpy as np
persontype = np.dtype({
'names':['name', 'age', 'chinese', 'math', 'english'],
'formats':['S32','i', 'i', 'i', 'f']})
peoples = np.array([("ZhangFei",32,75,100, 90),("GuanYu",24,85,96,88.5),
("ZhaoYun",28,85,92,96.5),("HuangZhong",29,65,85,100)],
dtype=persontype)
ages = peoples[:]['age']
chineses = peoples[:]['chinese']
maths = peoples[:]['math']
englishs = peoples[:]['english']
print np.mean(ages) #mean求平均数
print np.mean(chineses)
print np.mean(maths)
print np.mean(englishs
二、ufunc:解决对数组进行处理的函数
1.连续数组的创建:
1.1 x1 = np.arange(1,11,2)
arange: 起始值,终值(不包含),步长
1.2 x2 = np.linspace(1,9,5)
linspace: 起始值,终值(包含),元素个数
2.算数运算:
x1 = np.arange(1,11,2)
x2 = np.linspace(1,9,5)
print np.add(x1, x2)
print np.subtract(x1, x2)
print np.multiply(x1, x2)
print np.divide(x1, x2)
print np.power(x1, x2)
print np.remainder(x1, x2)
3.计数组 / 矩阵中的最大值函数 amax(),最小值函数 amin():
@ axis = 0 代表对横轴操作,也就是第0轴;
axis = 1 代表对纵轴操作,也就是第1轴;
import numpy as np
a = np.array([[1,2,3], [4,5,6], [7,8,9]])
print np.amin(a) #指数组中全部元素的最小值
print np.amin(a,0) #指数组横轴的操作
print np.amin(a,1) #指数组纵轴的操作
print np.amax(a)
print np.amax(a,0)
print np.amax(a,1)
4.统计最大值与最小值之差 ptp():
a = np.array([[1,2,3], [4,5,6], [7,8,9]])
print np.ptp(a) #整个数组中最大与最小的差值
print np.ptp(a,0) #数组中第三行减去第一行
print np.ptp(a,1) #数组中第三列减去第一列
5.统计数组的百分位数 percentile():
@ p的取值范围0-100
p=0:取最小值
p=50:取平均值
p=100:取最大值
a = np.array([[1,2,3], [4,5,6], [7,8,9]])
print np.percentile(a, 50)
print np.percentile(a, 50, axis=0) #取横轴的平均值
print np.percentile(a, 50, axis=1) #取纵轴的平均值
6.统计数组中的中位数 median()、平均数 mean():
a = np.array([[1,2,3], [4,5,6], [7,8,9]])
# 求中位数
print np.median(a)
print np.median(a, axis=0)
print np.median(a, axis=1)
# 求平均数
print np.mean(a)
print np.mean(a, axis=0)
print np.mean(a, axis=1)
7.统计数组中的加权平均值 average()
a = np.array([1,2,3,4])
wts = np.array([1,2,3,4])
print np.average(a)
print np.average(a,weights=wts)
8.统计数组中的标准差 std()、方差 var()
a = np.array([1,2,3,4])
print np.std(a)
print np.var(a)
9.NumPy 排序
a = np.array([[4,3,2],[2,4,1]])
print np.sort(a)
print np.sort(a, axis=None)
print np.sort(a, axis=0)
print np.sort(a, axis=1)