作者丨琳儿
来源丨医数思维云课堂(ID:Datamedi)
上一期我们学习了Numpy基础知识,对Numpy有了一个基本的认识。这一期我将会向大家介绍Numpy常用函数。
03
常用函数
1.读写文件
(1)用savetxt函数将数据存储到文件中,当然我们需要指定文件名以及要保存的数组。
i2 = np.eye(2)
print i2
np.savetxt("eye.txt", i2)
np.savetxt("weeksummary.csv", weeksummary, delimiter=",", fmt="%s")
指定了文件名、需要保存的数组名、分隔符(在这个例子中为英文标点逗号)以及存储浮点数的格式。
2.CSV 文件
日期,收盘价、成交量、开盘价、最高价和最低价:
c,v = np.loadtxt(R'C:UsersAdministrator.PC-201704251340DesktopPython
umpydata.csv',delimiter=',',usecols=(1,2),unpack=True)
c,v=np.loadtxt('data.csv', delimiter=',', usecols=(6,7), unpack=True)
skiprows=0,跳过0行。
loadtxt函数读取了一个包含股价数据的CSV文件。
delimite设置分隔符为,(英文标点逗号)。
usecols的参数为一个元组,以获取第7字段至第8字段的数据。
unpack参数设置为True,意思是分拆存储不同列的数据,即分别将收盘。价和成交量的数组赋值给变量c和v。
r代表不转义,如果不加r那么""中就要加双反斜杠。
3.常用数学函数
(1)mean函数可以计算数组元素的算术平均值:
print ("mean =", np.mean(c))
(2)min函数和max函数:
h,l=np.loadtxt('data.csv',delimiter=',', usecols=(4,5), unpack=True)
print ("highest =", np.max(c))
print ("lowest =", np.min(c))
(3)ptp函数可以计算数组的取值范围,该函数返回的是数组元素的最大值和最小值之间的差值。也就是说,返回值等于max(array) - min(array):
print ("Spread high price =", np.ptp(c))
(4)median的函数:
print ("median =", np.median(c))
(5)msort函数,获得排序后的数组:
sorted_close = np.msort(c)
print ("sorted =", np.msort(c))
(6)方差,标准差:
print("variance =", np.var(c))
print("Standard deviation =", np.std(c))
(7)使用cov函数计算股票收益率的协方差矩阵:
covariance = np.cov(c, v)
print("Covariance", covariance)
(8)使用diagonal函数查看对角线上的元素:
print("Covariance diagonal", covariance.diagonal())
(9)使用trace函数计算矩阵的迹,即对角线上元素之和:
print("Covariance trace", covariance.trace())
(10)使用corrcoef函数计算相关系数(或者更精确地,相关系数矩阵):
print("Correlation coefficient", np.corrcoef(c,v))
(11)去重函数:
a = np.array([2, 6, 5])
b = np.array([1, 2, 3])
c = np.array([1, 1, 3])
print(np.unique(c))
print(np.intersect1d(a,b))
print(np.union1d(a,b))
print(np.in1d(a,b))
Python学习之Numpy常用函数的内容就讲到这里,大家有任何疑问都可以加入我们的QQ群:生物统计学习讨论群:938773609。期待我们的再次相约。