排序
方法 | 说明 |
---|---|
.sort_index() |
方法在指定轴上根据索引进行排序,默认升序 |
.sort_values() |
方法在指定轴上根据数值进行排序,默认升序 |
排序.png
基本统计分析
方法 | 说明 |
---|---|
.sum() |
计算数据的总和,按0轴计算,下同 |
.count() |
非NaN值的数量 |
.mean() .median() |
计算数据的算术平均值、算术中位数 |
.var() .std() |
计算数据的方差、标准差 |
.min() .max() |
计算数据的最小值、最大值 |
.argmin() .argmax() |
计算数据最大值、最小值所在位置的索引位置(自动索引) |
.idxmin() .idxmax() |
计算数据最大值、最小值所在位置的索引(自定义索引) |
.describe() |
针对0轴(各列)的统计汇总 |
describe().png
累计统计分析函数
方法 | 说明 |
---|---|
.cumsum() |
依次给出前1、2、…、n个数的和 |
.cumprod() |
依次给出前1、2、…、n个数的积 |
.cummax() |
依次给出前1、2、…、n个数的最大值 |
.cummin() |
依次给出前1、2、…、n个数的最小值 |
.rolling(w).sum() |
依次计算相邻w个元素的和 |
.rolling(w).mean() |
依次计算相邻w个元素的算术平均值 |
.rolling(w).var() |
依次计算相邻w个元素的方差 |
.rolling(w).std() |
依次计算相邻w个元素的标准差 |
.rolling(w).min() .max() |
依次计算相邻w个元素的最小值和最大值 |
数据相关性
协方差:协方差.png
相关系数:
- 协方差>0, X和Y正相关
- 协方差<0, X和Y负相关
- 协方差=0, X和Y独立无关
相关系数.png
• 0.8‐1.0 极强相关
• 0.6‐0.8 强相关
• 0.4‐0.6 中等程度相关
• 0.2‐0.4 弱相关
• 0.0‐0.2 极弱相关或无相关
方法 | 说明 |
---|---|
.cov() |
计算协方差矩阵 |
.corr() |
计算相关系数矩阵, Pearson、Spearman、Kendall等系数 |