code: pandas入门与时间序列分析.ipynb
体会: pandas 的相关用法是在是太多了!随用随查:
参考中文网站:
https://zhuanlan.zhihu.com/p/25630700
http://www.th7.cn/Program/Python/201412/329841.shtml
http://www.cnblogs.com/zuizui1204/p/6423069.html
和下载的 pandas-cheat-sheet
- 趁热打铁,学习 pandas:
https://yq.aliyun.com/articles/81469
dataframe 可以直接用 df.plot() 作图,然后 plt.show() 显示
聚合: 往往根据索引 index 来 groupby, 可以根据日期,也可以根据周; 比如这里的index已经是 to_datatime 得到的;
df.groupby(df.index.week).counts() 或 means()
df.index.date
意思就是:对这张含时的二维数据表中的信息进行处理,先按天或周聚合,得到的对象自然可以计数或求其平均值
模型融合:
1.bagging 解决过拟合
如: 1:10的正负样本,可以将负样本分为10份,每份和正样本训练得出一个分类器/回归器,
使用 sklearn.ensemble.BaggingClassifier
随机森林是其中的一种。
Adaboost 调样本的权重