一、作为基础来学习和巩固的知识有:
基础中的基础:线性代数,概率论
核心知识:数理统计、预测模型、机器学习
计算机:
数学软件:强大矩阵运算和优化功能的matlab,专而精的mathematica。
语言:python(很流行的科学语言,潜力也很大,ipython这样交互式环境十分有利),fortran(强大的计算语言,充分优化的现成代码),R(相比于matlab,java,c,R是个高富帅)
可视化
这是数据分析各类语言使用度的图表,R占的比例还是相当高啊。想利用现在动辄TB级的数据大显身手,光靠excel可不够啊。你真的需要写很多代码…
4.统计:时间序列分析
应用回归(很简单,亦很实用)
多元统计分析
强烈推荐: 大数据入门资料链接:http://pan.baidu.com/s/1c2GnD5I 提取码:vfwl和哈弗的VIP学生一起学习大数据课程。
二、网络课程同样有丰富的资源:
1.机器学习类:
斯坦福大学:机器学习 coursera
Learning From Data
2.数据分析类:
约翰霍普金斯: Data Analysis Methods
杜克: Data Analysis and Statistical Inference
约翰霍普金斯: Computing for Data Analysis
MIT: The Analytics Edge
3.编程类:
莱斯大学: Introduction to Interactive Programming in Python
MIT: Introduction to Computer Science & Programming in Python
4.相关问题:
Data Science: What are some good free resources to learn data science?
Where can I learn pandas or numpy for data analysis?
What are some good resources for learning about statistical analysis?
Data Science: How do I become a data scientist?
What are some good "toy problems" in data science?
What are some good resources for learning about machine learning?
水平有限,欢迎补充。有不成熟的小意见请在下方评论区留言。第一时间获取大数据学习与应用的独家深度资讯,敬请关注ItStar大数据导师微信号:TBanna521。