四条路径:大数据工程、大数据分析、共同学习、数据科学
理论修炼秘籍:PRML、DEEPLEARNING(机器学习)/Convex Optimization、Numerical Optimization(最优化)/Spark(分布式计算)
技术栈:java、python、scala、R
开源框架:MR、spark、storm、kafka、flume、sqoop、postgre、scikit-learn、pandas、matplotlib、tensorflow、theano、keras、numpy、scipy
算法:排序算法、机器学习算法(SVM、LR、KNN、kMeans、决策树、聚类)、深度学习理论研究
模型转化能力:深入公司业务流程,整合业务,设计数据模型,利用数据优化并提高业务产出。
终极养成:利用有限的数据产生无限的价值。