AI的热潮一波接着一波,不得不抓紧充实自己。虽然已经有了部分机器学习经验(硕士论文都是机器学习相关),但依旧深感知识的欠缺。于是这本《白话大数据与机器学习》映入了眼帘,作为一本2016年的新书,又有白话、大数据、机器学习三大热门词汇加持,我慎(sui)重(yi)的选择了这本书。
带着对知识的向(jiao)往(lv),我这只刚毕业两个月的小白开始了早到一小时读书的旅程。先说本书终极评价:
- 与大数据实战没啥关系
- 内容要么很小白,要么难度很高没有可操作性(给小白贴一大段sklearn算法?)
- 仍旧推荐阅读,主要读第一部分(入门知识)和最后一部分(应用与拓展)——就是不讲机器学习的那部分
个人收获最大的是作者对数据、大数据产业、数据价值解读等的分析。其对大数据的概念解读让人如梦初醒,作者认为大数据本质上是数据,而不在于大,其对大数据和大石油有一段很有意思的对比。
假如现在给石油产业冠以“大石油”产业的名字,那么会影响石油行业本身对其他行业的服务样态吗?应该不会。
在“大石油”产业里,同样有人从事这样的工作内容:石油勘探、石油开采、石油运输、石油提炼、石油产品销售等多个细分领域和环节。
类比一下“大数据”产业,数据收集、数据传输、数据存储、数据建模、数据分析、数据交易贯穿了大数据产业的完整产业链。
作者能把三个字简化为两个字,我觉得还是很清楚了。据此,作者认为大数据的核心价值在于:使人们通过数据获得了洞悉世界的能力,得到了因果关系。这种因果的联系,会让人们在各个方面能够推测未来趋势,减少试错,减少成本,降低风险,解放劳动力。
我入职后有一部分工作是智能运维,最需要的就是大数据和人工智能两种能力。看了作者的解释,深深的觉得自己在为人类做贡献,解放劳动力,解放人类,解放全世界 (删除最后一句)。能把自己的工作和对人类有贡献的事业联系起来,想想都很激动。其实并没有开玩笑,现在行业热门的大数据、人工智能、云计算,正是因为大家看好他们可以解放劳动力,创造更大的价值。那么如果我的职业不能创造更大的价值,我就可以考虑转行了。幸好我目前的工作做好了也能为人(gong)类(si)做出一点点贡献。作为职场新人,一点小的观点,不知道是阿Q精神还是我看穿了工作与人类幸福的本质。O(∩_∩)O哈哈~
书中大部分内容是讲机器学习算法的。不过我之前都有了解一些,觉得都是比较平淡的内容,除了一段讲解隐马尔可夫模型的,并没有特别好于其他机器学习的书。所以建议这些略看就好,想学机器学习基础的看西瓜书、实战的话看Sebastian Raschka的《Python机器学习》
上最后的干货,思维导图一份。有的东西根据自身知识,做了删减,尤其是数据挖掘部分。欢迎留言讨论。
最后用最近很欣赏的一句话共勉:
过一个平凡无趣的人生实在太容易了,你可以不读书,不冒险,不运动,不写作,不外出,不折腾……但是,人生最后悔的事情就是:我本可以。 ——陈素封