机器学习工程师需要了解的十种算法
毫无疑问,近些年机器学习和人工智能领域受到了越来越多的关注。随着大数据成为当下工业界最火爆的技术趋势,机器学习也借助大数据在预测和推荐方面取得了惊人的成绩。比较有名的机器学习案例包括Netflix根据用户历史浏览行为给用户推荐电影,亚马逊基于用户的历史购买行为来推荐图书。
那么,如果你想要学习机器学习的算法,该如何入门呢?就我而言,我的入门课程是在哥本哈根留学时选修的人工智能课程。老师是丹麦科技大学应用数学和计算机专业的全职教授,他的研究方向是逻辑学和人工智能,主要是用逻辑学的方法来建模。课程包括了理论/核心概念的探讨和动手实践两个部分。我们使用的教材是人工智能的经典书籍之一:Peter Norvig教授的《人工智能——一种现代方法》,课程涉及到了智能代理、基于搜索的求解、对抗搜索、概率论、多代理系统、社交化人工智能,以及人工智能的伦理和未来等话题。在课程的后期,我们三个人还组队做了编程项目,实现了基于搜索的简单算法来解决虚拟环境下的交通运输任务。
我从课程中学到了非常多的知识,并且打算在这个专题里继续深入学习。在过去几周内,我参与了旧金山地区的多场深度学习、神经网络和数据架构的演讲 —— 还有一场众多知名教授云集的机器学习会议。最重要的是,我在六月初注册了Udacity的《机器学习导论》在线课程,并且在几天前学完了课程内容。在本文中,我想分享几个我从课程中学到的常用机器学习算法。
机器学习算法通常可以被分为三大类 —— 监督式学习,非监督式学习和强化学习。监督式学习主要用于一部分数据集(训练数据)有某些可以获取的熟悉(标签),但剩余的样本缺失并且需要预测的场景。非监督式学习主要用于从未标注数据集中挖掘相互之间的隐含关系。强化学习介于两者之间 —— 每一步预测或者行为都或多或少有一些反馈信息,但是却没有准确的标签或者错误提示。由于这是入门级的课程,并没有提及强化学习,但我希望监督式学习和非监督式学习的十个算法足够吊起你的胃口了。
[站外图片上传中……(2)]
用交互式图形探索一个五百年前的脑洞
[站外图片上传中……(3)]
1533年一个叫(小)霍尔拜因的德国画家画了一幅油画,名为《大使们》(The Ambassadors)。这幅画的主角是二脸懵圈的大使,长这样:
这位画家的一个显著特点就是画工极其精良,上面这幅画中的细节之清晰简直让人惊愕,感兴趣的可以去搜了原图来放大了仔细看:大使衣服上的一根根毛发、地球仪上的国界线、展开的乐谱、那个不知道是什么葫芦瓢乐器上断了的一根弦,等等。这特么是人画出来的么。
撇开油画的质量先不谈,相信读者第一眼看到这幅图时一定会感觉有什么奇怪的东西混进来了。没错,图的下方,地毯上那是一坨什么鬼。此刻,电脑/手机屏前的你,和二位大使一起,吉祥三宝,三脸懵圈。
[站外图片上传中……(4)]
一个很有意思的问题:找到另一个你的概率有多大?
[站外图片上传中……(5)]
寻找世界上另一个你的概率有多大?这是个很有意思的问题。或许某一天,当我们进入更加发达的数字时代时,可能所有人的面部图像都会被上传到网络上。到时,通过图像的比较,我们或许能得到每个人是否有分身这个问题的答案。
你的面容出现在身份证上,出现在护照上,多年之后老朋友在街上认出你来,依据的也是你的面容。面容还是识别犯罪嫌疑人时的依据。你的身份与面容的联系如此紧密,或许在不久的将来,你就可以用脸孔识别给智能手机解锁,或者进入办公场所,甚至可以“刷脸”购物。所有这些设想的基础,是每个人的面容都是独一无二的。然而,有时候这仅仅是一个错觉,可能哪一天你就可能遇见自己的另一个分身。
[站外图片上传中……(6)]
以上简讯由数据工匠提供,感兴趣的小伙伴可以通过扫描简报后的二维码链接原文,更多数据科学资讯尽在数据工匠,扫码关注Datartisan数据工匠公众号!如果你看到什么与“数据科学”有关的好文或者信息科技优质的文章,可以随手转发给我们,让更多热爱数据科学的小伙伴一起成长!
[站外图片上传中……(7)]