我们将机器学习领域选为解释,搜索算法工作原理的案例,因为这个领域的算法通常用于寻找最佳的参数集。
例如,其典型的研究问题可能包括许多告诉程序如何驾驶汽车或控制双足机器人的参数。搜索算法可以通过这些参数进行搜索,然后尝试找出驾驶车辆或机器人行走行为的最佳设置,这就可能帮助人类节约大量花费。在此类事情上的时间。
其中一些汽车驾驶参数可能包括转弯的距离,踩油门的力度以及应保持的合理车距。当然,这些参数的一些设置应该比其他参数更有利于驾驶,有时慢慢加速比猛踩油门会更安全。因此,如果我们具备了一个衡量安全驾驶的方法,机器学习算法就可以自动搜索最佳的参数设置。
通过这种方式搜索算法,就可以自动进行,原本需要人工操作的搜索,因此人工智能研究人员不需要自己进行搜索,而是致力于创建搜索系统。由于他们不断的对这类搜索系统进行编程,人工智能研究人员也自然而然地成为搜索领域的专家。
简而言之,关于人工智能研究的有趣之处,在于相关研究人员在设计,搜索,算法的同时,也在不断的搜索新的人工智能算法。
因此,我们可以将针对人工智能算法的搜索称为原搜索,即搜索那些能够搜索的事物。换句话说,就是一种类型的搜索套现。在另一种搜索的搜索之中,尽管涉及原概念的东西都有点令人费解,但在人工智能领域,原搜索并不像听起来的那么复杂。
事实上,这种源搜索同样也会出现在日常生活中,想象一下,如果你想从狗场里挑选一只小狗带回家,而你恰好喜欢好奇心重的小狗,你自然会寻找那些最喜欢到处闻来闻去搜这搜那的小狗。
又或者你的工作是要在一家寻宝公司雇佣一个人来担任高级保障猎人,那么你会主动寻找能力最强的寻宝人,因为他的任务就是寻找宝藏。
进而整件事情就会变成一个寻宝的源,搜索人工智能领域的研究人员也是如此,因为他们的任务就是搜索最好的算法,而这些算法本身也可能正在搜索最佳的参数设置。
原搜索的观点很有用,因为它阐明了搜索算法如何工作,以及它与人工智能研究人员如何创造算法之间的联系,二者背后的联系是人工智能研究人员对搜索的专业理解,也适用于整个人工智能领域的新算法。搜索换句话说,搜索在人工智能的最佳算法中如何编程,应该与研究人员如何搜索新算法之间存在着某种联系。
因为不管是搜索算法还是搜索参数,本质上都是搜索。但事实证明,人们很少探讨或关注人工智能研究的这方面的原层面,也就是说,很少有人谈及人工智能领域的搜索与从搜索算法所获得的洞见之间的联系。虽然人工智能领域的许多论文都分析了是什么让搜索在算法层面发挥作用,但很少有人探讨人工智能领域对算法本身的原搜索。
你可能会认为编写出世界顶级搜索算法的专家也能够熟练的指导人工智能搜索,因此一个有趣的问题是,人工智能领域的搜索专家是否能够避免追逐过于高远的目标,避免这个失灵的指南针牵着鼻子走,或者连人工智能领域的专家都无法幸免,也会像其他人一样被目标的诱惑所吸引。
为了探索目标的欺骗性是否会成为人工智能领域的一个真正的问题,我们可以先看看人工智能领域实际上是如何开展人工智能算法搜索的。
正如我们在本书中探讨的那样,搜索背后的关键概念是遵循一个梯度,一种浏览的路径或者一条强度递增的路径。在目标驱动的搜索中,梯度指的是从坏到好排列的一系列性能指标。在新奇性搜索中,梯度就是新奇性递增的过程。
那么,人工智能的研究人员在搜索新算法过程中,遵循了什么梯度呢?
开展人工智能研究,往往意味着研究人员首先需要确定哪些算法是最有前景的,然后再通过某种方式对其进行完善和扩展。
人们希望这个过程能够产生更新和更好的算法,但是要判定人工智能算法的最富前景性,最适合用什么标准来对我们进行分级呢?选择有待进一步探索的算法标准应该就是这些算法的行为或者表现。
所以此处潜在的风险是,如果仅仅用一个简单的目标来知道整个人工智能领域的信息,就会产生欺骗性,以性能测试为评判标准时,某一算法可能看起来前途无量,但它可能最终无法产生更好或者更有趣的结果。
当然,不可否认的是,根据算法,在一项简单测试中的表现来排名,能使我们更轻松的做出决策。但由于目标欺骗性的存在,只关注那些测试中表现最佳的算法,也不太可能给我们带来任何突破性的成果。
我们可以将人工智能研究人员遵循的梯度视作他们用来判定最佳算法的标准,指导人工智能领域搜索的经验法则,用一个行业术语来描述就是启发式搜索。
尽管没人能够确定哪种启发式的方式能够在实现高级人工智能方面取得最佳效果,但人工智能领域基本上确定了两种具体的方式。第一种,我们称其为实验实验启发式,它追寻了经验法则,是一个算法的潜力和潜取决于在其实验中的表现。换句话说,一个值得进一步探索的算法,在其准任务中的表现一定胜于其现有的算法。
人工智能领域的基准任务与其他领域的基准任务的本质并无不同,比如计算机的运行速度,运动员的跑步速度,汽车每英里的耗油等等,科学家们为了人工智能设定的基准时遵循的基本想法,是一个更智能的算法,要一个相对较次的算法,更快的解决问题。
除了石岩汽发派,人工智能研究领域的第二个主要梯度是定理派启发方式。根据此法,如果一种算法能够被证明具有理想的属性,那么它就是最好的算法。
这种方法背后的逻辑类似于售卖汽车零件时,随时的质保凭证,即通过数学验证证明算法和理论上具备可靠和可预测的性能。
最重要的是,这两种启发方式对人工智能领域的研究有着深刻的影响,即使你个人不喜欢这两种方式或意图,提出自己的理念,在不遵循这两种方法的情况下,你的诸多想法也不可能得到发表。
因为在人工智能领域,就观点发表拥有决定权的把关人通常将二者视为铁律,并以此衡量所有相关的想法。如果一个算法既不能提升性能,又不能提供保障,就很难通过把关人员的审核,因此有可能永远都不会在整个人人工智能的研究领域得到传播。
因此,人工智能领域通行的两个最主要的启发方式,在对想法的探索方面有着巨大的影响。