摘自《徐英瑾:人工智能科学在十七、十八世纪欧洲哲学中的观念起源》(《复旦学报:社会科学版》(沪)2011年1期第78~90页)
徐英瑾,哲学博士,复旦大学哲学学院副教授。
康德:“从上至下”进路和“自下而上”进路的整合者
稍有西方哲学史常识的读者都知道,康德在《纯粹理性批判》中提出了一套整合经验论和唯理论的心智理论。关于他的这套整合策略,哲学史研究方面的文献早已是汗牛充栋了。但如何跳出哲学史叙事的惯常视角,从AI的角度来重新解读康德的这种整合策略呢?在这方面,美国AI科学家侯世达、澳大利亚哲学家查尔莫斯等人联合撰写的论文《高阶知觉、表征和类比——对于人工智能方法论的批评》就颇有参考价值。文章起头部分有一段评论直接和康德相关:
很早人们就知道知觉活动是在不同层面上进行的。伊曼纽尔•康德将心智的知觉活动划分为两个板块:其一是感性能力,其任务是拣选出那些感官信息的原始输入,其二是知性能力,其任务是致力于把这些输入材料整理成一个融贯的、富有意义的世界经验。康德并不对感性能力很有兴趣,并将主要精力投向了知性能力。他孜孜以求,最终给出了一个关于高阶认知的精细模型,并通过该模型将知性能力区分为十二个范畴。尽管在今天看来,康德的这个模型多少显得有点叠床架屋,但他的基本洞见依然有效。依据其洞见,我们可以将知觉过程视为一道光谱,并出于方便计,将其区分为两个构成要素。大约和康德所说的感性能力相对应,我们划分出了低阶知觉。这主要指的是这样一个过程:对从不同感官通道搜集来的信息进行早期处理。另外,我们还划分出了高阶知觉——通过这种知觉,主体获得了对于上述信息的一种更为全局性的视角,并通过和概念的沟通而抽象出了原始材料的意义,最终在一个概念的层次上使得问题求解的情景具有意义。这些问题求解情景包含:对象识别、抽象关系把握,以及把某个具体环境辨识为一个整体。
从这段引文看,康德对于AI科学家的启发就在于:知觉的“从上至下”进路(“知性”或“高阶知觉”)和“自下而上”进路(“感性”或“低阶知觉”)都是不可或缺的,因此一个更全面的人工认知模型将囊括这两者。但这里的问题是:凭什么说两者都不可或缺呢?或者说,仅仅遵从休谟式的“自下而上”思路,或者仅仅遵从霍布斯式的“从上至下”思路,为何就行不通?
康德本人对于这个问题的解答是:如果我们仅仅遵从“自下而上”的思路,我们就很难解释,为何人类的心智仅仅凭借经验联想,就能够构成普适性的“先天综合判断”(回答不了这个问题,我们将陷入对于普遍性知识的怀疑论);如果我们仅仅遵从“从上至下”的思路,我们很难解释,为何我们心智机器的最终输出能够和外部输入发生关联(回答不了这个问题,我们将陷入“观念实在论”或“哲学独断论”)。不过,康德的这些解释带有过重的知识论气味,而且还负载了很多哲学预设(比如,他预设“哲学怀疑论”和“哲学独断论”肯定都是错的)。站在AI或者认知科学的立场上看,我们需要的,其实是一种哲学预设更少的对于整合式路径的辩护方案。
侯世达等人的相关辩护方案则机智地绕开了“先天综合判断”这个麻烦话题,而以“类比”为切入点。他们的问题是:如果要在一个人工智能系统里实现“类比推理”的话,编程者的编程思路,到底要遵循“自下而上”的进路,还是“从上至下”的进路呢?或是二者的整合进路?
那么,为何要以“类比”为切入点呢?这当然是因为类比推理对于提高智能系统的工作效率很重要。不难想见,一个智能系统若能够在表征A和表征B之间建立起合适的类比关系的话,那么只要系统已经预存了一套关于表征B的问题求解策略C,那么它就能够用C来解决关于表征A的新问题。系统由此获得的问题求解效率,自然将大大高于其从头搜索C的效率。
在康德哲学的启发下,侯世达等建立了一个专门的类比关系搜索程序,名字叫“照猫画虎”(Copycat)。“照猫画虎”的工作环境是一大串字母串,每一串字母串构成了系统的一个原始输入,比如“abc”、“iijjkk”、“eejjkk”等。系统的任务是找出每个输入的内部结构规律,并在此基础上将一个输入看成是另一个输入的类比物。比如,“abc”和“iijjkk”之间就有这种类比关系,因为前者由三个单元“a”、“b”、“c”构成,每个单元的右边都是自己在字母表中的后继者(同样的关系也存在于“ii”、“jj”、“kk”之间)。很显然,同样的类比关系就不存在于“abc”和“eejjkk”之间,因为“e”的后继不是“j”,而是“f”。
而要让系统也能够辨识出这种类比关系,我们就得一一建立系统中的如下构成要素:
1.人工“感性”能力。也就是说,系统的输入系统必须有能力辨识出每一个字母串的记号构成,并辨识出一个输入和另一个输入之间的界限。这一步比较简单,没有什么可以说的。
2.人工“想象力”。在康德的心智理论中,“想象力”是介于“感性”和“知性”之间的一种能力,其任务是对感官输入进行初步处理,以便为知性的高级操作做准备。从分类上看,它可以从属于一种更为宽泛的“感性”(实际上,上文所谈的“感性”就已包含了“想象力”)。在“照猫画虎”程序中,这就对应于这样一个设计:系统配置有一些自动运作的“短码算子”(codelet),其任务是对“人工感性”输送来的信息进行初步结构分析。这就为人工范畴表的运作提供了基础。
3.人工“范畴表”。康德心目中的知性范畴表,大致对应于“照猫画虎”程序中的“滑溜网”(slipnet)。所谓“滑溜网”,就是由不同的范畴所结成的一个网络,其中的每一个范畴都对应着一个更低层面上的短码算子(比如,若在更低的层面上有“同一性短码算子”,那么在“滑网”中就必定有一个“同一性”范畴与之呼应)。该网和诸短码算子之间的相互协作方式乃是这样的:一方面,一个短码算子的工作输出的性质构成了与之对应的那个网络范畴节点的激发条件(这是一个由下而上的进路);另一方面,一个网络范畴节点的激发状态又反过来决定了系统的资源应当倾向于那些短码算子(这是一个从上至下的进路)。
综上所述,诸“短码算子”的自主运作为范畴节点的启动提供了条件,而后者的启动又会反过来指导前者的资源分配方向。两个层面相辅相成,合力完成了建立类比关系的任务。就这样,康德的名言“概念无直观则空,直观无概念则盲”,在AI时代便获得了这样一种全新的诠释形式:“滑溜网无短码算子则空,短码算子无滑溜网则盲”。这种“无心插柳柳成荫”的效果,恐怕是康德本人也始料不及的。
笔者认为,康德式的“从上至下”和“自下而上”相互整合的进路,其启发意义不仅局限于类比模型的构建,而且还可以被运用于其他的AI研究领域,比如机器视觉。但若要真正地做出这样一种推广,仅仅按照“照猫画虎”程序的模式去从事研究,恐怕还远远不够。比如,在“照猫画虎”程序中,系统所处的人工环境本身就已经是一个被高度数理化的世界(这个环境所提供的有效输入,都已经是字符串了)。这固然便利了程序设计员接下来的程序设计流程,却大大歪曲了康德的如下原初设想:人类的原始认知境遇,乃是一片没有数理描述形式的“混沌”——换言之,数理描述形式本身只可能是心智运作的产物,而不可能是被自然给予的。但如何能够设计出一个更基本的程序,以便让系统能把一个实际的工作环境自动转化为一个数理化的环境模拟形式呢?恰恰在这个问题上,“照猫画虎”程序的设计思路采取了回避策略。由此看来,侯世达等人的这项工作虽然很精彩,但这也只是在一个方向上体现了康德哲学的某种理论意图,而绝未穷尽康德思想库中的宝藏。
作为十七、十八世纪欧洲哲学的集大成者,康德虽没有直接讨论过机器智能的可实现问题,但是他的心智理论对于AI的启发意义却依然不容小觑。此理论的要点就是把“从上至下”和“自下而上”的两个认知进路加以打通,将其整合在一个更大的心智模型里。笔者认为,这种整合式的进路要比单纯的“自下而上”进路或“从上至下”进路更具有解释力,因此应当是未来AI建模的一个主要参照模式。但如何把这种哲学启发转化为更具体的编程工作,却会面临着一个巨大的理论—技术障碍,即如何把系统所在的非数理化的实际工作环境加以实时的数字化模拟(这种模拟必须由系统自己完成,而不能由程序员事先输入)。在这个问题上,侯世达等人的“照猫画虎”程序并没有为我们提供一个完美的工作模板。总之,更艰巨的任务还在等待AI专家们去完成。
优秀的思想是属于全人类的
这篇文章摘录非常难懂,但从中我们可以了解一下,西方哲学有关认识论和语言分析方面的,广泛而深入地运用在人工智能上。去年热播的美剧《西部世界》,其中提到了一个“统觉”的程序,是机器人具有“自我意识”的关键。虽然是科幻剧,也可给人以启发。而“统觉”的概念就来自于莱布尼茨和康德的思想。
“统觉”的程序虽然只是个假设,但也并非不可能。正如本文作者徐博士认为的那样,基于康德的理论,可能会实现这个假设,徐博士认为:“康德理论的要点就是把‘从上至下’(老李注:由概念统筹经验材料)和‘自下而上’(老李注:由经验材料抽象上升至概念)的两个认知进路加以打通,将其整合在一个更大的心智模型里。这种整合式的进路要比单纯的‘自下而上’进路或‘从上至下’进路更具有解释力,因此应当是未来AI建模的一个主要参照模式。
但如何把这种哲学启发转化为更具体的编程工作,却会面临着一个巨大的理论—技术障碍,即如何把系统所在的非数理化的实际工作环境加以实时的数字化模拟(这种模拟必须由系统自己完成,而不能由程序员事先输入)。在这个问题上,侯世达等人的“照猫画虎”程序并没有为我们提供一个完美的工作模板。总之,更艰巨的任务还在等待AI专家们去完成。”
本文也给我们启示,西方科学的发展,包括牛顿力学、爱因斯坦相对论、量子力学、空间天文学、信息学、人工智能等,离不开西方哲学思想。中国的教育,教育者包括家长,不应自我封闭、自我陶醉,拒斥这些属于全人类的优秀的思想!