【心理学和AI】2020-05-14Rules and Exemplars in Category Learning读书笔记part1

Erickson, M. A., & Kruschke, J. K. (1998). Rules and exemplars in category learning. Journal of Experimental Psychology: General, 127(2), 107.

Rules and Exemplars in Category Learning(笔记part1)

摘要:本实验用两个实验来展示rule和exemplar representation,同时提出一个可以将两者相连的模型(ATRIUM: Attention To Rules and Instances in a Unified Model)。实验一检验了人们如何对训练外的新项目进行推断。实验二检验实例频次对新项目泛化的影响。本研究发现ATRIUM很好的描述了分类模型,其实rule和exemplar都存在,模型成功的关键是可以用注意力在两种形式间的转移来捕获rule和exemplar的交互。


之前也有许多心理学家对认知现象(分类,记忆,自动化等等)提出了模块理论modular theory,但还是都没有关注到模块间的交互作用。本实验将开发一个分类的模块化理论,基于两种对分类的解释:rule和exemplar。

在rule理论中,有一个效应是,特征距离边界越远,可以越快越准确地被分类。E.g.3厘米直径是边界,分类6厘米直径比分类2.9厘米直径更容易。

在exemplar理论中,特定刺激出现的频率越高,越容易被正确分类,并且被当做是一个更典型的成员。

本研究采用两个人类分类实验,旨在回答:规则的必要性,范例记忆的必要性,两个子系统的相互作用。实证和建模结果都表明,人类类别学习是由规则和范例两个不断互动的子集共同作用的。

HUMAN LEARNING EXPERIMENTS

实验所使用的类别结构有三个特点:(1)某些刺激物可以按照规则分类,但存在一些特例是需要记忆的;(2)不同的训练实例有着不同的出现频率;(3)有一些全新的刺激是没有被训练过的,用来检验泛化效应(generalization)。

实验一:对训练外的刺激的外推

人类分类能力的基本要素是分化,一种是对已学知识的运用(interpolation),一种是将已学的拓展到未学的(extrapolation)。对interpolation,规则和范例模式都可以产生很好的结果,但是对extrapolation,范例模式的结果会比偶然的差(小于随机的50%),而如果分类标准正确,则规则模式可以达到和interpolation一样的好结果。因此,extrapolation是用来区分规则和范例模式的重要工具。

图1:一个刺激范例:有两个标准,一是纵坐标表示长方形的高,二是横坐标表示小短线的水平位置。


图2:实验用到的刺激一共有四类,分别有不同的图形表示。首先,根据长方形高度大于4.5的是类A(图形为方块),长方形高度小于4.5的是类B(图形为圆形);其次,空心方块和空心圆是类中的特例;最后,有图形填充的是训练阶段的,剩下空白的格子和TE,TR是用来测试的,即没有学习过。

预测结果:(1)规则模式:TR,TE的反应没有差异;(2)范例模式:TE与之前学过的特例更像,所以对TE的响应更高。

程序:一个29个模块,每个模块14个试次,其中实心图案播放一次,特例播放两次。要求被试将图例分到四个类型中(有四个不同的按键),并且反馈对错和正确答案。

结果:(注:因为两个特例是长宽相等,因此被试很可能把之后出现的所有长宽相等都认为是特例,而不是和预期一样,只记住了两个特例,因此后面的分析去掉了对长宽相等的刺激的分析)

训练阶段:

图3:左图显示了正确规则下被试分类的正确率在上升,对特例附近的刺激相应下降;右图表示对正确的特例分类正确率在上升,但是会出现over-generalization现象,即对一些非特例的会分类错误。

迁移阶段:

对TE和TR的分类没有明显区别,说明被试更多的是采用规则模式。但是某一些部分还是体现了范例模式:与特例相似性越低,分类到特例一类的概率降低。

图4:迁移阶段结果示意图(将下半部分旋转与上半部分重合,数据也叠加)。

Dimensional attention:维度注意 在本实验中,因为维度1是规则的重要指标,因此被试会更多注意到维度1的变化,在数据上体现为,被试对在维度1上与特例相似的刺激会更多地分类到特例一类(维度1是2,7的注意会更多,与维度2是2,7相比)。

实验二:训练时刺激频率效应

图5:实验二的刺激结构,分类标准与实验一相同(长方形的高度低于或高于4.5)。还是分成四类:实心方块,实心圆,空心方块(特例只有一个),空心圆(特例只有一个)。空白格、TR和TE表示后续会使用的测试刺激。数字表示出现的相对频率。

Mixed-frequency condition:空心方块特例出现四次,实心方块出现两次(很图5一样)

Same-frequency condition:空心方块特例出现四次,实心方块出现四次

以上两种在被试间平衡。


程序:一个16个模块,每个模块28个试次。每个模块训练结束,都有14试次的迁移实验,要求被试给新刺激贴标签。


结果:训练阶段:

图6:左图显示了正确规则下被试分类的正确率在上升,对特例附近的刺激相应下降;右图表示对正确的特例分类正确率在上升,但是会出现over-generalization现象,即对一些非特例的会分类错误。

被试对频率更高的示例学习得更快(不管是普通的基于规则分类的学习,还是特例的学习),说明对频率的控制的确产生了影响。

迁移阶段:

图7:对图5中的阴影部分(T部分)的数据统计。Rule表示实心的,exception表示空心的特例。

高频的特例附近的刺激会更多地被分类到特例一类。高频的规则刺激(基于规则分类的,实心的图像)附近的刺激也会更多地被分到规则刺激一类。这说明,范例模式的相似效应(与exemplar更相似的会更容易分到exemplar一类)不仅适用于特例,也适用于高频刺激。

讨论:

这两个实验说明,单独的规则模式和范例模式都不足以解释人类的分类过程。

实验一中还发现了维度注意,即被试更多地注意到维度1的变化(长方形的高度,也就是分类的规则)。如果范例模式仅仅只对特例分类,那么更多的注意应该分配到特例的两个维度上,但是实验表明注意在维度1更多,说明范例模式同时处理特例和基于规则分类的刺激。

实验二中能够发现,范例模式下的相似效应不仅对特例有影响,对高频率的基于规则的一般刺激也有影响,同样说明,范例模式同时处理特例和基于规则分类的刺激。

ATRIUM: A HYBRID CONNECTIONIST MODEL

图8:ATRIUM模型的构成示意图:一个规则模式,一个范例模式,一个有竞争力的闸门机制。虚线表示已学得的权重。

每个刺激输入时都会同时经历规则模式和范例模式、

规则模式:根据标准rule boundary,进行分类。范例模式:根据每个刺激和之前所有的示例的关系进行分类(相似度是距离的减函数)。最后的输出结果有gate node决定(对两个模式的输出有权重),gate node从范例模式中获得输入,输出是加权输入之和的S型函数(sigmoidal function)。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。