首页 >> 教育学 >> 教育心理学
程少哲等:对注意的再思考
2017年08月03日 16:10 来源:《应用心理学》 作者:程少哲 史博皓 等 字号

内容摘要:该模型描述了人与环境交互的过程:人接受环境的反馈,根据自身心理状态调整行为策略,以最大化所获收益。该过程中,注意体现为高价值信息逐渐获得优先加工的现象。因此,本文对注意的本质进行了重新思考,为未来注意研究提供了新思路。

关键词:注意;强化学习;计算模型;人工智能

作者简介:

    原标题:对注意的再思考:一个注意的强化学习模型

  作者简介:程少哲,史博皓,赵阳,徐昊骙,唐宁,高涛,浙江大学心理与行为科学系;周吉帆(通讯作者)(E-mail:jifanzhou@zju.edu.cn),男,博士,浙江大学心理与行为科学系,特聘副研究员;沈模卫(E-mail:mwshen@zju.edu.cn),男,博士,浙江大学心理与行为科学系教授(杭州310028)。

  内容提要:本文在分析总结现有注意理论的基础上,假设注意是一种信息选择现象,而非心理结构或资源。通过借鉴人工智能领域强化学习算法的思想,笔者提出了一种可以表现出注意现象的人类强化学习模型。该模型描述了人与环境交互的过程:人接受环境的反馈,根据自身心理状态调整行为策略,以最大化所获收益。该过程中,注意体现为高价值信息逐渐获得优先加工的现象。因此,本文对注意的本质进行了重新思考,为未来注意研究提供了新思路。

  关 键 词:注意 强化学习 计算模型 人工智能

  标题注释:国家自然科学基金项目(31571119,31600881,61431015)和中央高校基本科研业务费专项资金资助。

  中图分类号:B842.1文献标识码:A文章编号:1006-6020(2017)-01-0003-10

  1 什么是注意

  日常生活中,每时每刻都有大量相关和无关的信息通过各种感觉通道进入大脑,认知系统可以有效地忽略无关信息,执行有效的认知加工。这种将认知加工聚焦于部分信息的机制通常被心理学家称为注意(Kinchla,1992;Buschman & Kastner,2015)。正像James(1890)曾说过的“每个人都知道注意是什么”,人人都拥有对注意清晰的主观体验,我们却难以给它下一个明确的学术定义。研究者们对注意的描述和解释,往往需要通过各种隐喻来完成。早期的研究者将注意比作过滤器(Broadbent,1958),认为注意的主要作用是以“全或无”的方式对信息进行选择。该理论得到双耳分听实验(Cherry,1953)的支持,只有那些从追随耳进入受到注意的信息得到了进一步加工。后续研究发现,非追随耳中呈现的人名等有特殊意义的刺激也能捕获注意,表明注意并非以严格的全或无方式过滤信息,而是以相对温和的衰减器(Treisman,1960)方式调节输入信息的强度。另有研究者认为,注意选择是发生在反应阶段而非感知觉加工阶段,并据此提出了反应选择模型(Deutsch & Deutsch,1963)。视觉注意的研究者们对注意所做的比喻则更具视觉特色,将其比喻成聚光灯(spotlight)(Posner,1980;LaBerge,1983)、变焦镜(zoom-lens)(Eriksen & Yeh,1985)等。这类模型认为视觉注意存在一个焦点,在焦点附近的信息会获得更好的加工。上述各类注意的隐喻理论表明,注意具有加工瓶颈的特点,同时暗示注意是一种选择“装置”,属于信息加工系统中的一部分,负责将认知加工引导至某些特定信息。

  上述理论试图解释注意的作用,而另一些理论则致力于回答“为何需要对信息进行选择”。该问题的一个简单而直观的答案是,认知资源是有限的,因此只能选择部分信息深入加工。Kahneman(1973)的注意资源理论认为,注意是用于执行认知任务的有限的资源,注意资源的调用与唤醒水平紧密联系。由于注意资源总体有限,认知任务只能在受限的范围内进行。在过去的30年中,注意资源说一直在变化盲(change blindness)(Simons & Levin,1997)和非注意视盲(inattentional blindness)(Simons & Chabris,1999)等实验的解释中占据一席之地。这些对各类明显的视觉刺激和变化视而不见的现象,往往被归因于在认知资源有限的条件下目标刺激未得到充分的认知加工。随后的研究则进一步将注意资源进行了细分,提出了基于客体的、空间的和特征的注意等概念(Kastner,Pinsk,Weerd,Desimone,& Ungerleider,1999;McAdams & Maunsell,1999;Moran & Desimone,1985;Treue & Martinez-Trujillo,1999;Maunsell & Treue,2006;Duncan,1984;O'Craven et al.,1999)。大量研究表明,不同类型的注意资源对执行相应任务的绩效存在特异性(e.g.,Shen,Huang,& Gao,2015;Gao,et al,2016)。

  可见,当前心理学中的主流注意理论都将注意视为执行信息选择的心理结构,或认知资源,成功解释了许多与注意相关的实验现象。然而,注意理论的天空中却长期飘着几朵“乌云”——各种注意理论均存在一些悬而未决的问题。例如,注意的聚光灯隐喻实际上是意识剧场隐喻的一个变种,若将注意比作聚光灯,那么是谁在观看灯下照亮的场景,又是谁在控制聚光灯的焦点?追问之下,这种隐喻似乎意味着意识小人(conscious homunculus)的存在,它控制了我们的注意,产生了我们的主观体验。那么问题就变成意识小人如何控制注意,以及小人头脑里是否存在另一个小人以实现控制过程,最终将陷入小人谬误(homunculus fallacy)的陷阱中(Richard & Gregory,1987)。类似的困境也存在于过滤器等隐喻中,这些理论虽然解释了注意的作用,却隐含地假设存在着一个本身难以解释的信息选择主体。注意的资源说则面临着另外一个问题,即资源究竟是什么。在注意资源说的表述中,注意资源似乎是万能的,它可以加快加工速度、提高加工精度和准确性、导致更好更持久的记忆。此外,这种资源可以自由分配于各种不同的加工通道和加工阶段,甚至它们共享同一个资源池,例如工作记忆与知觉共享注意资源(Cowan,1988)。然而,如此万金油般的“资源”似乎既未找到对应的生理机制,也未得到计算理论的支持。此外,有关注意资源理论关键的研究问题应该是,为何注意资源可以如此万能地帮助执行各种不同心理过程。该问题尚未获得令人满意的答案。上述理论困境促使我们反思——将注意看作客观存在的心理结构或资源是否正确。

  解决上述困境大致存在两条途径:其一是继续推进现有理论框架下的研究,尝试解决原有假设中存在的问题;其二是重新思考注意的本质,摆脱可能导致问题的旧假设,从新的基本假设出发理解注意。笔者认为,一种可能的假设是,注意是某些心理加工过程表现出来的一种现象。混淆了事物内部本质与其外在现象的例子在自然科学其他领域也并不罕见。例如,人类历史上长期将火看作是一种基本元素,认为木头燃烧释放火元素后变成了灰(主要为土元素)。直到近代化学诞生后,人们才逐渐认识到火是剧烈氧化反应伴随的发光发热现象。之所以在不同的古代文明里火都被认为是基本元素,很大程度上是因为火具有鲜明的视觉形象:木头燃烧过程中熊熊的火焰清晰可见,但氧气的介入和二氧化碳的释放却看不见。这种“眼见为实”的感觉使火看起来像一种客观存在的物质。与之类似,我们对注意过程有明确的主观觉知,但仅因此就将其视为客观存在的心理结构或资源可能不利于揭示其本质。当代心理学已经发现大多数心理过程可以在无意识状态下进行;而且存在各种各样的错觉,抑或是虚假的主观体验。因此,注意有可能是某些心理过程(大部分是意识不到的)所伴随的现象,这种现象在客观上体现为对信息的选择性加工,在主观上体验到精神集中状态和主体控制感。那么,研究的关键就不是解释现象本身,而是揭示造成该现象的原因,即考察导致注意现象的心理过程。

  根据上述假设,注意研究的主要任务是描述一种可以表现出信息选择现象的心理过程。要揭示这种心理过程的本质,不妨从信息本身入手,思考“认知系统选择了什么信息”和“信息选择的目的为何”两个问题。事实上,已有学者提出类似观点,并从上述两个问题出发构建理论模型。例如Krauzlis等人认为注意不过是一种现象,是决策过程中为了获得更大价值所带来的副产品,注意是决策过程的结果而不是原因(Krauzlis,Bollimunta,Arcizet,& Wang,2014)。根据这种观点,认知系统选择了对于当前决策而言具有高价值的信息,信息选择的目的是为了价值的最大化。这种基于价值的信息选择机制和策略的形成可能是学习的结果,它一部分是人类进化形成的,另一部分则是个体后天习得的。研究发现,刚出生的婴儿就表现出对生命信息(例如人脸和言语)的注意偏好(Frank,Vul,& Johson,2008),表明这种选择机制可能是一种进化形成的特性(Haladjian & Montemayor,2015);同时与成人比较,婴儿的注意在完成特定任务时还略显“稚嫩”:如果将成人的注意比作聚光灯,能快速聚焦于关键客体,那么婴儿的注意更像一盏灯笼(Gopnick,2009),更为扩散和随意。一项有关儿童学习的研究发现,4岁儿童在学习类别概念时,容易被新异的刺激所吸引而忽略客体的关键信息;6岁儿童的注意与成人基本相同,能快速地注意到那些决定物体类别的关键特征(Sloutsky,2016)。上述结果表明,选择性注意是动态发展的,而且可能是在与复杂环境的交互中习得的。在一系列基于价值的学习过程中,认知系统完成了从信息无区别加工到有选择加工的转变,被选择的这部分信息可使利益最大化。

  人类受价值驱动的行为有着深远的生态意义,与行为相联系的奖赏直接影响着人们的注意捕获和视觉工作记忆(Anderson,Laurent,& Yantis,2011;Gong & Li,2014)。而最大化行为效用,也是人类智能和机器智能共同追求的目标(Gershman,Horvitz,& Tenenbaum,2015;Jara-Ettinger,Gweon,Schulz,& Tenenbaum,2016)。为了获得更大的价值,人们往往在内部心理状态(包括知识、信念、动机、目标等)影响下加工输入信息形成心理表征,并根据心理表征做出行为反应,获得相应的反馈。在行为—反馈的不断交互中,为最大化行为所带来的奖赏,我们逐渐习得了信息选择性加工的策略。这种过滤信息的属性,是我们在优化行为决策时表现出的一种必然结果,是我们在面对复杂世界时高效学习的产物。这种通过以追求最大效益为目的的注意学习过程,与当前人工智能领域最为先进有效的算法——强化学习的基本思想完全一致。因此,我们认为注意背后的心理本质是基于行为价值的强化学习过程,注意是该学习过程表现出的信息选择现象,以强化学习算法为核心的计算模型可以解释人的动态注意。该模型将在本文第三部分具体展开,在此之前,有必要回顾现有关于注意的计算模型。

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
696 64.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
wxgg3.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们