首页 >> 教育学 >> 普通教育学
PISA测试的限度:国际学者的批判
2019年12月05日 15:27 来源:《教育测量与评价》2019年第1期 作者:黄志军 字号
关键词:PISA测试;批判;基础教育质量监测

内容摘要:基于国际学者对PISA测试的批判,我国的基础教育质量监测应汲取PISA测试长处、规避其不足,理性看待PISA测试的结果及其解释,并建构中国本土教育质量监测体系。

关键词:PISA测试;批判;基础教育质量监测

作者简介:

  作者简介:黄志军,华东师范大学教育学部教师,晨晖学者,教育学博士,主要研究方向为语文教育、教育测量与评价。上海 200062

  内容提要:近年来,PISA测试的效应及其影响在全世界范围内不断扩大,也招来了不少国际学者批判的声音。针对PISA测试的批判体现出视角多元化的特点,聚焦的议题主要涉及PISA测试的技术、内容,以及政治层面的影响。从社会学角度进行分析,PISA测试体现了新全球主义和新自由主义的属性。基于国际学者对PISA测试的批判,我国的基础教育质量监测应汲取PISA测试长处、规避其不足,理性看待PISA测试的结果及其解释,并建构中国本土教育质量监测体系。

  关 键 词:PISA测试 批判 基础教育质量监测

  【中图分类号】G40-058.1 【文献标识码】A

  近年来,随着PISA测试在中国教育界的持续升温,它也在不断扩大自己的影响范围:中国学生参加PISA测试的成绩甫一公布,立马成为政府、媒体、学者讨论的热点话题;PISA测试的组织流程、分析框架、命题思路和相关报告已经成为国内不少教育质量监测的重要参照;越来越多的学者利用PISA测试的数据开展研究、发表论文。这种景象和世界上的许多国家(或地区)都十分相似。PISA测试是如此深入人心,对许多国家基础教育政策的制订和实施都产生了重要影响,甚至有人认为它“成功地实现了对全世界教育的治理”[1]。尽管PISA测试蒸蒸日上,并继续向全球其他国家和地区扩张,但总有人对它提出批评和质疑。倾听这些来自国际学者的不同声音,能够使我们更加全面地认识PISA测试和中国学生的表现,规避PISA测试可能带来的局限和不足。

  一、PISA测试的早期争论与回应

  1999年,英国14周岁的儿童参加了国际教育成就评价协会(the International Association for the Evaluation of Educational Achievement,简称IEA)组织的TIMSS(the Trends in International Mathematics and Science Study,国际数学和科学评测趋势)测试;2000年,英国15周岁的儿童参加了OECD组织的PISA测试。时隔仅一年,两项国际测试却给出了近乎矛盾的结论:IEA的数据表明,英国14周岁儿童的学习表现低于测试群体平均40分,排在瑞士、法国、比利时等国后面;而在PISA测试中,英国15周岁儿童的学习表现却高于总体平均成绩20分。对这些数据进行标准化转换后发现:每个学生的平均成绩几乎进步了100分!短短一年时间,英国学生的成绩提升如此之多,引发了英国国内学者对PISA测试的信任危机。Prais(2003)在《牛津教育评论》(Oxford Review of Education)第2期发表论文,对PISA测试的实施和结论解释提出质疑。归纳起来,这篇论文主要有以下意见:PISA测试的内容与不同国家的学校课程体系关联不大,无法给学校和课程政策制定者提供具体帮助;15周岁的年龄节点选取不太合理,因为德国、瑞士的一些15周岁学生早已离校并走上了工作岗位,很难保证抽样的覆盖面;实际参与测试学生的试卷和问卷的回收率在某些国家(如英国和荷兰)仅有50%的比例;特殊儿童的学业表现没有包含在测评范围之内。[2]可以说,这篇论文拉开了学界对PISA测试的批判和反思之帷幕。

  Prais的论文发表不久,来自OECD的专家Adams(2003)就在同一本期刊的第3期给出回应。在Adams看来,Prais之所以会质疑PISA测试的数据及其解释,根本原因是他对PISA测试的方法和相关技术缺乏了解和深入研究。在澄清了PIRLS(Progress in International Reading Literacy Study,国际阅读素养进展研究)和PISA测试成绩不可比较的基础上,Adams一一驳斥了Prais对PISA测试实施和数据解释的质疑:PISA测试是理论框架指引下的学业表现评估而非“课程本位评估”,它重点关注不同国家的学生在基础教育阶段达到的应用知识和能力的水平;选择15周岁作为评估的年龄节点,比按年级抽样更公平、更合理;尽管参加测试的英国学生的试卷和问卷的回收率相对较低,但是已经涵盖了各个层次水平的学校和学生群体,统计显示这些样本也具有较好的代表性;数据处理过程考虑得十分周密,几乎不可能出现错误。[3]此外,Adams还给出了可以参考的网址链接。可以说,这是OECD专家首次对质疑PISA的声音给出回应。Adams的解释并没有说服Prais,在2004年的《牛津教育评论》上,Prais又发表了一篇简短的论文,继续批评PISA测试存在的不足。[4]

  Prasi提出的批判主要涉及PISA测试的内容和技术两个方面。Adams给出的回应也主要围绕这两个方面展开。从现在来看,Adams认为PISA测试的数据处理过程考虑得十分周密,“几乎不可能出现错误”的断言显得有些自信过头。由于PISA测试刚刚开始扩张,Prasi还未能从文化、语言差异角度关注PISA测试问卷编制及其结果解释,也未能想到PISA测试迅猛扩张以后对参与国教育政策制定的政治影响。他也未曾预料PISA测试会如此之热,短短几年内就成为风靡全世界教育领域的明星话题。由于没有更多学者参与,这轮争论暂时告一段落。

  二、PISA测试批判视角的多元化

  PISA测试进行到第四轮的时候,参与的国家(或地区)已经从2000年的43个扩展到2009年的65个,几乎增加了一半以上。[5]东亚国家(或地区)的学生取得了非常耀眼的成绩,中国上海学生三科平均分均为第一的表现更是引起了全世界关注。PISA测试的大范围扩张,必然引来新一轮的批判浪潮。自2010年左右起,有关PISA测试批判的论文逐渐多了起来,学者们的讨论趋向火热。

  在Prasi批判PISA的论文发表八年之后,Hopfenbeck和Maul(2011)率先向PISA测试“开火”。她们对22位中学生就有关PISA学习策略的题目进行了认知访谈,并对4279名挪威中学生进行了问卷调查。在此基础上,两位学者指出了PISA测试学习策略题目编制存在的问题。[6]Schuelka(2013)撰文指出,PISA、PIRLS和TIMSS不把特殊儿童这一重要群体作为评估对象,将会形塑一种特殊儿童不属于学业成就和教育评估的文化,降低政策对教育公平的关注,使得社会和教师维持对特殊儿童的低期望水平。[7]Moss和Goldstein(2014)指出了PISA测试存在的三个严重问题:对排名数据支持缺乏任何说明,有可能造成严重误导;缺乏透明度,只在手册中提供了10%的测试题目(尤其在“数学问题探究”方面体现得更为明显);以某种方式鼓吹优异的学习表现直接导向未来的经济繁荣。[8]此外,两位学者还对PISA处理测试数据的方式提出了尖锐批评:OECD是在以某种方式为使用这些数据创造良好基础的,很少考虑这些数据是为了科学理解还是政治目的;对PISA测试的保留意见往往淹没在“专业讨论”之中;部分统计学家试图开启辩论却面临巨大障碍,甚至连英国皇家统计学会针对PISA测试发起诸如GETSTATS①运动,大多数媒体和政府都并不重视。[8]

作者简介

姓名:黄志军 工作单位:华东师范大学教育学部

转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们