内容摘要:教育问责评价模式是解决教育公平问题的重要工具,正日益成为国际教育的热点。美国义务教育问责主流的评价模型目前包括状态模型、轨迹模型、矩阵模型以及映射模型,各类模型有其特定的实施原则、类别及特点,为实现优质教育均衡提供了如下保障:影响因素量化分析,保障教育机会平等;结果、过程并重,注重教育过程平等;多元多层评价,实现教育成就平等。
关键词:美国;义务教育;问责;评价模型
作者简介:
作者简介:王瑜,广西民族大学 教育科学学院,广西 南宁 530006;吴春红,空军航空大学 飞行基础训练基地,吉林 长春 130022
王瑜(1982-),男,河北定州人,广西民族大学教育科学学院教师,教育学博士;吴春红(1975-),女,河北唐山人,空军航空大学飞行基础训练基地讲师,文学博士。
内容提要:教育问责评价模式是解决教育公平问题的重要工具,正日益成为国际教育的热点。美国义务教育问责主流的评价模型目前包括状态模型、轨迹模型、矩阵模型以及映射模型,各类模型有其特定的实施原则、类别及特点,为实现优质教育均衡提供了如下保障:影响因素量化分析,保障教育机会平等;结果、过程并重,注重教育过程平等;多元多层评价,实现教育成就平等。
关 键 词:美国 义务教育 问责 评价模型
2002年,美国《不让一个孩子掉队法》(NCLB)为加强联邦政府在义务教育的责任,设立两个关键目标,即所有学生学业成就在2014年达到各州设定的学业熟练标准,以及缩小学生之间的学业差距,尤其关注在经济、种族、学习能力及英语熟练度等方面处于不利地位的特殊学生群体。为此,NCLB要求各州有针对性地设立包括阅读(或语言艺术)和数学的学业熟练标准,并以各学校、学区是否通过年度进步指标(Adequate Yearly Progress,简称AYP)进行问责。在NCLB发布初期,联邦政府要求各州通过状态模型进行AYP结果问责,因忽视学生学业变化过程而产生的问题引起美国教育界极大关注。
美国教育部在2005年11月正式启动增长模型试验项目(Growth Model Pilot Project,简称GMPP),希望增长模型作为学校年度进步指标状态问责模型的补充,能有效确保政府对学校的效能以及每一个学生在达标过程中的努力做出正确评价。GMPP的主要目标是帮助各州发展并完善学校的年度适度进步指标问责模型,使其有效反映出学生学业成就的进步。各州向联邦提交各自增长模型的提案申请,在经过专家反复讨论、建议以及同行测评等程序的严格审核后,教育部官员根据审核建议予以审批。有20个州在2006年提交了申请,其中13个州的模型提案被授权在2005-2006学年立即使用,其余7个州则从2006-2007年开始实施。获准参与试验项目的州必须测算每一个学生在不同阶段是否处在达标的发展轨道上,所有“在轨”学生可被认定为达到当年AYP要求。[1]如图1所示,大部分州先采用状态模型进行问责测评,不合格的学校继续参与安全港测评,若仍未通过,则进行增长模型测评,从而确保学校问责的精确性。[2]增长模型开始成为美国义务教育问责评价的主要工具,截至2010年已有超过30个州开发或使用增长模型对学校、学生分群及个体进行跟踪测评,其余绝大部分州也都考虑使用增长模型。
一、美国义务教育问责评价模型的内容
(一)状态模型
状态模型(Status Model,简称SM)也称为成就模型,是NCLB中实现AYP的要求之一。各州通过年度考试成绩测算特定分群(designated groups)的学生是否达到熟练标准,若学校中各分群学生的熟练人数比例超过各州设定的年度测算目标(Annual Measurable Objective,简称AMO),则该校达到当年的AYP。各州普遍采用2001-2002年数据设定学生达到熟练标准的初始比例,即AYP的原点,并以此设定逐年增长的预期目标,最终在2014年达到100%。根据法令,所有获得联邦政府Title I资助的学校,学区若连续两年AYP不达标则应采取改善措施,如提供学生转学的机会,加大学生课后辅导等,该校/区须预留Title I资助款项的20%用于改善项目,并向学区/州提交该校/区改善计划。同时,虽然法令要求各州减小不同学生之间的学业成就差距,但并未对每年的实施过程和目标做出规定,各州的AMO设定是灵活的,有的州采用线性增长的方式,而有的州则是采用边际增长量递增的方式。同时,各州可对不同学生设定年度分群目标实现共同达标。

图1 美国义务教育问责评价流程图
资料来源:U. S. Department of Education. Peer Review Guidance for the NCLB Growth Model Pilot Applications[EB/OL]. http://www. eed. state. ak. us/tls/AssessmenT/AKGrowthModel/AYPGrowth_021506. pdf, 2012-04-08.
在状态模型中,学校要达到AYP需要满足几个条件。首先,学校必须有至少95%的NCLB报告分群学生参加阅读(或语言艺术)及数学考试。NCLB报告分群包括了全体学生以及主要的种族子群、特殊教育学生、英语不利学生以及低收入家庭学生。若一个报告分群的全学年学生人数无法达到样本量最小值n,则该分群可以不参与联邦问责。大多数州将全学年定为每年秋季招生开始到春季考试结束的这段时期,并将分群的最小样本量n定为0~50之间(如伊利诺伊州规定每组不少于45人)。其次,在每个合格的报告分群中,考试分数达到熟练标准的学生比例必须符合或超出年度测算目标,且必须保证一定的出勤率(小学)和毕业率(高中)。若有任何一个子群不合格,则整个学校当年AYP不合格。
为降低学校不通过AYP的误判率,法案为那些最终未能达标但有显著学业进步的学校提供了一条额外的达标路径,称为改进式状态模型或安全港(Sale Harbor)。该模型中,若学校无法达到本年度AMO,但在去年x%的达标率基础上使10%的不合格学生达标,即达标学生比率能达到[10%(100-x)+x]%,则该校可认定为当年AYP合格。同时,各州还采取了一些额外措施:有的州对分群达标率采用置信区间表达,将上限设为AMO值。当置信区间的最大值高于AMO,则该子群可认定为通过AYP。有的州将分群学生几年的平均考试成绩与AMO平均成绩进行对比,以此认定合格。有的州则在安全港模式中采用前几年的平均不合格率的l0%作为参照。
(二)增长模型
根据美国州首席教育官员理事会(CCSSO)的解释,问责增长模型是指通过跟踪同一学生年度学业成就变化从而测算学生是否取得学业进步的一种教育问责模型。[3]相对于状态模型对学生达到熟练比例的一年一测,增长模型(Growth Model,简称GM)注重的是学生成就的变化过程。其可以是采取学生平均成绩对学校和分群进行评测,或是通过具体信息对单个学生成就变化进行评估。为确保各州能设立年度增长目标,跟踪每一个学生情况并测算学业进步,最终实现2014年人人达标。联邦教育部提出了增长模型的七个核心原则:1)确保全体学生在2014年以前能达到学业熟练标准,为取消分群学生之间的差距设定年度目标。2)年度预期增长量不能基于学生的背景或学校的特点,而是基于统一的年级熟练标准。3)明确是对学校学生阅读(或语言艺术)和数学学业成就的问责。4)确保被测年级的所有学生都参加问责和测评,确保对所有学校和学区中每一个学生分群的学业成就进行问责。5)测试系统必须有一年以上的运行史和NCLB同行评审过程的审核,并包括3—8年级以及高中的阅读(或语言艺术)和数学,具备对不同年级或年代的测试结果进行比较的功能。6)州数据系统必须能跟踪学生学业进展。7)各州问责系统必须包括学生出席考试率以及其他相关学业问责指标。[4]
为此,增长模型通常在结构上具备六个要素:1)特定的州际学生身份号。每位学生绑定伴随其成长的州际学生号及对应数据单元,以此实现每位学生的学业跟踪;2)能对同一名学生在不同年级和不同时段进行纵向比较,这需要对年度的考试分数进行调节测算;3)能收集学生入学水平、人口背景以及学校背景信息;4)能收集不参加年度测算的学生信息,确保参与测算的学生数量及有效性;5)能收集学生毕业水平以及辍学率信息;6)能对数据的质量、信效度进行审查的州际审计系统。[5]
美国教育问责增长评价模型类型表现各异,但核心都是通过设定学生的年度增长目标确保学生在规定的时间段内处在达标的“轨道”上,通常分为三种基本模型,即轨迹模型、变迁矩阵模型以及映射模型。







