首页 >> 教育学 >> 教育学原理
教育研究中的因果关系推断 ——相关方法原理与实例应用
2018年03月19日 14:34 来源:《华东师范大学学报:教育科学版》 作者:黄斌 方超 汪栋 字号
关键词:因果推断;教育研究;准实验;异质性残值;内部有效性

内容摘要:近二十年来,因果关系推断方法快速发展成熟,并逐渐占据微观计量方法领域的主流地位。

关键词:因果推断;教育研究;准实验;异质性残值;内部有效性

作者简介:

  作者简介:黄斌,方超,汪栋,南京财经大学公共管理学院/公共财政研究中心。南京 210023

  内容提要:近二十年来,因果关系推断方法快速发展成熟,并逐渐占据微观计量方法领域的主流地位。文章首先对因果关系推断方法兴起的背景进行了介绍;其次,探讨了判定因果关系需满足的三个条件,对在实验数据和非实验(观测)数据条件下进行因果判定的主要困难,以及观测数据研究中异质性残值的产生原因与构成进行了剖析;其三,借助小班化教学与“新机制”改革效果评价的实际案例,依次阐述了断点回归、工具变量、倾向得分结合倍差等准实验研究方法的基本原理与实现过程;最后,对准实验研究所面临的内部有效性质疑进行了回应,强调对选用方法背后隐含假设进行稳健性检验的重要性。

  关 键 词:因果推断 教育研究 准实验 异质性残值 内部有效性

  标题注释:国家社会科学基金教育学一般课题“2000年后我国义务教育财政制度改革效果评价研究”(BFA140039)。

  一、引言

  当今社会,公共政策的科学制定越来越依赖因果数量证据的获取,因果推断方法在近二十年间快速发展成熟,并逐渐替代传统的相关分析方法(例如相关性检验与OLS回归),占据了微观计量方法领域的主流地位。因果方法之所以能在短时间取得如此成就,主要得益于世界各国政府制定公共政策由依靠主观个体经验模式向客观证据导向(evidence-based)模式的转变。首先,全球经济增长整体放缓,政府财政增收乏力,但民生性财政支出需求却居高不下,经济建设投入与民生投入之间、不同民生支出项目之间的预算竞争愈发激烈。为了在有限的财力中分得更大的份额,各利益相关部门不得不寻求数据证据的支持,以表明自身增支的合理性;其次,在应对更加多元、复杂与庞大的社会系统治理时,既往“摸着石头过河”的公共政策制定模式日渐暴露出其高“犯错”风险与高“试错”成本的弊端,致使决策者在制定政策时慎之又慎;其三,伴随着民主化进程,社会公众对于公共政策亦从原先被动的接受者转变为主动的参与者与质疑者,由此推动政府内部基于绩效问责的管理制度变革,政府需要通过对项目投入与产出之间的因果关系判定与绩效分析,提高公共资源分配与使用效率,并以此来回应外界对公共政策合法性与合理性的质疑。

  从统计与计量学理上看,传统相关分析方法处于被淘汰地位亦存在其必然性。相关方法虽然能够揭示政策与现实结果之间的数量变动关系,却无法为现实结果的形成究竟是不是由某一政策促成的这一问题提供可靠的答案。政策A与结果B有相关关系,并不意味一定是A导致B,因为如果存在其他一个事件C,它同时对A和B有影响,那么在未控制C的情况下,我们就无法得到A对B一定有因果效应(causal effect)的结论,由此就不能保证政策A一定是一种能通向结果B的有效的政策干预手段。若决策者错误地将相关结果视为具有因果意义的依据,极易形成无效的政策干预。例如,分析显示冰淇淋销量与儿童溺水死亡数之间存在数量上的正相关关系,但这并不意味着控制冰淇淋销量能够降低儿童溺水死亡数,因为这两个变量之间关系只是一种伪相关(spurious correlation),它们同时受到气温的影响。此外,相关分析通常无法提供变量间因果走向信息。例如,教育财政研究者常发现地方生均教育支出与财政转移支付之间有负相关关系,但对这一结果我们可以作两种截然不同的解读:一是受财政资助越多,地方的生均教育支出水平越低,这表明转移支付效果较差;二是那些生均支出水平较低的地方得到了更多的转移支付,这表明转移支付的分配符合公平性原则。究竟谁为因,谁为果,相关分析难以给出答案。相比之下,因果推断方法能够提供变量间可靠的因果关系信息,帮助决策者设计出能达成预期政策目标的有效的政策工具,从而成为证据导向型政策研究的主流方法选择。

  近年来,因果推断方法被世界各国大量应用于公共政策制定中。美国是当前在公共教育政策领域中最重视因果推断法运用的国家。2002年布什政府出台《不让一个孩子落后法》(No Child Left Behind Act),该法案在其A部分第9101节中指出,教育政策在对教育现实进行干预前需得到科学基准研究(Scientifically based research)的支持,而符合科学基准的研究应满足两个条件:其一,教育行为或项目的相关信息,必须经由严格、系统以及客观的程序获取;其二,研究设计需采用随机实验或准实验(quasi-experiment)的方法,将个体与组织、项目或行为分配至不同的条件下,运用合理的控制进行项目评价,在各类项目测评方法中优先承认随机实验的研究成果。该法案所提及的随机实验和准实验正是当前最重要的两种因果研究方法。一般认为,前一种方法达成的因果推断的内部有效性(internal validity)①要优于后一种方法,因而在上述法案中,随机实验结果被赋予了更高的优先权(Kaplan,2009)。②该法案的出台极大地刺激了美国教育政策研究对因果推断方法的需求,吸引了众多统计学家和计量经济学家进入到教育政策研究领域。大量新方法的应用还推动了传统教育经济学在研究视角、研究对象与研究领域方面的转变。早先教育经济学研究主要关注教育作为一种数量级的投入要素(劳动力的受教育年限)对于促进个人收入和社会经济发展的工具性作用,而近年来,越来越多的学者开始关注教育作为人身固有权利的实现程度,探讨应如何制定公共教育政策才能切实提高学生学业成绩、改善学校的教学质量。有关教育政策或项目评价性的经济学文献数量不断增多,涉及教育市场化改革(例如宪章学校、教育券)、小班化政策、教师培训项目、教学手段革新等宏观和微观领域(例如,Angrist & Lavy,1999; Angrist,et al.,2006)。因果研究不再追求精细的模型推演与复杂的方法应用,而是强调通过科学的研究设计构造出一种随机实验或类似于随机实验的数据环境,以最小的统计假设为代价获得更加可靠的因果关系结论。常用的因果推断方法包括随机实验、自然实验与断点回归、工具变量法、倾向得分法、倍差法等,本文将循序渐进地对这几种因果推断方法的基本原理及其在教育研究中的实例应用进行介绍。为了降低教育研究者的阅读难度,增强文章的可阅性,我们将在论述中尽量采用非技术性语言,尽可能地避免数学化的表述。

作者简介

姓名:黄斌 方超 汪栋 工作单位:

转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们