您当前位置:首 页 > 国际视野>
国外基础教育质量监测现状与评述
 

 

作者:上海市教委教研室副主任 纪明泽   发表时间:20120210

20世纪末,以信息技术为代表的科技产业推动了世界经济由物质经济转向知识经济,科技开始取代自然资源成为经济发展的决定因素,科技、知识及其载体——人力资源在社会经济发展和全球竞争中的作用日益突出。而人力资源质量的基础——教育,特别是基础教育,已成为提升国家竞争力的决定性因素,是一个国家综合国力的重要标志之一。为此,基础教育质量越发成为世界各国和国际组织关注的重点。

国外基础教育质量监测现状

近几十年来,有越来越多的国家表现出对在世界范围内或全国范围内大规模监测教育成就,以评价教育质量和发展趋势的浓厚兴趣。其中影响较为广泛、反响较为热烈的有:

1.国际数学与科学研究趋势(TIHSS

国际数学与科学研究趋势(TIHSS)项目由国际教育成就评估协会(IEA)组织进行。

    评价模式

TIMSS旨在考察学校特定课程学习的成就,始于1995年,每四年进行一次,针对四年级(1011岁)和八年级(1415岁)的学生,以班级为单位同时进行同等的评价。评价的范围涵盖数学、科学、背景信息以及教师、课程的信息。

    评价内容

TIMSS评价所涉及的横向维度有:课堂练习、电脑的使用、家庭背景、早期的学习经历、家庭环境、课后活动、学习态度、学校环境、学科测试成绩;纵向维度有:年度、学科、年级、国家。

其中学科评价内容既重视基础知识的学习和掌握,又重视学科内容的现代性。内容来自各学科的主要领域,如数学中的数、模式、变化和关系等,科学中物质的物理和化学变化、能量转化、力和运动、生态系统、地球在宇宙中的位置等。主要反映国家课程的内容计划,按学科对知识点分门别类进行评价,各知识点之间是独立的,有明显的学科界线。另外,关注学生认知能力方面的发展,主要考察学生对课程知识的复述、理解和分析能力,并按由低到高的水平顺序排列出来。

    评价方法

TIMSS的调查方式有:纸笔测试,采用矩阵抽样技术分配题目,每人只做总评价的一部分;问卷调查。测试试卷分为三类题型:多重选择、构答题和扩展式构答题,在题型分布上,以多重选择题的方式来考察学生的各种能力,多重选择题在总题数中的比例超过2/3;构答题主要考察学生进行解释的能力,约占总题数的1/3

    报告形式

TIMSS所得到的主要结果以表格和控制图的形式呈现各个维度下面相应指标及其相互之间的关系,并将数学和科学分别以不同年级分开报告。

2.国际学生评价项目(PISA

国际学生评价(PISA)项目由国际经济合作与发展组织(OECD)进行。

    评价模式

PISA旨在考察学生为以后成人生活作准备的情况,始于2000年,针对153个月到162个月之间的学生,不管年级和教育类型,以学校为单位,每三年进行一次,每次同时评价数学、科学和阅读三种素养,但将其中一种素养作为重点。评价的范围除了包括数学、科学、阅读、背景信息以外,还包括部分可供选择的评价模块。

    评价内容

PISA评价所涉及的横向维度有:性别、学习环境、背景、学习态度、学习方式;纵向维度有:年度、学科、学校、国家。

其中学科评价内容涉及各学科的主要领域,如数学中的数、模式、变化和关系等,科学中物质的物理和化学变化、能量转化、力和运动、生态系统、地球在宇宙中的位置等。但它打破学校课程组织的学科界线,以主题的形式来组织内容。同时,也关注学生认知能力方面的发展,主要考察学生对问题过程的理解以及在真实情境中应用知识的能力。

    评价方法

PISA的调查方式与TIMSS的类似,有:纸笔测试,采用矩阵抽样技术分配题目,每人只做总评价的一部分;问卷调查。测试试卷则分为五种题型:多重选择、重复多重选择、封闭式构答、短答题和开放式构答题,在题型分布上,主要以构答题的方式来考察学生的能力,约占总题目的2/3,并设计了单元式的题目串,每个单元中的若干题目共用相同的背景材料。以这种方式呈现的题目可以考察任一种能力。

    报告形式

PISA所得到的主要结果与TIMSS类似,以表格和控制图的形式呈现各个维度下面相应指标及其相互之间的关系,但它却是将数学、科学和阅读素养在一起报告。

 

3.美国国家教育进展评估(NAEP

美国国家教育进展评估(NAEP)项目由美国国家评估管理委员会(NAGB)和美国教育部下属的教育统计中心(NCES)共同完成。

    评价模式

NAEP是美国范围内的教育质量监测,仅针对整体的学业成就普查,始于1996年,至少每隔两年测试一次,评估四、八和十二年级学生的学业水平,涵盖阅读、数学、科学、写作、美国历史、公民、地理和艺术等,其中以阅读、数学和科学为主。

    评价内容

NAEP可按不同维度进行分类:按评价的层级,可分为全国评价、州评价和区域评价;按时间维度,可分为长期趋势评价(Long-Term Trend Assessment)和短期评价;按针对性,可分为普通评价和特殊评价(如特许学校调查等)。不同的评价类型在目的、方法、题目、对象上相应有所不同。另外,还在背景、种族、性别和家庭收入几方面进行了研究。

其中学科评价内容切实围绕课程标准制定,通过可靠的表现标准测验出学生的知识、能力、态度与价值观等。如:NAEP2007数学评价设计主要从数学内容(mathematical content)、试题难度(mathematical complexity of items)、数学能力(mathematical power)三方面着手。数学内容包括了数与运算、代数、几何、度量以及数据分析与概率,这些内容贯穿整个教育过程,围绕核心技能,随年级增长要求提高,挑战性增加。试题难度涉及题目的认知层次,力图回答题目对学生提出了什么要求。试题难度分为较低、中等、较高,每一层次都包括了学生知道什么、能做什么的方面,如推理过程、概念理解、问题解决等。而数学能力指向推理、关联、交流等过程的考察。

    评价方法

NAEP评价是一种抽测型考试,评价对象通过随机抽样而来,评价科目根据不同年份抽取。调查方式有:纸笔测试,采用矩阵抽样技术分配题目,每两年会在全国的公立和私立学校二、四、八年级采集12000个学生作为样本,从而保证了抽样的覆盖面和代表性。

    报告形式

NAEP提供的只是国家、州层面或者区域水平的整体报告,而不是针对个人的诊断性评价。其报告形式是与表现标准紧密联系的,报告形式主要有成就水平(achievement level)和量尺分数(scale scoes)。成就水平分为基本(basic)、熟练(proficient)、优秀(advanced),并有明确的界定。基本指部分掌握各个年级熟练工作需要的基本知识和技能;熟练是对于每个年级的测评有稳固的专业表现。达到该水平的学生对于有挑战性的学科能够把握,包括学科知识及其在现实中的应用、适当的分析能力等。优秀则为表现优异。成就水平描述了各年级学生应该知道什么和能够做什么的表现标准,是以学生群体为对象,以参与评价学生在三个水平的百分比分布来呈示。

 

国外基础教育质量监测现状评述

通过对国内外基础教育质量监测现状的研究,我们发现TIMSSPISA两个教育质量监测体系都是在全球范围内的,都是对定义明确的群体进行的抽样研究,其主要优点首先是测评模型,两者都是一个输入、过程、输出的模型,不仅关注输出,同时也关注输入和过程,并研究其间的关系。其次,对于学科成绩的评价,不仅仅是看考试成绩,而是将学科分割成多块相应的学科素养来看,比如:就数学学科而言,分为代数、数据分析和概率、几何、计算方法等模块。另外,从时间、学科和层次的维度来研究问题,值得借鉴。但是,TIMSSPISA没有体现出学生、班级、学校、区县等多层次的基础教育质量情况,缺乏对未来基础教育质量的预测功能。

NAEP作为美国国家范围内的教育质量监测,主要有以下几个方面的优点。第一,通过全国评估和州评估可以对学校教育教学质量进行监控,促进成绩差的学校和学区改进教学方式,提高学生成绩。第二,NAEP的评估理念是了解不同年级学生对不同学科的掌握和应用情况,以便于最佳配置美国学生所需要的知识、技巧和能力。同时。通过考试成绩所提供的信息了解学生在知识技能掌握方面的优势和不足,可以督促教师用心教学,督促学生努力学习,从总体上提高基础教育质量。第三,全国考试和州考试内容与学校课程有密切的关系,同时通过各种问卷对教师和学校进行背景变量的调查,使得教学内容更加规范,评估的实施和评估结果报告能够直接推动学校课程的改革和教师教学行为的改进,对推行全国统一课程标准也具有积极的作用。第四,NAEP是美国唯一从全国范围、各州和不同社区内收集不同种族群体典型学生样本,涵盖多种学科领域且持续时间长达多年的学生学业成绩测量体系,可以有效防止学校将多个测验的结果混合而只提供学校的平均水平以掩盖不同学生群体之间的成绩差距。但是,NAEP仅仅提供整体的监测,忽略了对学生个体的有效评估和反馈。

国内基础教育质量监测结合了我国教育研究的实际情况,主要有以下几个方面的优点。比如,不仅停留于学生学业成绩的分析,同时考虑了学生的学习环境、教学环境、教师的教学过程等因素。再比如,采取了测试和问卷调查相结合的方式,综合了解学生的各方面状况。另外,利用图表的形式将结果展现出来,让人直观地了解学生学业成绩的变化趋势以及各个因素之间的联系。

返回顶部】 【关闭】 【打印