加强教育质量监测 推动教育评价改革

全面深化新时代教育评价改革来源:《山东教育》中学刊查看次数:182发布日期:2025-11-25


 

李刚生  吴连海

 

教育作为国家发展和民族振兴的基石性事业,是促进科技发展、经济繁荣、社会进步的核心驱动力。教育评价具有导向、诊断、鉴别和激励作用,是教育决策的依据,对于教育质量的提高起着至关重要的作用。因此,科学、公平、合理的评价方式是教育全面发展和教育质量提高的基础和前提。202010月,中共中央、国务院印发《深化新时代教育评价改革总体方案》,提出改进结果评价、强化过程评价、探索增值评价、健全综合评价,要求破立并举,推进教育评价关键领域改革取得实质性突破。《国家义务教育质量监测方案(2021年修订版)》(以下简称《监测方案》)突出“五育并举”,要求拓展监测学科领域,构建全面覆盖德智体美劳教育质量的监测指标体系,探索多领域综合评价和跨年度增值评价方案。教育质量监测强调综合评价和增值评价,为教育评价改革提供了新的实践路径。

一、监测学生全面发展状况,进行综合评价

针对义务教育阶段学生的评价,“唯分数”的倾向依然存在,分数仍然是评价学生、教师、学校的最主要标准,不管是中考、期中期末考试还是日常测验,测评的内容主要还是语文、数学、英语、科学等智育学科内容,学生的品德发展状况、艺术发展水平、身心健康、兴趣特长等常常被忽视。用智育学科分数代替综合能力,忽视学生实践能力、创新能力、合作能力等素养的考查,势必影响学生综合素质和特长的发展,不利于复合型人才和创新型人才的培养。

《监测方案》提出,落实立德树人根本任务,突出“五育并举”,拓展监测学科领域,从原来的六个学科扩展为九个学科,监测内容更为全面。国家义务教育质量监测每年选取三个学科,三年为一个监测周期,通过三年的监测完成对学生德智体美劳全面发展状况的测评,但是每年监测的样本学生是不一样的。山东省教育质量监测每年监测所有(9个)学科领域,对同一批学生同时进行所有学科的监测,采用五育融合的形式对学生进行考查,不仅考查学生各学科核心素养发展状况,而且考查他们综合运用各学科知识解决实际问题的综合能力和创新意识。山东省通过五育融合的形式进行监测,对学生的综合能力进行评价,为破除“唯分数”论、建立健全综合评价提供了新途径。

二、积累跨年度监测数据,进行增值评价

针对义务教育阶段学生的评价,结果评价仍然是教育评价的主要形式。这种忽略学生背景差异的评价模式,不关注学生的发展,无法公平公正地评价学校和教师对学生学业发展的促进作用,不能真正反映学校的教育教学质量。在这种评价方式下,学校越来越关注生源质量,而非教学质量,无法促进教育系统良性发展。

增值评价作为一种新型的评价模式,不只关注学生的最终成绩,还根据学生的起点成绩和终点成绩衡量学生取得的进步。这种评价模式可以科学反映学校的教育教学质量,解决因生源差异而导致的评价不公平问题。长期以来,我国教育领域对增值评价的关注较少,主要有以下三方面的原因。一是对增值评价理念了解较少,结果评价方法简单、便于操作,长期采用结果评价的惯性思维,使得教育管理者和教师很少考虑教育评价模式的变革;二是增值评价需要至少两次教育测评数据,即起始测评数据和终点测评数据,并且对样本量有一定要求,一个班级或一个学校的学生数量往往不能满足增值评价的要求,这对单个教师或单个学校实施增值评价造成了客观困难;三是掌握增值模型和方法需要一定的数学基础,增值评价的模型和方法有多种,一般教师和教育管理者不具备熟练使用这些模型和方法的能力,这也影响了增值评价的开展。

根据《监测方案》,义务教育质量监测要进行跨年度增值评价。教育质量监测每年实施一次,监测的样本量及所获数据应满足增值评价的要求。山东省教育质量监测依托山东教育社教育评估与质量监测中心进行,该中心有从事教育评价理论与方法研究的专门人员,他们熟知增值评价理论,依据增值评价的模型和方法,分析跨年度监测获取的学生学业成绩及影响学生学业发展的相关因素,基于多层线性模型,对学生发展进行增值评价。评价结果表明,学生的初始成绩、学习动机、电子产品使用、父母参与、父母受教育程度等学生方面的因素对学生的学业发展有显著影响,学校办学类型(公立/私立)、教师支持(教师对学生的支持)等学校方面的因素对学生的学业发展有显著影响,传统好学校(考试成绩比较好的学校)学生的增值不一定大。利用增值评价模式对学校进行评价,不管学校生源好坏,只要学生能获得较大的发展进步,就可以获得较好的评价结果,这使得学校更多关注教学质量,而非生源质量。

三、监测学生发展影响因素,强化评价的反馈和改进功能

由于学生发展质量影响因素的测评,需要专门的测评工具和专业的统计分析方法,因此,平时主要评价学生的学业发展状况,很少对学生发展质量影响因素进行评价,如学生学习情感态度、学校教育教学状况、家庭教育状况以及区域教育管理情况等。测评结果只反映学生学业发展状况,缺乏对学生学业发展成因的深度分析,不能对学生的发展提出科学有效的建议,对学生发展的促进作用不大。

根据《监测方案》,教育质量监测应监测学生发展质量的影响因素,如各学科领域的课程或教育活动开设、学生学业负担、教学条件保障、教师配备、教育教学、学校管理以及区域教育管理情况等。山东省教育质量监测对教育教学状况、学业负担、身心健康状况等相关因素进行测评,获得3000多万条数据,通过对监测数据的深入分析,探究数据之间的相互关系和相互影响,挖掘影响学生发展质量的深层原因,将学生发展状况以及背后的原因分析形成问题清单,反馈给教育主管部门、学校、家庭。测评反馈为教育教学改革提供了科学依据和具体建议,促进了教育教学质量的提高。

四、创新监测评价形式,实施多元化评价

除评价内容革新外,评价形式的多元化同样是评价改革的关键维度。针对义务教育阶段学生的评价,纸笔测试仍然是主要形式。纸笔测试对于评价可结构化、可书面化的认知能力比较有效,但对于实践能力、创造能力、交流能力、情感态度等方面的测评存在明显的不足。例如,学生的艺术表现能力很难用纸笔测试进行测评。长期使用纸笔测试进行评价易导致学生机械刷题,“为考而学”,实践能力、综合应用能力、创造能力、社交能力、情感态度等得不到充分发展。

实操性测评、情景化测评、口语现场测评等测评形式可以有效弥补纸笔测试的不足,但是,相比纸笔测评,这些测评均需花费大量的人力、物力和财力,组织测评存在一定困难,故实操性测评等测评形式在平时很难得到广泛应用。

根据《监测方案》,监测要研制表现性测试工具,用于体育与健康、科学、艺术等学科领域,通过学生现场参与和演示,监测其运动、操作、演唱能力等。山东省教育质量监测,利用智能监测终端实时采集体育与健康八个项目的数据;构建“在线表达+智能口语评价”体系,借助自然语言处理技术对学生发音准确度、语流连贯性进行智能评分;构建“在线演唱+智能演唱”评价体系,对学生演唱音准、节奏、流畅性、情感表达等进行智能评分。信息化平台+智能化评价不仅节省了大量人力物力,确保测评正常进行,还保证了评分标准的统一性、评分结果的客观性。多元化的评价方式不仅可以测评学生的基础知识和基本能力,还可以测评学生的实践能力、交流能力、综合应用能力、情感态度等,改变了单一的、不科学的评价方式,有利于学生实践能力、兴趣特长等的发展,有利于创新性、综合性人才的培养。

加强教育质量监测与推动教育评价改革,需探索科学的监测手段,并辅以合理的评价方式,最终实现“让每个学生都能全面而有个性地发展”的教育目标。这一过程须长期坚持、系统推进,在实践中不断优化监测指标与评价工具,确保改革既有力度又有温度。

(作者单位均系中国海洋大学。本文系山东省教育科学“十四五”规划重点课题“基础教育阶段学生增值评价研究”阶段性成果,项目编号:2021ZD010

 

 

 

 

 

 

 

 

(《山东教育》202511月第32期)