您所在的位置是: 首页 > 教育随笔教育论文→ 正文
从“选拔为先”到“素养为重”:中国教学评价改革40年
录入:xzs  点击次数:279  录入日期:2018年12月06日

选拔为先素养为重:中国教学评价改革40

朱丽

摘要】 纵观改革开放近四十年来我国教学评价发展历程,可以从20世纪90年代初素质教育的提出及21世纪初新一轮课程改革等具有标志性的教育教学改革出发,将教学评价粗略地分为选拔为先的传统教学评价、发展导向的现代教学评价和素养为重的当代教学评价三个阶段。选拔为先的评价偏书本、惟纸笔、重分数、重结果;发展导向的评价目标多维、主体多元、指标全面、重过程;素养为重的评价则聚焦素养、倡导绿色、方式多元、关注公平。各时期的教学评价都带有强烈的时代特征,当然彼此间界线并非泾渭分明,而是互有过渡与渗透。

关键词】 改革开放40年;教学评价;改革与发展

教学评价是学校教育教学活动的重要环节,它是依据一定的教学目标和标准,采用定量与定性相结合的方法,对教与学的效果进行的价值判断,以确定教学目标达成度的过程,是对什么样的教学是好的教学的判定。教学过程是一个复杂的过程,涵盖的因素非常多,由此教学评价所涉及的范围也很广。一般而言,教学过程是由教师教的活动和学生学的活动构成的,教学评价应该包括对教师的教(如教师的教学表现、课堂教学质量等)和学生的学(如学生的学业成绩等)两方面的评价。从教学过程组成环节来看,教学评价既包括对教学设计的评价,也包括对教学过程的评价,还包括对教学效果的评价,贯穿于整个教学过程,对教学发挥着导向、诊断、反馈、改进、激励和管理等作用,对教学质量起着重要保障作用。

纵观改革开放近四十年来我国教学评价发展历程,可以从20世纪90年代初素质教育的提出及21世纪初新一轮课程改革等具有标志性的教育教学改革事件将教学评价粗略地分为凸显选拔功能的传统教学评价、以发展为导向的现代教学评价及素养为重的当代教学评价三个阶段。这与国际上教育评价从对教育的评价促进教育的评价转向的大趋势相一致。虽然这里将教学评价进展按照时间顺序来分段,但各阶段之间不是截然分明的,传统中孕育着现代性,现代性则是对传统的扬弃,如此才能在传承中创新发展。

一、应试教育背景下选拔为先的传统教学评价(改革开放初期-20世纪80年代末)

改革开放初期,经过十年文革,教学评价合理性、公正性等遭到破坏,处于恢复时期。为了凸显公平公正,这一时期主要的评价方式是考试(如高考),采用标准化考试对学生进行测验,用同一条标准来衡量所有学生。表面来看,标准化考试有统一的标准答案,可以克服评价者的主观性,实行分数面前人人平等,显得更为公平。但这种评价过度强调评价的甄别和选拔功能,其导致的直接后果是评价的异化,即教学评价被狭隘地等同于考试,成为应试教育的一个重要推手。考试成为教学的指挥棒,考什么就教什么学什么

从具体实践来看,传统教学评价主要体现出以下几个特点:

(一)以书本知识为本位

传统教学评价以知识论为基础,强调学生对书本知识掌握的程度和数量,着重检查学生对学科知识的掌握,忽视相关能力的考核,更不对学生的情感、意志等非智力因素进行评价。在教学中,教师为了让学生在标准化测验中取得好的成绩,必然会以传播知识为主,而且在某种程度上教师对知识本身的理解也过于偏狭。

知识依据不同的维度可分为不同类型。一是陈述性知识和程序性知识。后来从程序性知识中又分化出一类特殊的程序性知识,称为策略性知识。陈述性知识即是关于是什么的知识,程序性知识则是关于怎么样如何做的知识。应试知识更多是教材、教辅等呈现的知识,而这些知识实质上是一种陈述性知识,以记忆为主。在布卢姆的教育目标分类中,认知领域的教育目标被进一步分为知识、领会(或理解)、运用、分析、综合和评价六个由低级到高级的水平。2001年,以安德森( AndersonLW)为首的研究小组对布卢姆1956年的教育目标分类学进行了修订。修订的布卢姆认知目标分类学是从知识与认知过程相结合的角度来分析和看待教学目标、教学活动、教学评价以及这三者之间的一致性的。学生学习的内容可分为事实性知识、概念性知识、程序性知识和元认知知识四类,认知过程是学生在心里对这些知识(或用这些知识)做什么的描述,具体包括记忆、理解、运用、分析、评价、创造六类渐次复杂的认知过程。二是显性知识和隐性知识。该分类是由英国学者波兰尼( Michael Polanyi)提出,他认为显性知识通常被描述为知识的,即以书面文字、图表和数学公式加以表述的。而隐性知识是未被表述的知识,像人们在做某事的行动中所拥有的知识,知道但难以言述。教师教学以显性的书本知识为主,忽略了大量存在于环境、文化、课程等中的隐性知识。

虽然以知识为本位的教学评价在有效地促进对传统文化遗产的继承上,它发挥了重要作用,但以书本知识为本位的教学评价更多关注的是陈述性知识和显性知识的评价,明显地有片面性和偶然性,特别是当所考内容(考题)发生偏差,考生是死记硬背时,它就会造成假象,难以对现代教学起到正确的引导作用。同时,由于过于重视知识的传承,忽视了教学主体在其中的主导地位和能动性,使教学评价更多体现为一种管理功能,而非教育功能。

(二)以纸笔测试为唯一评价方式

相比于口试、面试等评价方式,纸笔测验简单易行,能在短时间里对大规模的受试者进行评价,具有较强的规模效益。对于纸笔测验的价值,教育评价之父泰勒( TaylerRW)认为至少有两种,一是为收集有些类型学生行为的证据,提供了一种切实可行的程序。如果人们希望了解学生已有什么知识,那么,只要学生能够阅读和回答多项选择测验或其它类似测验的各种试题的话,那就很容易通过纸笔测验来获得证据。二是了解学生具有分析和有效处理各种形式的言语问题、词汇、阅读等能力,以及一些容易用言语形式来表达的各种技能( skills)和能力(abilities)的有效手段。但是,泰勒也提出,有许多其他表示教育目标的期望行为是难以用纸笔测验来评估的。考试确实不能测得人的全部,一旦不能测得往往就会被忽视,正如李聪明所言,社会态度、实际技术、创造、兴趣、鉴赏力等都属于教育的重要领域,为教育测验所不能充分把握者,在重视考试与测验的时代,这些重要学力又往往被教育者冷落。

除了知识的获得与增长,儿童通过学校生活必然还有能力的发展、情感的丰富以及价值观的形成,而这些都是难以量化的,因而也难以仅通过纸笔测试来评价,盖奇等指出教师必须记住:测验取的只是学生学过的东西的一小部分,测验对于估量学生的行为并不是一贯正确的工具,而且测验往往会有低可靠度和尚不知道的效度。要完整而全面地评价教学效果在学生身上的体现必然要结合其他的评价方式。

(三)以分数高低为衡量教学效果的唯一尺度

选拔为取向的传统教学评价以考试成绩来评价教学效果的优劣,依据分数对学生进行排名、划分等级等,导致学校片面追求升学率,教师、家长和学生过度关注分数,学生的发展被简化为一个个数字,教育的育人价值被育分的功利性目的所替代。学生和教师都是一个包括了道德、情感、兴趣、审美等在内的完整生命个体,在教学过程中,师生双方以各自的生活经验参与到教学活动中去,通过教学交往获得生命的丰富与成长,而这些都是难以仅通过数字来解读的。不可否认,分数对教师和学生有激励作用,但不能以分数为衡量学生发展的唯一尺度,更不能仅依据分数给学生分等定级。从根本上说,传统的教学评价是为了选拔适合于教育的儿童,把评价的着眼点放在甄别、鉴定和选拔的功能上,就像一个筛子,将适合于接受高一级教育的学生筛选出来,淘汰另一部分学生,并最终实现教育的社会分层功能。

(四)重结果轻过程

传统教学评价关注教学结果,确定学生在群体中的位置,为奖惩提供依据,是一种终结性评价,忽视了评价的诊断与改进功能。美国著名教育评价专家斯塔费尔比姆( StufflebeamDL)说过,评价不是为了证明(Prove),而是为了改进( improve)。诊断学生的教育水平,促进学生发展应是评价的首要功能,即评价的教育功能。从20世纪60年代到70年代,教育评价专家克隆巴赫( CronbachLJ)、斯塔费尔比姆、斯克里文( ScrivenM.)等人对泰勒的目标达成评价模式提出了质疑,他们认为评价不仅应关心教育的目标、检验教育目的达到的程度,更应关心教学中人的发展,要重视评价的改进功能。

应试教育背景下的传统教学评价本质上是一种目标达成模式,是建立在泰勒的教育评价观的基础上的。泰勒创造了教育评价这个词,他认为评价过程在本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程,也是一种确定行为发生实际变化的程度的过程,实际上就是比较实际效果与预期效果之间的差距。应试教育背景下的传统的以标准化测验为唯一的评价方式在价值取向上表现出很强的管理主义倾向,测验结果不但被用来对个人作出结论,而且被用来诊断特定的学校的弱点以及评价课程和整个学校的工作,旨在更好地管理学校、教师和学生,对教育教学产生了许多负面的影响,最大的弊端莫过于对教学的规制和个体自主发展的阻碍。教师围绕考试标准教教材,不敢越雷池一步,限制了教师的教学自由。教学过程成了一个输入一输出的既定过程,学生被当作接受知识的容器,缺乏学习的主动性、自主性,缺乏学习自由,课堂的生成性被压制。这种以甄别、选拔为导向的传统教育评价随着时代对人才提出的新要求必须予以改革。

二、素质教育背景下发展导向的现代教学评价(20世纪80年代末-90年代末期)

20世纪80年代末期,随着社会对学生个性发展、全面发展的关注,传统应试教育以知识为本位、以应试为取向的人才培养观越来越难以适应社会的发展,需要予以根本性的变革,于是以促进人的全面发展,全面提高国民素质为价值追求的素质教育理念开始提出。1993213日,中共中央、国务院在总结广大教育工作者改革实践经验的基础上制定发布的《中国教育改革和发展纲要》(简称《纲要》)中指出:中小学要从应试教育转向全面提高国民素质的轨道,面向全体学生,全面提高学生的思想道德、文化科学、劳动技能和身体心理素质,促进学生生动活泼地发展,办出各自的特色。”19948月,《中共中央关于进一步加强和改进学校德育工作的若干意见》明确提出,增强适应时代发展、社会进步,以及建立社会主义市场经济体制的新要求和迫切需要的素质教育,首次在中央文件中提出了素质教育。此后,素质教育成为教育教学改革的核心价值取向,起着方向引领的作用。

素质教育是旨在提高全体国民素质的教育,与传统精英主义取向的应试教育有着根本的区别,实施素质教育要有与之相适应的评价,评价改革迫在眉睫。《纲要》同时指出建立各级各类教育的质量标准和评估指标体系。各地教育部门要把检查评估学生教育质量作为一项经常性的任务1999年,中共中央、国务院在《关于深化教育改革全面推进素质教育的决定》对学校人才培养模式、课程内容、教学方式等提出了明确的要求,同时提出要加快改革招生考试和评价制度……建立符合素质教育要求的对学校、教师和学生的评价机制。在此背景下,发展性教学评价理念受到关注。

发展性教学评价( Developmental Teaching Assessment)20世纪80年代产生于西方的一种教学评价理念,20世纪90年代在中国兴起。发展性教学评价理念有其深厚的理论基础,包括多元智能理论、建构主义理论及人本主义等理论,倡导对个体的个性、价值和尊严等的尊重。发展性教学评价是一种动态评价,强调发挥评价对象的主体性,提出从关注生命、关注教育主体的生存质量角度,强调教学评价的发展性、自主性、开放性,强调以人为本,本质上是一种关注学生发展、教师素质提高和教学实践改进的形成性教学评价。此外,发展性评价是一种立足现实、面向未来的评价,旨在促进教师发展、学生进步和教学改进,它不将评价结果与预定目标相比,而是与原有的基础或起始水平相比,看评价对象的进步情况,因此也可以看作是一种增值评价。以增值为取向的发展性教学评价是一种更为公平的评价,它比较的是学生通过一段时间的学习后的发展,而不仅看原始成绩,这就排除了学生生源差异等对教学质量的影响。

随着素质教育的全面推进,适应现代社会的教学观、师生观及学习观等教学理念日益深入人心,发展性教学评价已为人们所普遍接受,并广泛运用于实践。发展性教学评价在实施过程中克服了传统教学评价的弊端,不再仅关注评价的甄别和选拔功能,不再仅将考试测验作为评价的唯一方法,在评价目标、评价方式、评价主体等各方面呈现出多元的特点。

(一)评价目标的多维性

相比于传统教学评价的知识本位和能力本位,发展性教学评价重视学生综合素质的发展,不仅关注学生是否掌握了教师教授的知识,同时也关注学生的情感态度的变化,将学生作为一个整体的人而关注学生的生命成长体验,以学定教教为学服务的观念已成共识,要通过教学评价促进学生的全面而有个性的发展。学业评价也已不仅局限于考试成绩,而是对学生学业成绩与表现进行全面的评价。

(二)评价主体的多元化

在传统教学评价中,教师和学生处于教学中的被动地位,是被评价的对象,缺乏评价自主权,是一种独白式评价。在发展性教学评价中,教师和学生不仅是被评价者,也是评价者。教师通过教学日志、课后反思等多种方式对自己的教学进行自评,使教师能更清楚地了解自己的长处与不足,使自在状态的教学行为转变为自觉状态。学生也被视作是教学评价的主体,他们不仅有权对教师教学进行评价,也有权对自己和同学进行评价,如档案袋评价方式和课堂教学中学生互评的方式,即是学生作为评价者的一种表现。第四代以协商对话为主要标志的评价理念被人们广泛接受,在教学评价过程中,评价主体民主参与、共同协商、彼此尊重、平等对话。

(三)评价指标的全面性

发展性教学评价对教学的评价不仅包括学生的学业成绩,还有教学目标和教学过程的评价,从不同方面来全面评价什么样的教学是好的教学,对评价的标准及评价结果的解释,从仅用测验分数的高低作为衡量学校教学质量的重要标志,向强调立体、综合、多层次、全方位发展。构建一个由共性与个性、结果与过程、定量与定性相结合的评价指标体系。

(四)关注评价的过程性

发展性教学评价强调采用定量与定性相结合的方式对评价对象进行评价,强调将诊断性评价、形成性评价和终结性评价相统一,不仅关注结果,更关注过程。发展性教学评价采用的定性方法包括访谈、观察、课堂记录、成长档案袋等多种方法,通过这些方法来洞察学习者的学习轨迹,借以判断哪些是有意义的或有价值的经验,为评价者全面了解教学活动以及学生的进步和发展提供了充分的依据,以便对评价对象提出全面的、有针对性的评价结论和发展建议,同时也有助于学生根据判断标准对于包括自己的能倾和行为、学习成果在内的学习活动进行评价行为,让学生能够反观自身,总结得失,从而更好地发挥评价的诊断与改进作用。

就理念而言,发展性教学评价无疑是一种好的评价理念,但有两点需要注意:一是倡导发展性教学评价并不意味着以选拔为取向的教学评价没有价值,必须予以打倒。素质教育并非不允许竞争,实施素质教育同样也需要考试竞争,同样需要发挥考试的选拔功能。考试竞争不等于应试教育,它只是一种工具,也适用于素质教育。要摒弃非此即彼的二元对立思想;二是发展性教学评价并非没有缺陷。由于对如何实施并没有统一的操作性要求,导致实践中变形走样的现象屡屡出现,如档案袋评价。档案袋评价是一种新兴的评价手段,是通过对档案袋的制作过程和最终结果的分析而对学生发展状况所作出的评价。档案袋又称成长记录袋”( portfolio),其原意为代表性作品选辑,学生可以将自己认为最好的作品,如学习日记、思考心得、小制作等放到记录袋中,一段时期之后可以看出学生的发展变化,体现了评价的过程性。但是,如何对学生的作品进行分析、评价呢?评价标准是什么?如果仅仅为了表扬、鼓励学生,久而久之,档案袋评价也很难起到推动发展的作用。

说到底,评价只是一种工具,都要服务于一定的目的。任何一种评价都不是十全十美的,都有其适用范围,要根据不同的目的选择不同的评价类型。

三、走向素养为重的当代教学评价(21世纪初至今)

进入21世纪,国家启动了第八次全国性的课程改革(简称新课改)。新课改以来,国家一直在探索着教育评价体系的改革,出台了一系列政策文件以指导评价实践改革。2001年,教育部颁发的《基础教育课程改革纲要(试行)》(教基[ 200117号)中提出要改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能突出教学评价对改进教学实践、促进教师与学生发展的功能

2002年,《教育部关于积极推进中小学评价与考试制度改革的通知》中明确提出建立促进学生全面发展的评价体系促进教师不断提高的评价体系促进课程不断发展的评价体系,其中将学生全面发展的目标规定为道德素质、公民素养、学习能力、交流与合作、运动与健康、审美与表现。《国家中长期教育改革和发展规划纲要( 2010-2020)》提出改革教育质量评价和人才评价制度。改进教育教学评价。根据培养目标和人才理念,建立科学、多样的评价标准。开展由政府、学校、家长及社会各方面参与的教育质量评价活动。做好学生成长记录,完善综合素质评价。探索促进学生发展的多种评价方式

2014年,《国务院关于深化考试招生制度改革的实施意见》提出建立规范的学生综合素质档案,客观记录学生成长过程中的突出表现,注重社会责任感、创新精神和实践能力,主要包括学生思想品德、学业水平、身心健康、兴趣特长、社会实践等内容。”20179月,中办、国办印发了《关于深化教育体制机制改革的意见》,指出强调要建立以学生发展为本的新型教学关系。改进教学方式和学习方式,变革教学组织形式,创新教学手段,改革学生评价方式。

新课改十多年来,我国中小学在课程建设、课堂教学、师生关系、教育教学评价、教师专业发展等方面都取得了重要进展。就本质而言,新课改仍是以深化素质教育改革为主旋律的,当代教学评价依然延续素质教育以来所提倡的发展性评价,以促进教师的专业成长、学生的全面发展和教学实践改进为目的。但在实践层面上,教学评价呈现出一些新的特点,进行了一系列的探索。下面以我国新一轮高考改革,国际学生评估项目( Programmer for International Student Assessment,简称PISA)及上海市义务教育阶段绿色指标综合评价为例来分析当代教学评价的特点。

(一)聚焦学生素养评价

21世纪以来,学生核心素养成为当前世界各国教育领域的热点话题,受到联合国教科文组织、OECD、欧洲联盟等国际组织的高度关注。OECD1997年起即开始研究核心素养,经过多年研究于2003年出版了《核心素养促进成功的生活和健全的社会》( Key Competencies for a Successful Life and a Well-Functioning Society),将有关学生能力素养的讨论直接指向核心素养。近年来,国内学者积极开展核心素养的研究,教育部组织专家团队研制了我国学生发展核心素养体系。2016年,北京师范大学课题组发布了中国学生发展核心素养指标框架,对学生发展核心素养的内涵、表现、落实途径等做了详细阐释。核心素养可看作当代社会对培养什么样的人的追问,是对素质教育的进一步深化。评价具有强大的导向作用,要想使学生素养培育能够真正落地,评价内容和形式都要作出相应的改革。

PISA测试是OECD发起的国际比较研究,其主要以学生的素养为测试内容。自2000年起,PISA测试每3年举行一次,主要评价对象为成员国或非成员国中即将完成义务教育的15周岁学生,评估学生在多大程度上掌握了全面参与社会所需要的终身学习能力,“PISA所测量的是完成与现实生活相关的任务的能力,它取决于对关键概念的整体理解,而不是把评估局限在特定学科知识的理解上。这种运用已学知识和基本技能去解决问题的能力,就是素养。按照经合组织的解释,素养是指有关学生在主要学科领域应用所学知识和技能的能力,在问题出现时分析、推断和有效交流的能力,以及在不同情境中解释和解决问题的能力。具体而言,PISA测试主要聚焦在阅读、数学和科学等关键领域的素养上,2012年新加了财经素养,2015年增加协作性问题解决能力的测评。

从我国新一轮高考改革来看,除了学生学业,同样关注学生素养。教育部《关于加强和改进普通高中学生综合素质评价的意见》(教基二[ 2014] 11号)对综合素质评价做了明确的界定,综合素质评价是对学生全面发展状况的观察、记录、分析,是发现和培育学生良好个性的重要手段,是促进学生全面发展的重要抓手,是深入推进素质教育的一项重要制度,对于扭转长期以来以考代评的片面追求分数的现象具有重要意义。综合素质评价内容分为五个方面:思想品德、学业水平、身心健康、艺术素养和社会实践,包括写实记录、整理筛选、公示审核、形成档案、材料使用五个程序。注重考察学生的行为表现,特别是通过学生在有关活动中的具体表现来反映其全面发展情况和个性特长。通过实施综合素质评价,引导学生全面综合发展。

(二)倡导绿色的教育评价理念

何谓绿色绿色,意指环保,无公害、无污染。中小学生学业质量的绿色,意味着全面、正确的学业质量观。2011年,上海市教委出台了关于《上海市中小学生学业质量绿色指标(试行)》(沪教委基[ 2011] 86号),文件指出试行绿色指标是深化教育内涵发展的客观要求、优化教育管理的应有之义、建立良好教育生态的有效保障。上海义务教育阶段学业质量绿色指标是在追求高位优质均衡的教育质量过程中推出的。其内容主要包括学生学业水平、学习动力、学业负担、师生关系、教师教学方式、校长课程领导力、学生社会经济背景对学业成绩的影响、学生品德行为、身心健康和跨年度进步等十大方面。可以看出,上海市义务教育学业绿色指标全面考察学生,不仅关注学生的学业成绩,还考察学生的品德行为、身心健康等非智力因素;不仅考察学生自身的学习动力,还将影响学生学习的社会因素纳入评价,对当前上海义务教育阶段教学改革起到了很好的导向与保障作用。

PISA测试不仅设置测试学生的阅读素养、数学素养、科学素养等指标,也将学生的学习时间、睡眠时间等纳入测试内容,作为反向指标来监测学生的学业负担程度。在学习时间方面,既有校内学科学习时间,也有校外上课(如参加学科类的补习或提高班,也被称为影子教育)的时间。如果学生的学习时间多、睡眠时间少,即使取得了好的测试成绩,从投入与产出的角度来说,这是一种高耗能的效益,长远来看,往往得不偿失。

(三)采用多元评价方式

素养本质上是一种知识、能力、态度、品格等的融合,是一种复杂的学习结果,要想全面了解与诊断学生的素养仅靠单一的评价方式难以达成,必须对过度关注认知领域的现有评价进行完善和拓展。当前,在教学评价领域进行了诸多有益的尝试。如PISA测试的方式包括对学生测试和问卷调查,学生以笔试形式完成试题,并完成一份有关个人背景及学习情况的调查问卷。

上海市义务教育学业质量绿色指标综合评价的工具同样不仅限于纸笔测试,主要有三类:1.学科测试卷,四年级学生参加三年级的语文和数学测试,九年级学生参加八年级的语文、数学、英语和科学的学科测试;2.调查问卷,分为学生问卷、教师问卷和校长问卷三种,其中学生问卷主要调查学生的基本情况、学习自信心、学习动机、学习压力、对学校的认同、学业负担、师生关系、对教师教学方式的评价、品德行为;3.体质监测,各学校根据《国家学生体质健康标准》,开展测试和进行数据上报,包括身体形态、生理机能、身体素质等3个方面21项指标。通过多种方式客观全面地评价学生。

(四)通过评价推进教育公平

OECD -直认为教育必须实现卓越( Excellent)、公平(Equity)和包容( Inclusive)三个目标,并将其看作教育成功的标准。因此,教育公平是PISA测试中的一个关键词。PISA将教育公平界定为不分性别、家庭背景或社会经济地位为所有学生提供同等的从教育中获益的机会。

PISA主要从学习结果平等、教育资源分配公平、克服学生背景的学习公平三个方面来评价基础教育的公平程度。以PISA 2009测试为例,PISA 2009国际报告对教育公平的评价主要基于阅读领域的结果,从三个方面评价教育公平:一是学习结果的平等( equality in learning outcomes)。有两个含义,从相对指标来看,指学生是否可以获得同样的学习结果,可以用学生之间的成绩差距来测量。处于成绩分布顶端的学生与底端的学生之间成绩差异越大,表明学习结果越不平等。从绝对指标来看,指学生都达到某个基准水平,可以用达到基准水平的学生比例来测量;二是教育资源分配的公平( equality in the distribution of educational resources),可以用学校教育资源指标与学生经济社会文化地位的相关性来衡量,如果所有学校都能享受基本相同的教育资源,那么学校的教育资源与学校全体学生平均的经济社会文化地位指数( ESCS)应该是不相关的,并不是说所有学校都一样才是公平;三是克服学生背景的学习公平( equality in learning regardless of student background),是一种结果公平。不仅对教育质量进行描述,而且对影响学生成绩的个体、学校、家长和社会经济文化等背景因素进行深入系统的分析。

PISA测试的实践来看,通过大规模考试和评价来监测教育公平是完全有可能的,首要的是要转变仅关注结果,且仅关注学业结果的评价理念,转向不仅关注结果,也关注影响学习结果的影响因素;其次从考试的试题和形式上要进行研究,从多维度多层次来评价学生的学习效果。应该说,PISA测试既关注质量又关注公平,可以对一国(或地区)的教育公平程度起到了检测、预警和推动作用。

我国新一轮高考改革实行一年两考,为学生提供多次机会,打破一考定终身”“一分决前程的局面,在一定程度上可以减轻学生的应考焦虑,更好地发挥自己的真实水平,避免因考试压力等各种因素所导致的高考失利给人带来的终身遗憾。对学生而言同样可以看作是一种公平。

上海义务教育阶段学业质量绿色从各项指数来看,对学生的学业水平评价综合考虑了学习的投入与产出,将学生的学业负担明确纳入评价,对学生学习的产出不只是关注学业成绩,而是综合考虑学生的身心发展,考虑影响学业成绩的背景因素,不仅体现了学业质量评价的多维性,也凸显了教育公平。

评价是教育教学系统中的一个重要环节,对教育教学起着事实上的导向作用,其变革的过程是艰难的,其承载的责任也是重大的,可能是成也萧何败萧何,也可能差之毫厘,失之千里。从我国四十年来教学评价的演进历程中不难发现,教学评价在其目的与取向、方式与方法、内容与标准等各方面,都随着教育思潮的演变、教学实践的变革以及评价理论的发展而不断地调整和更新,走过了一条从注重选拔向关注成长、从强调知识向聚焦素养、从单一目标向多元取向的转型之路,也不断地回应着不同时代提出的培养什么样的人怎样培养人等根本性命题。

(来源:《全球教育展望》2018.08.)