从上一章可以看出,现代教育评估在我国的发展是在曲折中前进,在前进中又有不足,是在总体上升中仍有整体的相对落后。教育评估体系表面上正在变得越来越庞杂,而实际上又有许多领域有待于进一步拓展。管理体制日益明晰,而过度集中与缺乏统合并存。现有政策不断得到丰富和完善,而其适切性和有效性还有待于进一步提高。评估影响正逐步扩大,而发展形势是喜忧参半。我们已经感受到了教育“评估时代”的到来,同时又感觉到了这个时代的任重而道远,而只有通过对教育评估的理性反思,才能理清这个时代的脉络。
一、当前教育评估存在的主要问题
现代意义上的教育评估在我国起步较晚,尽管发展较快,但仍有很大的改进空间。有关教育督导、考试和评估的大量文件的出台说明对于教育评估的认识在不断深入,实际上也推动了我国各类教育评估活动的开展,为教育评估朝着健康的方向发展,从而为有效的保障教育质量、促进教育发展奠定了良好的基础。但是,评估地位的明确性,评估政策的适切性,评估体制的完整性,评估项目的正当性,评估内容的全面性,评估主体的专业性,评估机制的民主性,评估对象的参与性,评估行为的规范性,结果使用的合理性,评估工作的有效性等方面,归结起来就是整个评估活动的科学性与人文性,都仍然不尽如人意。英国学者纽本(Tim New burn)提出的五种类型虚假评估:走马观花型(不求深入)、文过饰非型(隐瞒问题)、暗渡陈仓型(另有动机)、表面文章型(做给人看)、借口推托型(推卸责任)等,在我国的评估实践中也均有表现。
从活动层面来说,许多评估项目缺乏正当性,主要表现为项目过多过滥,特别是没有很大效果的单项评估和应景式的突击性评估。同时,评估目标的适切性和评估的发展性功能体现不够,片面强调评估的甄别功能和选拔功能,重结果、轻过程,重结论、轻影响,重外部评估、轻自我参与,学校作为评估活动的主要利益相关人无法有效地参与评估的主要过程,往往被排斥在主要的评估活动之外,处于任人摆布的地位,评估活动的操作往往缺乏人文性。评估方案普遍存在价值偏差,学生的学习目标、教师的教学目标和校长的管理目标经常被严重扭曲。片面强调学生的学业成绩,忽视对学生全面素质和体现学校办学水平的其他因素的评估。评估指标一直以来普遍存在面向少数、片面要求、千校一面、“目中无人”、忽视个性的问题。
从技术层面来说,评估工作仍不够规范,专业性、权威性、公正性和相对的独立性明显不足,专业评估人员参与的评估专业服务不够。居高临下、外部主宰式的管理性评估过多,同行主导、共同学习式的专业性评估过少。对照指标和标准核对、进行简单加减和凭印象判断的方法使用较多,尊重科学性,恪守专业性,利用现代评估工具进行深入、细致的剖析和提供专业化服务较少,经验型评估的痕迹还比较明显。评估很少讲究科学性,除了在我国评估起步晚这个原因外,与重视不够,发展不够快,实践中反思还太少,理论总结太少等也有很大的关系。此外,评估技术手段的科学化、专业化、信息化程度有待进一步提高。
从政策层面来说,评估政策缺乏适切性,教育评估的目标与教育质量的目标严重脱节,教育评估的实践与国家现有的评估政策所追求的价值趋向相去甚远,教育评估政策对教育评估的支撑力度不够。教育评估的法律地位不够明确,各类教育评估手段之间的关系也不够明确。有利于现代学校制度和学校自主发展、教育均衡化和真正落实素质教育的评估政策还不够完善。评估实践呼唤科学合理、可操作性更强的评估政策,以切实改变目前单一的仅通过高考分数选拔人才和用升学率作为评估学校的唯一依据的状况,真正纠正片面追求升学率的倾向,把素质教育落到实处,切实改变“以考代评”、“以分取人”和“一评定终生”等现象。
从制度层面来说,存在上述诸多问题的根本原因是,保障和改进教育质量的评估体制没有安装到位。目前,覆盖全国的区域教育质量监控与评估网络尚未形成,教育问责制度尚需完善;民间中介力量参与和社会性评估体系建设有待加强,评估人员队伍建设仍需加强;通过教育评估引导公众正确认识教育质量还不够,有利于素质教育的社会舆论氛围尚未形成;学校评估中对学校自我规划、自主发展、形成特色意识和能力形成还重视不够;教育评估到底为何评,应该由谁来评,评什么,怎么评,何时评,评了怎样,这些根本性问题远远未能得到回答。教育评估应该更多地关注条件是否合格,还是条件合格后的目标达成和质量保障?教育质量保障与改进的责任应该由哪些方面来承担,如何承担?政府机构、学校与民间力量应该以怎样的身份参与评估活动?教育评估机构应该对谁负责,如何负责?对这些问题的完整回答对于完善我国现代教育评估制度十分必要。
教育评估中存在的有些问题是迫切需要解决的整个教育改革与发展中的重大问题,如素质教育评估体系的问题、教育质量保障体制问题、评估促进均衡发展的问题、评估促进现代学校制度完善的问题等。以素质教育问题来说,我国目前的学业评估、学生评估、教师(教学)评估、学校评估和区域教育评估还没有真正按照教育质量的要求进行。不论是考试的内容,还是其他教育评估的指标体系均没有很好地反映真正的教育质量的要求、目标和标准,教育目标被严重扭曲。评估的立足点不是要通过其诊断功能发展某方面的后进生,而是淘汰所谓差生;不是从不会评到会,而是要从会一直评到不会;不是一个也不能少,而是一个也不能多,没有很好地顾及学生全面而有个性的发展。
为什么全国在实施素质教育中普遍存在“素质教育轰轰烈烈,应试教育扎扎实实”的问题,究其根源有两条:一是教育评估评不出素质,二是实际上就没有真正地按照素质教育的要求去评估教育。其实,考试中侧重于素质的考核已经有许多现成的经验,区分素质教育的课堂和传统的应试教育的课堂也十分容易,所谓家长以及社会舆论压力也是可以引导的,要改变有的校长、教育局长和地方领导对升学率的片面重视其实也非难事,至于与此相关的优质教育资源相对不足和教育发展不均衡带来的升学竞争的矛盾,也是可以通过加大投入和正确的政策导向逐步从根本上予以解决的,关键是在教育系统内有没有一个真正的素质教育的评估体系,首先是有没有这样一种真正落实素质教育的强烈的意愿、决心和切实的行动。
这一系统内的评估体系的缺失反映到制度层面就是,没有这样的一种真正保证素质教育得以实施的法定的评估管理系统和相应的系统化的评估活动机制。2005年,在全国范围引起广泛关注的所谓“南京高考之痛”和所谓“县中模式”的争议在众说纷纭中不了了之,就清楚地表明了我国权威的、有利于促进素质教育实施的评估机制还不存在。所以,要切实改变目前单一的仅通过高考分数选拔人才和用升学率作为评估学校的唯一依据的状况,真正纠正片面追求升学率的倾向,必须推动教育评估体制的创新,从制度上保证素质教育以及整个有质量的教育的要求落到实处。
总之,理论与实践两个方面都需要反思,都需要改进。首先从理论研究层面来看,我国的现代教育评估在引进、消化国外相关成果,进行自己的实践探索方面取得了一定的进展,形成了一些理论成果,建立了一些学术研究组织,学术交流活动越来越多,近年来更培养了一批专门的评估专业人才。但是,整体实力不强,研究水平不够高,在理论创新方面少有突破。理论研究与评估实践相脱离的情况比较严重,一方面理论研究多集中在国外理论的介绍和从概念到概念的研究,结合我国的实际现状和需要的应用性研究不多;另一方面教育评估实践中遇到的许多实际问题得不到理论研究的支撑,专业性评估应有的地位得不到落实,基本上处于孤立无援的境地。
从评估实践层面来看,教育评估越来越受到各界关注,评估活动的触角已经伸到了教育工作的各个方面。有组织的评估包括政府主导的教育考试,基础教育的督导活动和重点与示范学校的评审,高等教育的若干机构与项目评估等方面。日常的教育评估活动更是无处不在,事事能评,教育工作中涉及的任何个体、项目、机构、现象和事项都能成为评估的对象和内容。但是,总体而言属于“散兵游勇”式的活动居多,在政策与体制层面少有突破。在名目繁多的教育评估活动的“繁荣”景象后面可以看到,大部分评估活动仍存在科学性的不足和人文性的缺失,制度化、模式化的高水平评估并不多见。
归纳起来,在具体的教育评估活动中比较突出的问题主要有以下方面。
(1)片面强调评估的甄别与选拔功能,忽视其诊断与促进发展的功能。一方面忽视评估本身应有的问题诊断和质量保障功能,没有做到就事论事、对事不对人;另一方面忽视评估本身应有的工作改进和人员激励功能,没有做到人文关怀、见物也见人。很少有人去关心那冷冰冰的评估数据可能关系到学生的健康成长、教师的专业提高、校长的升迁和学校的未来发展。
(2)片面强调评估结果,忽视评估过程。是好是坏一评见分晓,不论你的起始条件与水平是怎样,不管你与其他学校有什么个性差异,也不问过程中的具体问题和情形,不问来龙去脉、前因后果,结果怎样,你就是怎样。似乎评估就是为了证明结果,哪怕这种结果对学校发展本身没有任何意义。
(3)片面强调学生的学业成绩,评估内容忽视学生全面素质和体现办学水平的其他因素。学生的学习目标被严重扭曲。学习成绩和升学率不恰当地成了事实上替代其他方面指标的主要的甚至是唯一的决定性的关键指标。而殊不知,升学率不仅不是判断学校发展的唯一依据,也不是主要依据,甚至不是重要依据,而只是体现学校发展的一个方面的带有印证性质的必要参照依据。学校发展不仅要看学生学业成就,还要有学生的全面素质要求,以及学校整体组织效率和教职员满意度等方面要求。
(4)片面强调外部评估的作用,忽视自我评估和自主参与。学校作为主要利益关系人没有能有效地参与评估的主要过程,往往被排斥在评估的舞台之外,处于一种任人摆布的地位。评估变成了一种涉及自身但自己却无法参与其中的、来自外部的、自上而下的活动。实质上,学校的地位更多地是由政府及教育部门规定的,甚至可以说是限定的,因为他们没有自主规划和主动发展的条件,评估有时只能使有些学校显得更加无助和失望。
(5)片面强调政府在外部评估中的主导作用,忽视社会参与在专业服务、公平公正、民主评估等方面的重要作用。
(6)片面强调教育评估的绩效改进功能,忽视其首要的质量保障功能。这就使教育追逐短期的利益而不是长远的利益和可持续的发展。
二、教育评估实践的认识误区
在我国的教育评估实践中,本土理论研究的稚嫩及不足与外部理论引进的良莠不齐及消化不良并存。同时,除了理论研究与评估实践之间存在严重脱节以外,在理论研究者和评估实践者中间都普遍存在着诸多的迷思、认识断层甚至误区。这里只列举比较普遍和突出的几个方面。
(一)变更考试科目与加大综合素质评价分量
是解决素质教育的关键吗
在教育评估发展的历史上,考试曾经是教育评估的代名词,在现代教育评估出现后,它的地位仍然重要。在我国当前的素质教育老大难问题中,“应试教育”的问题仍然是个核心问题。那么,纠正“应试教育”主要就是改革考试和学业评价制度吗?改革考试和学业评价制度主要就是变更考试科目与加大综合素质评价的分量吗?这样的改革能够解决素质教育问题吗?长期困扰素质教育全面推行的事实说明,要么在思想层面,要么在技术层面,要么同时在这两个方面还存在关键问题没有解决。
所谓“应试教育”的症结在于教育质量保障与改进的系统不健全,实现途径比较单一,评估目标扭曲教育目标。教育评估往往跟着学生的学业评估转,而学业评估主要依靠考试手段,“以考代评”现象比较普遍,其他管理性的评估措施也没能有效地弥补全面质量测评与监控体系的缺位,各种监督检查的实际效果有限,使片面追求升学率的倾向一直未能很好地得到纠正。而过分依赖考试在教育评估中的作用无疑是罪魁祸首。
当然,考试本身的甄别与诊断功能不是发挥得过了,而是远远还不够。应试教育带来素质缺失的问题是考试内容、考试的指导思想、考试结果的错误解读和片面使用造成的,而不是考试本身及其产生的以分数来标识的结果造成的。不能由于分数中找不到素质,看不到分数的诊断价值与教育意义,就忽视分数、否定考试,而是相反,应该通过真正的改革使考试能尽量测出素质并使考试的诊断功能充分地发挥出来。考试考不出素质,素质教育难以实现。
除了考试,开展学生综合素质评价也是十分重要的,综合素质评价如果处理得当可以有利于促进素质教育。但是加大综合素质教育评价的分量,提高其在升学中的作用,不能演变成“应评教育”。如果不恰当地将综合素质评价的结果作为升学的依据,那么其危害比一张试卷定终生更为可怕。
其实,即便是改革了考试和学生学业评价制度,对于落实素质教育来说也是远远不够的。不难看出,片面追求升学率的出发点其实并不是要更多的孩子升学,而是要通过更多学生的升学使教育工作者在针对教育的绩效问责中保持有利地位,起码能避免各种打击。莱利·E.弗雷哲和威廉·斯居雷希利在《教育的十大迷思》一书中质疑标准化考试总会提高学校的成绩,他们认为过分强调考试的作用会使学校追求短期效果。那种“为考试教”(Teaching to the tests)甚至是“教考试”(Teaching the test)是不可取的。考试“可以成为教师监测进展以改进其教学、课程,特别是改进其学生表现的一种方式。但考试项目如果被看作是对教师和学校的行政监视则意味着灾难”。当前,有些地方的领导甚至明确要求教育部门像抓GDP那样抓升学率,这是十分有害的。