中国高等教育学会语文教育专业委小学语文教学法研究中心副秘书长管季超创办的公益服务教育专业网站 TEl:13971958105

教师之友网

 找回密码
 注册
搜索
查看: 97|回复: 0

周世科:国内外基础教育质量监测概览

[复制链接]
发表于 2013-12-9 21:54:19 | 显示全部楼层 |阅读模式
周世科:国内外基础教育质量监测概览


   国家已经走过三十多年改革开放历程,社会正在发生广泛而深刻的变革,同时,也面临着新的挑战。培养数以亿计的高素质的劳动者、数以千万计的专门人才和一大批拔尖创新人才的现实要求,从来没有像今天这样迫切地摆在我们面前。随着国家此前一系列基础教育重大工程的成功实施和农村义务教育经费保障机制改比革的顺利推进,我国的基础教育,特别是义务教较育进入到全面普及和巩固提高的新阶段。孩子“有学上”的问题基本解决后,家长和社会要求究 孩子“上好学”的问题日渐突出,这些都要求基础教育的工作重心要逐渐转移到提高质量上来。
要实现这一转变,国家就必须对基础教育的质量做到心中有数,而且,也只有对教育质量的状况进行监测并有全面的了解,才能有针对性地作出决策。我国教育线长、量大、面广,发展不平衡,我们现在常常由于缺乏很多基本数据,难以制订正确的政策来指导工作,因此迫切需要建立一个与教育决策、执行相协调的教育监管体系。同时,大量的实践证明,教育事业的改革与发展,只有决策和执行是不够的,对决策和执行情况必须严格监督,对教育发展水平和质量必须科学评估。
一、境外中小学教育质量监测的发展历程
世界各国历来都非常重视建立完善的基础教育质量监测体系,这其中又以美国、英国、加拿大、日本等发达国家更具代表,他们在标准化学业水平考试方面走过了较长的历程,积累了丰富的经验。
在美国,二十世纪六十年代,有关专家针对缺乏有关全国学生整体学业水平的评价,呼吁建立一个全国性的评估体系,多个团体和评估专家参与了评估模型的研发,并逐步推开了为调查基础教育阶段学生学业成绩的全国学力测试,这一测试项目被称为国家教育进展评估(National Assessment of Educational Progress,NAEP)。从1969年起,NAEP就阅读、数学、科学、写作、历史、地理等领域,对不同年级、类别的学生进行了周期性的评价,其中阅读和数学最受重视。NAEP有不同的评价类型,按不同的维度可以进行不同的分类:按评价的层级,可分为全国评价、州评价和区域评价;按时间维度,可分为长期趋势评价和短期评价;按针对性,可分为普通评价和特殊评价。不同的评价类型在目的、评价方法、题目、对象方面都相应有所不同。在NAEP的技术支持下,一些州也相应的建立了适合本州的评估体系。1994年,时任美国总统克林顿签署了《美国2000年教育目标法》,以立法的形式资助和鼓励各州建立自己的评价标准,用以衡量学生的学习进步情况。2001年,时任美国总统的布什提出了《不让一个孩子落伍》(No Child Left Behind)法案,明确要求所有的州每年都要通过学科考试来掌握学生的学业进展情况,并与全国考试的指标进行比较。
在英国,从19世纪末开始就实行了11岁测试,当时的目的是通过考试来实现教育标准的统一,并将考试结果作为学生进入初中的选拔标准。1997年10月,英国成立了资格与课程局(Qualifications and Curriculum Authority,简称QCA),负责制订国家课程和各种教育证书标准,组织统一的教学水平检测。QCA对一至二年级、三至六年级、七至九年级这三个义务教育“关键阶段”的学生进行评估,评估在三个阶段结束时进行,也就是二、六、九年级进行,共三次。评估由教师评估和考试两部分组成,教师评估的结果主要反馈给家长和学生本人,考试的结果在反馈家长和学生本人的同时,也是学校教育质量评估体系的一部分,主要包括学校效能、学业水平,学校提供的教育质量等方面,但核心是学生的学业成绩。就考试内容而言,二年级学生只需要接受阅读、写作和数学的教师评估,六年级和九年级学生则要参加这三个方面的国家考试,九年级学生另外还要接受历史、地理、外语、技术与设计、信息技术、艺术与设计、音乐、经济与公共事务等学科的形成性评价。
在加拿大,作为政治、经济、教育中心的安大略省多年来一直致力于学生学业成就水平的提升,并取得了明显的成效。从20世纪90年代开始,安省就设立了全省范围的学校学业成就指标项目(School Achievement Indicators Program,简称SAIP),规定对全省13岁-16岁学生的阅读、写作、科学和数学水平进行考试。随着学生学业成就评价的发展需要和公众的要求,安省于1996年成立了专业负责学生学业成就评价的组织——教育质量与问责办公室(Education Quality and Accountability Office,简称EQAO),负责开发基于标准的学生学业成就评价、报告中小学质量的效率、提供基于标准的学生学业成就的详细信息等。安省把阅读、写作和数学作为所有学习的基础,规定3年级、6年级、9年级三个关键年级的所有学生都必须接受读写能力和计算能力的考核。考核的内容以安省的课程标准为基础,在设计时注重教育学理解和测量学要求,清晰反映评价目的以及评价与课程标准的关系。
我们的邻国日本,从1956年起便开展了抽样学力调查考试,自1961年起开始实施针对若干年级的全国学力统考,其目的既是掌握全国的学力水平,同时也是使地方和学校找到各自在全国总体水平当中的相对位置,从而促进学校教育教学的改善。尽管这一考试由于各地区和各学校对名次的激烈争夺,遭到社会各界的批判和反对,从1965年起被中止,但从1976年开始,日本便逐渐恢复了抽样的学力调查考试。文部省围绕中小学学习指导要领,在全国开展了“教育课程实施状况调查”,以小学五、六年级和初中一至三年级为抽样对象,测验学生对国语、算数(数学)、理科、社会等科目的掌握情况。此外,还开展了考查某些特定能力(如作文水平、汉字水平、计算能力、实验观察能力及英语会话能力等)的“特定课题调查”,日本各都道府县也在近些年来开展了地区性的学力调查考试。2007年,日本恢复了停止43年之久的全国学力调查,并将其制度化,以后每年都将举行这一调查。全国学力调查包括两大部分,即学力考试部分和学习状况调查部分。前者是为检查学生对国语和算数(初中为数学)这两门基础科目的掌握情况而进行的学力统考,后者则是为了解学生的生活习惯及学习环境而进行的问卷调查。学力统考的对象是小学和初中的毕业班即小学六年级和初中三年级,因此它也可以看作是对学生在小学和初中基础科目上取得学业成就的一个阶段性检测。学力考试部分的命题以中小学学习指导要领对学生基础知识和技能的要求为基准,一方面参照文部科学省以往实施“教育课程实施状况调查”等国内学力考试的经验,考查学生对基础知识和技能的掌握情况,另一方面又参考PISA等国际学力考试的经验和出题方式,考察学生对知识的灵活应用能力。
其他国家(地区),如澳大利亚的教育质量评估由教育部或州(地区)的教育部门采用项目制委托澳大利亚教育研究委员会(Australian Council for Educational Research, ACER)进行。ACER从1999年开始每年评估三、五、七年级孩子的阅读与数学能力,并负责提供学校水平报告,向教师和家长提供反馈,并将有关结果提供给教育政策制定者。新西兰则由教育部委托Otago大学的教育评估研究单位进行。韩国是由政府资助的韩国课程和评价协会于1999年开始对基础教育质量进行评估,着重对六、九、十年级学生的韩语、数学、社会、科学和英语进行学习质量评估。德国为了使本国的教育系统与其他欧共体学校系统更为一致,制订了“国家教育标准”,成立了“国家教育评估机构”,负责定期发表“国家教育报告”。巴西的教育质量监测开展较早,巴西全国教育研究中心1995年就开始进行两年一次的全国基础教育考核,通过学生成绩和行为表现检测小学的教学质量。中国香港考试及评核局对小学三、六年级和中学三年级的中文、英文和数学方面能力进行评估。
二、国际组织进行教育质量监测的方式
目前,国际性的教育质量监测多以国际学生比较的形式开展,主要是经济合作与发展组织(Organization for Economic Co-operation and Development, OECD)的国际学生评价项目(Programme for International Student Assessment, PISA)和国际教育成就评价协会(International Association for the Evaluation of Educational Achievement, IEA)主持的国际数学和科学趋势研究(The Trends in International Mathematics and Science Study, TIMSS),虽然侧重的方面不同,但都极大地推动了参与国基础教育质量的改善和提高。
(一)PISA
1.PISA的目的
经济合作与发展组织(OECD)从1997年开始启动了PISA项目,旨在测量义务教育阶段末期15岁在校学生是如何为生活而做准备以迎接知识社会之挑战的。PISA项目评价的重点并不在于检验学生是否很好地掌握特殊的学校课程,而是评价学生是否具有有效地分析、推理与交流自己的思想观点及终身学习的能力。因此评估的结果没有及格与否的概念,只是体现学生能达到的水平以及评价年轻一代是否有能力应用知识与技能去面对真实生活的挑战。此外,该项目还收集学生的学习态度、学习策略、家庭背景以及学校因素等影响学生表现的背景信息。
2.测试学科与施测情况
PISA项目每三年举行一次,每次有一个主要测试领域并兼测其它领域。例如,2000年的主要测试领域为阅读素养,同时也测试数学素养和科学素养。2003年主要测试领域为数学素养,2006年则为科学素养,从2009年开始是第二个周期,主要测试领域又回到阅读素养。2009年共有65个国家与经济体的50多万名15岁学生接受了阅读、数学和科学三个测试项目的评估,中国上海、中国香港、中国台北、中国澳门、新加坡、韩国、日本等亚洲国家和地区参加了测试,都取得了非常好的成绩,尤其是首次参加该项目的中国上海,在阅读素养、数学素养和科学素养三项评价中均排在第一位。
3.组卷方式
PISA项目运用了当今非常先进的测量技术,其组卷方式就是最直接的体现。PISA项目通过运用套卷技术将数学、阅读、科学等评价领域的试题模块整合在一起实行组合测试,而不是将每个评价领域实行单独测试。以2003年为例,共有包含各评价领域的167道试题,这些试题被分为13个模块,其中数学主域7个模块,阅读、科学、问题解决等评价次域各2个模块。
13个模块的试题被轮换分配到不同组合的试卷当中,每套试卷含有4个模块,总共有13套试卷,参试学生被随机分配其中的一套试卷进行测试。例如,如果甲学生被随机分配第9套试卷,他要测试的内容就包括科学模块2、阅读模块1、问题解决模块1和数学模块5。每个模块代表30分钟测试时间,每个学生答题时间总共两小时。
4.产生的影响
PISA的评价结果产生了深远的影响。2000年的测试中,德国在阅读、数学和科学三项上都低于OECD的平均水平,2003年的结果虽然好点,但还是被芬兰、韩国、日本远远地甩在后面,这个结果刺激了德国社会各界检讨其教育政策。2003年,联邦教研部推出了“未来教育和关怀”工程,计划在2003年至2007年的五年内,投入40亿欧元将全德1/3的学校(1万所)由其传统的半日制学校改建为全日制学校,改善学校基础设施和教学条件,提高教学质量。德国政府也痛下决心改革过早分流的基础教育体制,并计划成立一个横跨各州的科学机构,依据同样的教育标准检查各州的教学质量。另外,通过PISA测试能发现一些国家在教育上存在的隐患,比如:日本通过测试发现学生可能每天花了很多时间读书,但是都在读学校指定读本与做功课,很少享受主动阅读课外书的乐趣,这种缺乏自发阅读兴趣的现象可能会导致日本学生成年后自我成长缓慢。中国上海在2009年的测试中发现,在阅读项目中非连续文本分量表与连续文本分量表成绩差异高达25分,在总成绩高于OECD平均值的参与国家和地区中,上海在两种文本形式分量表上的成绩差异是最大的,说明上海不同文本形式的课程内容分布可能不均衡。
(二)TIMSS
1.TIMSS的组织机构
TIMSS由国际教育成就评价协会(IEA)于1995年发起,至今已成为IEA自创办以来最成功的国际比较研究项目之一,也是当今世界参与国家最多、影响最广且最严格的国际比较教育研究。IEA在各参与国都指定了协调员和监察员。协调员除了为TIMSS在本国测试筹集资金以外,还要负责协调本国的测试时间表;审核测试题目,保证翻译可以在本国特定的文化背景下不会被误解;招募和培训数据录入人员,撰写本国的TIMSS系列研究报告等工作。监察员,也叫质量控制专员,测试之前接受IEA国际研究中心完整的培训,考核合格后担任该国的监察员,在TIMSS测试当天负责对本国测试学校的监督,测试结束后负责检查数据录入和翻译的准确性。
2.测试学科与施测范围
TIMSS主要测试四年级和八年级学生的数学与科学成绩,每四年开展一次,2011年,超过60个国家和地区(包括中国香港、中国台北、新加坡、韩国、日本)参加了TIMSS项目。测试的具体领域由数学、科学成就和影响因素两部分组成。和PISA相比,TIMSS跟学校课程的联系更为密切,数学和科学成就主要考查样本学校四年级和八年级学生对基本概念的掌握程度和推理应用情况。影响因素包括学生的学习态度、兴趣、学习习惯、学习风格等对学业成就有影响的相关因素,用来更好地理解学生的学习行为。影响因素通过调查问卷获取信息。调查问卷共分为学生问卷、教师问卷、课程问卷和学校问卷。
TIMSS项目规定,所有被试的学生必须是正规公立学校的学生,私立学校和职业学校的学生不参与该研究。由于各参与国入学年龄不同,各国学制有所差异,为了保证接受测试的学生年龄差别不会太大,TIMSS系列研究质量保障规定:被测试的四年级学生的平均年龄不得低于9.5岁,八年级学生平均年龄不得低于13.5岁。在抽样方法上,TIMSS采用二阶段整群抽样的方法对学生进行抽样,第一阶段抽取样本学校,第二阶段从样本学校目标年级中抽取班级。一般来讲,一个国家大概有150所学校会被抽中。同时,被抽中的学校和学生在正式测试中的参与率至少要达到85%,否则该学校或班级的测试结果无效。
3.组卷方式
与PISA一样,TIMSS组卷同样采用多个题本。以2007年为例,四年级学生数学共有179道题目,科学有174道题;八年级学生数学有125道题,科学有214道题目。每个年级共分成14个题本(数学和科学各七个),题本试题类型为选择题和解答题。
4.产生的影响
TIMSS系列研究的评价结果不仅受到各国教育决策者和研究者的高度重视,在一些国家还掀起了教育改革的浪潮,同时其研究结果也在一定程度上颠覆了部分关于教育的传统观念。2006年1月,美国教育部公布了《回应变革世界之挑战——为21世纪而加强教育》的报告,在开篇即指出美国四年级和八年级的学生在2003年的TIMSS中,仅有7%的学生获得了“高级”水平,而新加坡四年级的学生有38%达到了高级水平,八年级学生达到高级水平的有44%。由此可见TIMSS系列研究的结果对美国联邦政府教育决策者的影响力。另外,TIMSS的结果也启发了人们深入思考和教育相关的很多方面,比如教育投入和产出之间的关系并不是简单的正相关,美国学生享受到的教育投资费用比韩国学生多了两倍,可是在考试中却被韩国学生击败;在课程上所花的时间和这门功课上取得的成绩也没有必然的联系;“小班化”教育模式的国家,其学生学习成绩远不如东亚国家“大班化”教育模式培养的学生。
三、国内质量监测进展情况
众多国家和国际组织的实践已经证明,建立国家教育质量监测体系是教育质量保障的重要举措。由于底子薄和教育体制等诸多原因,我国的基础教育质量监测工作还处于起步阶段,与上述国家和国际组织还存在着非常大的差距,但值得庆幸的是,我国的国家义务教育质量监测已经成为国家层面议事日程的一部分。在国务院批转的教育部《2003-2007年教育振兴行动计划》中,明确提出要深化基础教育课程改革,建立国家和省两级新课程的跟踪、监测、评估、反馈机制,加强对基础教育质量的监测;《国家中长期教育改革和发展规划纲要(2010-2020年)》中明确把提高教育质量作为教育改革发展的核心任务,并多次强调与“教育质量的监测和评价”相关的内容。随着国家层面对教育质量的保障越来越重视,实践层面的行动也在逐步开展,国家层面和省级层面的基础教育质量监测工作正在有条不紊地进行着。
2003年,在教育部基础教育课程教材发展中心的组织下,成立了“建立中小学生学业质量分析、反馈与指导系统”项目组(简称“项目组”)。项目组以国家颁布的课程标准为依据,主要通过纸笔测验考察学生学科学习结果,在基本知识和基本技能的基础上关注与学生未来发展关系密切的核心素养,同时通过学生、教师和校长问卷了解与学生学习相关的背景因素。项目组成立后没有马上着手于测试,而是开展了有关学生学业质量分析与指导的基础研究,包括现状分析、比较研究、选题论证等。基础研究完成后,2004年12月10日,项目组在大连和浦东组织了有2万名中小学生参与的试测,通过这次试测,项目组在命题、数据收集与分析、测评工作的协调组织等各个环节获得了宝贵的经验。从2005年开始,项目组先后对上海、江苏、甘肃等6个省市和近20个地市进行了学业质量测试,共有约335万人次的学生参加了学科测试和问卷调查,约15万名教师和1.2万名校长参加了问卷调查。随着质量监测各项工作的不断完善,项目组在2009年对全国所有省份进行抽样,建立了三年级和八年级学业质量状况的全国常模,使得各测试地区监测的结果更具有针对性和可比性。项目组每年组织测试一次,测试的时间一般在每年的10月份,测试年级为四年级和九年级,测试的内容为三年级的语文和数学,八年级的语文、数学、英语和科学。
2007年11月30日,“教育部基础教育质量监测中心”(简称“中心”)挂牌成立,中心是在教育部直接领导下,依托北京师范大学而建立的专业机构。中心的职责包括拟定基础教育质量监测标准;研究开发基础教育质量监测工具;受教育部委托具体实施全国基础教育质量监测工作;指导各地开展基础教育质量监测工作,推动全国基础教育质量监测网络的逐步建立。中心目前监测的主要内容包括学生的思想品德和公民素养;学生的身体和心理健康水平;学生的学业水平和学习素养;学生的艺术素养;学生的实践能力和创新意识;影响学生发展的教育环境和社会环境6个部分。2007年12月,中心在湖北、浙江和陕西三省进行试点监测,2008年9月,在上海、山东、河南等八省市进行了首次监测,随后每年开展一次,至今为止已开展了四次。四次监测中,全国已有27个省(直辖市)参加测试,共有约18万学生、3.3万教师和0.5万校长参加了学科测试和相应的问卷调查。
省级层面,2006年,江苏省教育厅与教育部基础教育课程教材发展中心达成协议,加入“建立中小学生学业质量分析、反馈与指导系统”项目,并约定每两年测试一次。为了能全面掌握江苏省基础教育的质量状况,项目从一开始便覆盖了全省所有的区县,形成了省、市、区县三级学生学业质量分析报告。2006年10月,全省共有59829名四年级学生、53413名九年级学生参加了学科测试和问卷调查,2万多名参测学校校长和教师(四年级所有语文、数学教师,九年级所有语文、数学、英语和科学教师)参加了问卷调查。为了能进一步加大监测工作的推进力度,2008年3月,江苏省基础教育质量监测中心在江苏省教育科学研究院正式挂牌成立,这是在全国范围内成立的首个省级基础教育质量监测机构,表明江苏在全国率先把质量监测工作纳入基础教育改革发展的整体布局。按照约定,江苏省在2008年和2010年继续参加了学业质量测试,测试规模也在不断增大,以2010年为例,全省共设有2109个考点,参加测试的学生人数近20万。为了能充分的利用学业质量测试结果,江苏省基础教育质量监测中心办公室(简称“中心办公室”)与无锡市锡山区教育局和淮安市洪泽县教育局建立了“基于测试分析提升区域义务教育质量”合作项目,争取在两到三年时间里,在区域、学校、学科三个层面,推进锡山区和洪泽县小学、初中的教育教学改革,建立新型教学及管理制度,促进队伍发展,改进课程教学现状,区域化提升义务教育整体水平和质量。另外,中心办公室将加强国内外质量监测模式的比较研究,与加拿大安大略省、美国俄亥俄州等同类机构进行交流沟通,着手研制全省区域性质量标准的体系框架。区域质量标准体系的实施,是一项创新性工程,将进一步促进江苏省基础教育质量监测工作走在全国前列。
上海市从2004年起便参加了“建立中小学生学业质量分析、反馈与指导系统”项目,并连续8年参加了测试,初步建立了上海中小学生学业质量的数据库。为了全面实施素质教育,提高基础教育质量,2009年9月,“上海市教育委员会基础教育质量监测中心”正式成立,挂靠在上海市教研室,作为上海市教研室的一个下设机构。2011年9月,教育部基础教育课程教材发展中心和上海市教育委员会合作,在全国率先建立了“中小学生学业质量绿色指标”评价体系。该体系以关注学生健康成长为核心价值追求,分为学生学业水平指数、学生学习动力指数、学生学业负担指数、师生关系指数、教师教学方式指数、校长课程领导力指数、学生社会经济背景与学业成绩的关系指数、学生品德行为指数、身心健康指数以及上述各项指标的跨年度进步指数。
重庆市在2009年成立了重庆市基础教育质量监测中心,与重庆市教育评估院合署办公,并在2010年9月开展了省级基础教育质量监测实践,组织了近6000余名监测工作人员,随机抽取40个区县近700所中小学、5万余人次中小学生、4000余名数学教师、班主任和近700名校长进行质量监测。监测的对象为四年级和八年级学生,监测的内容为数学、心理健康和影响学生学习数学的因素。
北京教育科学研究院基础教育教学研究中心在2003年便开始承担北京市义务教育教学质量监控与评价项目。九年来,基教研中心已经对五年级和八年级13门学科进行了监测。为了能更好地开展这项工作,2011年9月16日,“北京市教育督导与教育质量评价研究中心”(简称“中心”)正式挂牌成立。中心设在北京教育科学研究院,由办公室、督导及评价理论研究室、工具研发及组织实施室、信息与数据处理中心四个部门组成,主要职责是根据市政府教育督导室的督导规划和工作安排,开展对全市各级各类教育的督导服务与质量监测评价工作,全面把握教育质量发展状况,科学诊断教育质量问题,深入剖析教育质量问题成因,为教育行政部门和教育督导部门提供决策依据。
另外,甘肃等省份也在省级层面建立了基础教育质量监测机构,杭州市下城区、江苏省如皋市等区县级层面的基础教育质量监测机构也在全国各地不断地建立,全国范围内的基础教育质量监测系统正在逐步形成。
四、总结与展望
教育质量直接关系到国民素质,也是我国沉重的人口负担转化为丰富的人力资源优势的关键所在,而处于整个国民教育体系基础地位的义务教育的质量是教育的生命线,必须得到充分的保障。[18]尽管近年来,国家级层面和部分省级层面都纷纷建立起了基础教育质量监测机构,也取得了一定的成绩,但由于我国的质量监测工作起步晚,无论在理论层面还是在实践层面,与有着几十年监测历史的西方发达国家尚有较大的差距。要缩小与发达国家的差距,教育行政部门和学校管理者应当肩负起责任。教育行政部门必须加强对基础教育质量监测工作的保障;鼓励有资质的中介机构进入,建立起高效的教育评价机构。学校管理者和学科教师必须转换原有的评价思想,树立正确的质量观,充分认识质量监测的目标导向作用。
基础教育质量监测工作是一项工程浩大而政策性很强的任务,作为从事基础教育质量监测工作的一员,迫切地希望各级教育行政部门、教研部门和中小学校要群策群力,积极争取外部专业支持,尽快完善和健全区域性的基础教育学业质量监测制度和运行机制,不断提高我国基础教育的教学质量,为基础教育改革发展和现代化建设服务。







您需要登录后才可以回帖 登录 | 注册

本版积分规则


QQ|联系我们|手机版|Archiver|教师之友网 ( [沪ICP备13022119号]

GMT+8, 2024-3-29 09:48 , Processed in 0.182850 second(s), 26 queries .

Powered by Discuz! X3.1 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表