国际阅读素养进步研究(Progress in International Reading Literacy Study, 简称PIRLS)是由国际教育成就评价协会(IEA)主持的国际上大规模的对学生的阅读素养进行评价的比较研究。PIRLS以四年级学生的阅读素养为评价核心,包括阅读成绩、阅读行为和阅读态度。第一次PIRLS评估在2001年举行,有35个国家参与;第二次评估在2006年举行,有45个教育系统参与;下一次评估将在2011年举办。本文将从PIRLS的启动背景、评价核心、评价程序等方面介绍。
一、PIRLS的启动背景
国际教育成就评价协会(IEA)成立于1958年,总部设在荷兰阿姆斯特丹,是世界各国与教育相关的政府部门、教育研究机构或大学的联合会,主要从事基础学科如数学、科学、阅读的学习成绩比较研究。IEA成立后的四十年里,间断性的从事和阅读相关的评价:1973年,由桑待克(Thorndike)等人主持IEA对数学、科学、阅读等六个学科在15个国家进行跨国比较研究;1991年,IEA在32个教育系统中评估学生的阅读能力。直到20世纪末,IEA开始启动PIRLS大型评估项目,来监测学生阅读水平的现状和发展趋势。
1998年,IEA全体会员大会(IEA General Assembly)讨论通过以评价阅读能力为核心的PIRLS项目和以评价数学、科学能力为核心的TIMSS项目一样,作为IEA的常规跨国比较研究项目。大会同时对PIRLS项目的发展达成了以下共识:
² PIRLS从2001年开始,评估对象为四年级(9-10岁)学生;
² PIRLS评估的重点是学生的阅读素养,同时也关注学生在学校和家庭的阅读环境;
² 阅读能力的评估必须以真实的阅读材料为基础;
² 试卷的设计必须具有连贯性,可以测试学生阅读素养的发展趋势;
² 调查问卷发放给被试学生、语文教师和小学校长,用来收集影响学生阅读水平的相关因素。
1999年,由IEA秘书处(IEA Secretariat)、位于波士顿学院的国际研究中心(International Study Center)、加拿大统计局(Statistics Canada)、英格兰和威尔士国家教育研究基金会(National Foundation for Educational Research in England and Wales)共同举行会议,会议决定在上述PIRLS基本评价原则的基础上增加向学生家长收集学生在家阅读活动的数据,向学校教师收集阅读教学方法的数据,来更好地评估学生的阅读成绩。
从1999年开始,IEA组织编写PIRLS的试卷,到最后一份调查问卷由各参与国协调员审核完毕,共两年的准备时间。2001年正式开始测试,共有30个国家参加了试卷和问卷的预试,35个国家参与正式测试。
二、 PIRLS的组织模式
作为一个大型国际比较评估项目,PIRLS的顺利运行是各职能机构共同推动的结果。各职能机构不定期的举行碰头会,确保评估顺利进行。
PIRLS 国际研究中心(PIRLS International Study Center)。该中心是PIRLS项目的核心机构,负责项目的设计、发展和实施——包括设计与改进测评工具和调查程序、保证数据收集的质量、分析和报告研究结果。PIRLS咨询委员会(PIRLS advisory committees)和参与国的代表也会协助国际研究中心开展上述工作。
教育协调员小组(National Research Coordinator,简称NMCs)。各参与国指定一名教育协调员,负责PIRLS国际评价在该国所有的工作。PIRLS国际研究中心每年组织若干次协调人碰头会,一方面确保PIRLS在各国的组织工作正常进行,同时培训协调员简答题的评分方法和数据管理软件的使用方法。
教育监察员小组(Quality Control Monitor, 简称QCMs)。由PIRLS 国际研究中心指定各国一名教育监察员,监察员可以招聘助手,形成监察员小组。教育监察员小组负责监督各国教育协调员的工作,保证PIRLS国际评价的顺利进行。
阅读发展小组(Reading Development Group)。该小组由各国教育专家组成,负责提供和专业知识相关的咨询,是PIRLS咨询委员会(PIRLS advisory committees)的重要组成部分。
IEA秘书处(IEA Secretariat)是PIRLS系列研究的总协调机构,它负责PIRLS预试和正式测试中所有的翻译校对工作。
国际专业机构负责PIRLS国际评价中的各种技术问题。加拿大统计局(Statistics Canada)负责涉及抽样的所有技术问题,包括和各国协调员的沟通,确保抽样既符合本国教育的实际情况也同时按照抽样的国际标准进行;英格兰和威尔士国家教育研究基金会(National Foundation for Educational Research in England and Wales)负责编制测试题目——收集题目的素材、确定题目和评分标准、组织评分员培训;IEA数据处理中心(IEA Data Processing Center)负责处理和校对从各参与国收集上来的数据,建立数据库;美国教育考试中心(Educational Testing Service)提供评分软件和技术支持。
三、PIRLS评价内容
1. PIRLS评价核心
阅读能力(reading literacy)是PIRLS评价的核心,PIRLS对阅读能力的界定统领和指导整个评价项目。对阅读能力的界定是选择评价工具、确定评分标准和分析评估结果的根本依据。阅读能力的概念最早在1991年的研究中被提出,之后不断发展和修正,最终在1999年由阅读发展小组拟定,由各国协调人会议多次修改之后最终确定。PIRLS国际评价对阅读能力的定义为:
理解和使用社会需要的或者个人认为有价值的书面语言形式的能力,儿童阅读者可以从各种文章中建构意义,他们通过阅读来进行学习、参与阅读者群体并进行娱乐。
从上文PIRLS对阅读能力的界定中,我们可以看到,该评价核心对PIRLS国际评价做出了如下规定:学生阅读的目的——为了学习,为文学体验或娱乐而阅读,为获取和使用信息而阅读;阅读过程,也就是建构文章意义的心智活动——关注并提取明确陈述的信息、做直接的推论、理解并整合观点和信息、检查和评价内容、语言和文本成分;影响阅读的因素,也就是可能影响学生阅读成就的具体情境——家庭、学校和社会。
2. 评价框架
一个宽泛的阅读能力的界定难以进行有效评价。根据PIRLS对阅读能力的界定,PIRLS提出了三个具有操作性的评价维度,用于指导测试工具的编制和评分标准的划定。PIRLS界定了阅读能力的三个评价维度是:
² 理解的过程
² 阅读的目的
² 阅读行为和态度
其中,理解的过程和阅读目的通过阅读测试的试卷来测评;阅读行为和态度通过调查问卷中的学生问卷来获取信息。在对阅读能力进行的纸笔测试中,理解过程和阅读目的是紧密结合在一起来考查的。(见表1)。
3. 测试工具——试卷
试卷是体现PIRLS评价内容的载体。由于PIRLS评价试图涵盖阅读能力的各个方面,同时避免给四年级学生太多的考试负担,因此,PIRLS评价的试卷设计相对复杂。
² 阅读材料
每张试卷都由阅读理解和与阅读理解相关的选择题、简答题组成。阅读理解文段的选择是阅读测试成功实施的基础。由PIRLS评价核心可以看到,儿童构建意义的方法因阅读目的和文段类型的不同而变化,某种阅读目的对应某种类型的文段。因此,PIRLS评价从阅读目的出发,来考虑阅读测试中所使用的阅读文段的类型。为文学体验或娱乐而阅读的文段主要包括小说、故事、传说等;为获取和使用信息而阅读的文段主要包括广告、说明书、网页等。所有的文段都来自于该国学生的教材当中,由各参与国提交并由PIRLS国际研究中心审核。
² 题目类型
选择题和简答题是阅读理解的两类题型。选择题有四个选项,只有一个正确选项,一个选择题1分;简答题不仅要求学生找出答案,而且要合理的组织语言,按照对文章理解的程度,一个简答题分值为1分、2分或者3分。每个题组,包含一篇阅读理解,11-14个题目,总计15分。PIRLS2001共八个题组98个题目,共133分(如表2)。如此大的考察范围足以涵盖阅读能力的各个方面。
² 题册设计
因为PIRLS阅读发展小组认为:每个学生至少应该被测试两篇阅读理解(每篇四个题目)才可以反应出其阅读能力,因此每个参与PIRLS测试的学生需要回答一个80分钟长的试题册,由两个40分钟长的题组组成。
题组根据两种阅读目的分为两类:文学体验的测试题组和信息的获取和使用的测试题组。两类题组共组成若干个题册。每个题册包含一个文学体验测试题组和一个语文知识测试题组。不同的年份题组组合成题册的方式略有不同。以2001年为例,文学体验的测试题组(命名为L1-L4),信息的获取和使用的测试题组(命名为I1-I4),两类题组共组成十个题册。大部分题组会出现在三个题册中,共九个题册;第十个题册是评分题册——用来作为分数划定的标准,和另外九个不同。它也由一个文学体验测试题组和一个信息获取和使用的测试题组组成,但是是彩色印刷,答题纸和试题不放在同一张纸上。所有在评分题册中出现的阅读理解不会出现在其它九个题册中。(见表3)。
4. 测试工具——问卷
PIRLS不仅考查学生现有的阅读水平,而且要分析影响学生现有阅读成绩的因素,这样就可以发现问题并了解和高阅读水平相关的影响因素。PIRLS系列评价的一个重要方面就是相关因素问卷的设计。根据调查对象的不同,相关因素问卷共分为:被试学生问卷、被试学生的家长问卷、教师问卷、校长问卷四类。
² 学生问卷
每一个参与PIRLS阅读测试的学生都要参与学生的背景问卷调查。调查问卷包括以下方面:家庭教育的经验(instructional experiences)、语文作业、自我认知、语文学习态度、阅读习惯、计算机使用、家庭文学资源和学生的基本信息。
² 家长问卷
家长问卷由被测试学生的家长或主要监护人完成,主要测试学生和家长的互动、家庭文学资源、父母的阅读习惯和阅读态度、家庭和学校的交流和家长的基本信息。
² 教师问卷
所有被抽中作为被试的四年级学生的语文老师都要参加语文教师调查问卷。调查问卷包括:班级基本情况(人数、学生的语文水平、学生的语言能力)、教学时间、教学中的促进学生语文能力提高的活动和语文教学的分级情况,还包括:教室的设备、评估实践、家长和学校的联系等问题。此外,教师的职业发展问题也包括在调查问卷中,如教师的专业发展机会、教师之间的合作、教师接受培训的情况等。
² 校长问卷
所有被抽中作为被试的四年级学生所在的学校校长要回答校长调查问卷。学校的招生情况、学校特征(地址、学校周边的资源、学生的社会背景)、语文教学特点、教学时间、学校资源(员工的工作效率和教学材料的实用性)、学校和家长的联系和学校的组织气候。
四、PIRLS评价的过程
作为IEA(国际教育成就协会)的常规评价项目,PIRLS评价和TIMSS系列评价在组织机构、评价过程和质量保证程序方面有着巨大的相似之处。本章将从PIRLS评价和TIMSS评价在评价过程中的相同处和不相同处来介绍PIRLS评价的评价过程。
1. 相同点
² 框架制定和试题编制
和TIMSS国际研究中心在TIMSS评价中所起的作用一样,PIRLS国际研究中心负责PIRLS评价框架的指定,在此过程中有多次和各国协调人的碰头会,并多次征求阅读评价小组的意见;评价工具的编制由阅读评价小组起草,各国协调人和质量控制专员修改,最后由PIRLS国际研究中心定稿。
² 测试日期
北半球的具体测试日期在五六月份,南半球的具体测试日期在十月、十一月。
² 数据收集
PIRLS评价的数据收集过程也是严格按照IEA的统一规定来收集。各参与国按照IEA的统一规定收集本国的数据。各国协调员按照《协调员手册》的要求统一管理该国的数据收集工作。PIRLS国际研究中心为数据的收集质量把关,并设置质量控制专员监督各国实施评价的过程。
² 数据处理
PIRLS评价的数据处理由位于汉堡的IEA数据处理中心负责。为了保证数据的高质量和可比性,PIRLS国际研究中心实施非常严格的质量控制项目。为保证数据的标准化,在数据进入之前,PIRLS国际研究中心向各国派发软件、使用手册并培训数据录入专员;在数据处理中心,所有数据经过反复检查,并不断修正误差。数据处理的过程也保证一国之内信息的一致性,尤其是学生试卷、学生问卷、教师问卷、家长问卷之间的一致性。
2. 异同点
PIRLS评价的核心是阅读能力,试卷的主体部分是两篇阅读理解。这和TIMSS系列评价中数学和科学的标准化评价略有不同。阅读理解文段准确无误的翻译就是PIRLS评价面临的一个较大的挑战,这是PIRLS评价和TIMSS系列评价略有区别的地方。
² 翻译
试卷和问卷最初由英语编写,由各参与国组织专家按照国际标准翻译为本国语言。为了保证翻译的准确性。各成员国翻译之后,由IEA组织专业翻译公司进行校对。校对共分为两次:第一次是在预试之前,第二次在大规模的收集数据之前。翻译公司第一次校对之后,PIRLS 国际研究中心会比较修改了的部分和原文哪个更合适,并最终决定是否进行修改。最终,学生测试之后,数据录入之前,如果某国学生在某个题目或者某几个题目上的得分普遍偏低,会再次核对翻译的准确性。
² 校对
简答题的评分有较多的主观性。为了防止参与国的评分员受自身经验的影响,PIRLS国际研究中心要求各国从试卷中抽取200份,由特定的评分员来评分。事实证明,参与国国内的评分一致性比率非常高,达到90%以上。PIRLS国际研究中心进行了另一个研究:请非英语母语并且可以熟练使用英语的记分员测评部分英语为母语国家的学生成绩,结果表明国与国之间的评分一致性达到85%。
PIRLS评价结束后,各国协调员小组和IEA数据处理中心、IEA国际研究中心反复校对数据。IEA数据处理中心和IEA国际研究中心会看各国的统计报告,对学生回答较差的题目有更多的关注。通常,学生回答较差的题目具有较好的心理测试特性