中国高等教育学会语文教育专业委小学语文教学法研究中心副秘书长管季超创办的公益服务教育专业网站 TEl:13971958105

教师之友网

 找回密码
 注册
搜索
查看: 125|回复: 0
打印 上一主题 下一主题

教育质量标准体系中学生语文能力等级描述的研制策略

[复制链接]
跳转到指定楼层
1#
发表于 2014-6-6 09:57:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
教育质量标准体系中学生语文能力等级描述的研制策略
作者:祝新华


摘要:学生语文表现的等级描述是教育质量标准研制中的重要课题。语文等级描述的研制要发挥包括促进学生学习的多种功能,内容要聚焦于语文能力,表述要准确而正面,研制要加强实际验证。

关键词:语文能力;等级描述;研制策略;促进学习的评估

语文等级描述揭示学生不同水平的语文能力的典型特征。我国对于语文等级描述的作用未有足够的认识,而且研制过程过于简化,描述本身存在不少问题。本文结合国内外等级描述发展的经验和不足,阐述具国际视野,体现课程目标、学生真实能力,易于理解与运用的中小学语文学业评价等级描述的研发策略。

一、功能:明确发挥多种重要的功能

考试成绩一般通过分数或等级两种形式报告。一些具影响力的公开考试,如香港的会考(2007年前)、内地的高考、中考等,都只提供原始分或标准分,招生部门或雇主仅能得知各考生在全体考生中的相对等第,无法了解其实际语文水平。没有适当的评价标准与过多采用常模参照评价是互为因果的。发展高质量的等级描述,宜重视发挥等级描述的多方面作用。

(一)为实施标准参照评价创设条件,有效监察不同年份学生的水平

评价标准是解释评价结果、展现学生水平的基本工具,它使学生、教师、家长、高校与雇主获得更丰富的信息,透彻了解获得各等级成绩学生的语文知识和能力水平。以香港为例,几十年来一直使用常模参照的评定方法。为了配合课程改革,香港中学会考发展等级描述,于2007年开始实施标准参照评价。首先由资深阅卷员、教师和学科专家组成的小组讨论决定各等级之间的分数切割点,然后据此划分等级。改进后的评价把各等级模糊的规定转为清晰的要求。解释评价结果时,把学生的表现与预先制订的等级描述比较,学生个人的等级不会受其他人表现高低影响。等级描述不仅可更好地展示考生真正的听说读写能力,而且由于相同的等级不会因不同年份学生的总体程度差异而有明显不同的意义,因此,有助于有效监察不同年份学生的水平变化。

(二)为教学提供预期成果,有效推行促进学习的评价

促进学习的评价是当前世界评价领域的重要发展方向,制订清楚的评价标准是促进学习的评价的重要特征之一。合适的评价标准是我们了解学生目前在哪儿、需要到哪儿的基础。评价标准既可让教师了解学生的程度,为学生提供适当的反馈,又可让学生清楚自己的预期成果,知悉强弱,向期望目标进发。

(三)为规划与发展评价工具奠定良好的基础,进一步提升评价的质量

国际上一些高质量的等级描述,具有带动发展相关等级描述、评价工具的作用。欧洲语言共同参考框架——学习、教学、测试( CEFR)是这方面的典型成功案例。根据CEFR,欧洲语言测试协会发展“能做到描述”的等级描述,以描述第二语言学习者在学习过程中能做什么;欧洲多个高等教育机构共同研发了语言诊断系统,以诊断学习者的语言能力水平并给出反馈建议;测试研发机构发展评核语文程度高低不一的考试,如剑桥ESOI,考试中心的英语技能证书考试( CELS)、英语五级证书考试(MSE)、商务英语证书考试( BEC)、国际英语测试(IELTS)等都参照CEFR确定等级描述。国际知名的国际学生评估项目( PISA)阅读框架设计,也受到了CEFR的许多启发。我国“国际汉语能力标准”也借鉴CEFR对汉语能力进行分层次、分技能、分等级的多方面描述,以适应对外汉语教学和测试等的需要。新汉语水平考试( HSK)等级要求也与CEFR等级挂钩。

二、内容:聚焦于语文能力

语文学习的内容十分广泛,在强调真实性、综合性、能力导向评价的背景下,我们要重视描述完成具体任务的真正能力,并体现学习或未来工作的需要。

第一,偏重语法、语音、词汇、句子等语言单位。由于受结构主义语言学、标准化考试理念等影响,未重视语言交际功能方面的表现。如普通话水平测试(PSC) -级甲等(最高等级)的描述是“朗读和自由交谈时,语音标准,词语、语法正确无误,语调自然,表达流畅。测试总失分率在3%以内”;三级乙等(最低等级)是“朗读和自由交谈时,声韵母发音失误多,方音特征突出。方言语调明显。词语、语法失误较多。外地人听其谈话有听不懂的情况。测试总失分率在40%以内”。其标准主要从语音、词汇、语法、语调等方面描述。在这方面,要重视学生双向或多向的口语互动,展现表达的语言意义,实际交流的整体效果。

第二,对认知能力的描述较为笼统。我国语文标准一般都会提及具有读写听说(特别是读写)能力,但对其特征缺少必要说明。如新HSK六级(最高等级)描述“可以轻松地理解听到或读到的汉语信息”,一级(最低等级)描述“可以理解并使用一些非常简单的汉语词语和句子”;当中“理解”一词意义较为广泛,从标准本身看不出是指客观、浅层的解释,还是个性化、深层的推理,而确实很多学生在这两方面的程度差异很大。

(一)核心的语文认知能力因素

在正式草拟标准前,我们要研究文献、组织语文测试或开展课堂观察,找出听说读写认知能力的核心因素。以下是相关探索结果:(1)口语互动能力包括确保理解、深化观点、推进过程;(2)阅读能力包括复述、解释、重整、伸展、评鉴、创意;(3)综合能力包括语境意识、整合数据、观点与论证、表达与组织;(4)普通话能力包括辨别语音、记取细节、转换信息、概括语义、推理意义、品评观点、形成观点。评价标准如体现此类能力核心因素,标准使用者就容易理解能力的程度差异。

以阅读为例,国际上一些评价框架和等级描述都很重视认知能力。如PISA将阅读能力分为进入与提取、整合与阐释、反思与评价三项,且直接用于等级描述;美国国家教育进展评价( NAEP)把阅读能力分为寻找/回忆、整合/阐释、批判/评价三个维度,其等级描述也包含这些因素。

我国推出的汉语能力测试( HNC)四至六级的阅读和写作能力等级描述较重视对能力的描写。如六级(最高等级)提出:“能赏析文学作品,抓住不同类型文学作品的特点和要素进行评论……能综合给定的若干材料,分析相关问题,并使用这些话题的常用专门词语参与讨论交流……准确严谨地论述自己的见解、观点,表明自己的态度、立场。”上述标准中,提出赏析、评论、综合、分析等因素,这是一个很大的进步。然而,这些能力在较低的一至三级并未见具体描述。此外,该标准对于聆听、说话仍以界定语言任务为主,认知特点相对较弱。

(二)综合性语文能力

语文是一种综合性活动,在生活与工作中很多时候是同时运用听说读写(两种或以上)来完成任务的。国际现行的评价标准专设口语互动交际(听与说)、书面互动交际(读与写)等活动。如CEFR提出互动型活动与策略,且细分为口语互动、书面互动、面对面互动、人机互动交际、互动策略等。

(三)运用语言策略的能力

灵活运用语言方法解决实际语言问题是语文能力的重要因素。这方面,国外评价的实践可作参考,如PISA阅读等级描述中“反思与评价”一项,五等(最高等级)描述为“借助特定的知识进行评价及假设;通过深刻理解复杂的长文来处理与预想相反的概念”;一等(最低等级)描述“将文本中的信息同外在知识相联系;从个人经验或者态度去解释文内信息”,其中体现了阅读策略。CEFR更专门提出语言策略标准(包括产出、接收、互动和转译策略),对接收策略中的“辨识线索与推断”元素曾作描述,如Cl(次高等级,无最高等级)“能熟练地利用语境、语法和词汇线索,以推断接下来的态度、情绪、意图和期待”;B2“能用多种策略以达到理解的目的,包括聆听重点、利用语境线索检查理解是否正确”等,以上描述也与阅读策略直接相关。

从培养与评价学生的阅读能力着想,以下阅读策略至关重要:(1)选取关键词、主题句等;(2)缀写意思连贯的语段;(3)概括特定的信息、段意或篇章主要内容;(4)推断词义、句子的比喻意、象征意等;

(5)预测后面的内容;(6)联系已有知识与经验;(7)分析篇章结构;(8)监控理解过程。制订阅读等级描述时,我们可考虑引入这些阅读策略。

(四)重要实际情境中体现的语文能力

在不同领域使用语言,往往有特定术语、表达习惯等。为了突出语文的实际功能或实际运用能力,等级描述要重视语文的使用场所。CEFR认为语言的学习与测试应区分不同的情境,重视不同情境中的能力表现。PISA2009阅读评估重视个人目的、公共目的、工作目的、教育目的四个场景下的阅读,评价标准的设计照顾了这四种场景中的能力表现。类似的,美国NAEP2011写作评价设计围绕说服、解释、表达这三个交际目的任务场景。它们都体现了特定情境中的语言能力。

我国的语文评价在很长一段时间里不够重视语言情境。如崔迪分析HSK聆听部分发现,几乎没有学校场景,商务情景也罕见,未能很好体现来华留学或从事商务工作人员的生活情境。目前,我国已开始关注语言运用的情境。如HNC等级描述中有关情境的限定:六级(最高等级)“能听懂、读懂自然科学和人文社会科学的一般性材料(刊载于非学术媒体……)”;一级(最低等级)

“在家庭、邻里等较小社交圈内……口头交流”。中小学的语文学业评价标准制订也要重视借鉴交际性、任务型、功能语法等语言学理论,体现真实性、综合性、能力导向等评价理念,并引导学生恰当地学习,有的放矢地锻炼,进一步提高语文水平。

三、表述:重在真实而正面的描述

评价标准要真正区分不同等级的语文知识与能力殊为不易。当未充分考虑研究方法,或研究时间紧迫时,往往会出现如下情况。

第一,修饰式描述偏多。依靠个人经验判断,使用“基本”“尚可”“大致”“还算”等修饰词显示差异。这种区分的相对性过强,等级间的程度差别不清。公允地讲,等级描述不能完全排除修饰式描述,原因有二:(1)学生的语文能力是从低到高递进发展,其变化难作“有”或“无”的区分;(2).缺乏研究基础时,抓不住中间等级表现特征,描述既不敢放弃未具备的表现,也未能找出并充分肯定其中一些已具备的具体能力。然而,过多使用修饰式描述的评价标准,使人们不能一致地理解。

第二,否定式描述偏多。对于程度最低的一两个等级,如未能使用修饰词语区分学生的差异时,有的标准会改为学生不知道什么、不能做什么的负面描述。如PSC三级乙等(最低等级)标准“朗读和自由交谈时,声韵母发音失误多,方音特征突出。方言语调明显。词语、语法失误较多。外地人听其谈话有听不懂的情况。测试总失分率在40%以内”;其中的否定语句不便于揭示学生已学到了什么、激发或保持学习动机。作为语言水平测试的等级描述,描述的不应该是学生犯错的地方。

针对以上情况,我们提出等级间的差异应该是:(1)真实的:展现典型、易把握的表现,标准主体的用语相对性不能过强,否则会成为虚假描述;(2)正面的:展现学生知道什么、能做什么,而不是不知道什么、不能做什么。为达到这目标,要多从以下几方面考虑。

(一)重视学生具有的表现与出现这一表现的条件之间的关系

根据对国外及我国香港的等级描述的分析,以下两种做法较为有效,也是我国相关的研究所忽视的。

第一,描述在相同条件下不同等级的表现。

1.能处理什么。重视质的变化,区分“有”与“无”某种能力表现。如香港中学会考阅读等级描述,第二等较第一等多了“理解篇章大意”(重整);第三等较第二等多了“初步领悟语句隐含意义、篇章主旨、作者意图等深层意思”(伸展)。高一级较低一级多出来的能力表现,是两个等级之间质的区别,可称为“能力典型特征”。

2.能处理到什么程度。对于用修饰词描述,不同等级间应有一些绝对性的意义差异。如香港会考中文整体等级描述中有关评价和拓展的描述为,五等(最高等级)“对作品内容及技巧评价鉴赏中肯允当,见解成熟、感受深切,并能深入拓展”;四等“评论言而有据,并能适当拓展”;三等“能作简单评论及推论”;二等“作粗略评说”;一等(最低等级)没有相关描述。以上描述尝试从评价、拓展的详略、适当性、深度等角度,展示学生程度级级递减的关系,尽力让用户清楚等级差别。这些也仅属初步探索,有待在积累经验、长期了解学生的表现中不断改进。

第二,描述不同等级出现同类表现的条件。

当两个相邻等级的水平差异很小时,可考虑指出不同的情境(如熟悉的与不熟悉的)来显示区别,这可避免出现过多修饰性描述。此外,对于较低等级,不易说明学生在正常的环境中能做什么时,我们也可以指出在特定环境下学生的正面表现,说明他们在简单、熟悉的情境下能做到什么,以免出现过多的否定式描述。

1.不同难度的文体。如CEFR等级描述对“能理解”内容的界定:C2(最高等级)“几乎所有听到或读到的内容”;Cl“多种有要求的、较长的文本”;B2“复杂文本(具体和抽象主题)”。在这方面,我国HNC等级描述也有类似表述,如对于“能听懂、读懂”内容的界定:六级(最高等级)“自然科学和人文社会科学的一般性材料”,一级(最低等级)“反映日常生活中具体的人、事、物的语言材料”。

2.不同熟悉程度和主题。如CEFR等级描述对“能理解”内容的描述:Bl“对于在工作、学校和休闲时常遇到的熟悉事物”;A2“与自己最直接相关范畴(如基本个人和家庭信息、购物、当地地理和就业)的句子”。

3.不同复杂程度的语境。语境指语言环境条件,它可根据以下情况来界定:(1)正式/专业与日常生活场景,如CEFR等级Bl“在目标语言地区旅游时,能处理大部分可能出现的情况”,Cl“能针对社交、学术及专业目的,灵活、有效地使用语言”,A2“能在简单的日常任务中交流”;(2)正常与特别场景,如CEFR等级Bl“如果输入是清晰、标准的,能理解要点”,Al(最低等级)“当对方讲话缓慢且清晰,并随时准备提供帮助的情况下,能与对方进行简单的互动”。

(二)使用不同方式表述

在确定评价标准的焦点、区别等级差异的方法后,我们还要重视等级描述构成及语言表达特点,确保可传达等级之间的实质性区分,确保使用者能真切理解。

第一,语言。语言描述界定各个等级的要求,是标准的核心部分。为便于不同类型的用家的理解与使用,有关语文的等级描述要具有以下的特点。

1.清晰。清楚说明,避免模糊。如对“能够运用系列方法”这一描述,我们并不清楚“方法”指什么,“系列”指多少种方法,此时有必要加以说明或给出实例。对于能力描述,尽可能稳定使用一些行为动词。描述阅读能力的常用动词和内容重点有:(1)复述:指出何时、何地、何人、当时如何、表现怎样等;(2)解释:用自己的话说说意思、解释意思等;(3)重整:概述、概括、简单说明、比较、对比、分类、列提纲、图示、区分、分辨等;(4)伸展:论证、推导、揭示、想象、预测、推论、含义、实际意思、说明了道理等;(5)评鉴:评价、批判、证实、是否同意、认为如何、为什么等;

(6)创意:有什么不同方法、更有效的方法、不同的观点、不同的材料。

为使描述更具体,可尽量加入一些量化的信息,如在普通话等级描述中说明考生对不同话语内容能掌握的词语范围、能应付的聆听材料的语速,以及不同项目的得分率等。

2.简明。调查表明,评分者和教师倾向使用表述简洁的描述用语,为此要避免使用复杂的句子或冗长的表述。内容表述不要重叠,如HNC -级(最低等级)描述“能在家庭、邻里等较小社交圈内,就衣食住行、家庭生活及个人日常活动方面的话题开展口头交流”,其中有的描述内容交叉,可考虑简化。另外,由于标准有不同类型的使用者,如学生、家长、雇主等,用语要通俗,避用艰深的术语、行话。如PSC等级描述有平翘舌音、前后鼻尾音、边鼻音、浊塞音和浊塞擦音、介音、复韵母单音化等术语,会令一些使用者感到陌生、难懂。

3.-致。原则上各等级描述项目及其次序宜相同,如最高等级的描述项目依次为听说普通话、理解、口语表达、书面表达,那么其他等级的描述项目及次序也应如此,除非某些项目在某些等级并无正面表现。

描述又要突出各等级的特点。以阅读认知能力“复述、解释、重整、伸展、评鉴、创意”为例,等级描述要注意:第一,各等级应对这些认知能力从低到高层级依次考虑;第二,重点描述重整及以上的高级能力;第三,较高等级描述可把复述、解释并入重整一起描述,以突出所具备的高层级能力;第四,较低等级描述可不描述不具备的高层级能力。

表达相同意思的用语,在不同等级应有基本的一致性。如HNC等级描述说话能力的用语有:六级“参与讨论交流”(最高等级);五级“说出对相关问题的思考和见解”;四级“发表简单的评论”;三级“发表意见……进行口头讨论和沟通”;二级“开展口头交流……叙述事情经过”;一级(最低等级)“开展口头交流”。又如,新HSK标准也有可进一步讨论之处。

六级(最高等级)“可以轻松地理解听到或读到的汉语信息,以口头或书面的形式用汉语流利地表达自己的见解”,提到以书面形式流利地表达,于第五级中只字未提,这方面的表现消失得太快。

五级“可以阅读汉语报刊杂志,欣赏汉语影视节目,用汉语进行较为完整的演讲”,特别提到阅读、欣赏的对象及沟通的形式(演讲),其他等级则无提及。

四级“可以用汉语就较广泛领域的话题进行谈论,比较流利地与以汉语为母语者进行交流”,特别提出“话题”的要求,亦见于第二级,其他等级则无提及。

三级“可以用汉语完成生活、学习、工作等方面的基本交际任务,在中国旅游时,可应对遇到的大部分交际任务”,特别提出生活、学习、工作的领域,其他等级则基本无提及。

二级“可以用汉语就熟悉的日常话题进行简单而直接的交流,达到初级汉语优等水平”,情况同第四级。

一级(最低等级)“可以理解并使用一些非常简单的汉语词语和句子,满足具体的交际需求,具备进一步学习汉语的能力”,本级无特别之处。

上述各等级的描述维度不尽相同,概念有抽象与具体之别,使用者不易快速感知与理解。就上下等级而言,下一个等级如不具备上一等级的表现,当然可不描述;如仍有相应的表现,只是程度稍弱,则仍须描述。

第二,显证。显证指学生达到某等级的典型证据,如列出几个重要的表现、能完成的重要任务。CANdo以下描述分别用了这两种做法:五等(最高等级)“能处理在学术上或认知上有要求的数据,运用语言效果良好,某些方面的表现水平可能比一般母语者更高”,显证则为“能浏览文本,以找出相关信息,并抓住文本的主要思想,阅读速度几乎像母语者一样快”;一等(最低等级)“具备以简单方式交流和交换信息的基本能力”,显证为“能对菜单提出简单的问题,并理解简单的回答”。一般来说,等级越低例子越具体,因为要把学生少数能做的事情列出。

第三,示例。对相同的文字描述,人们往往会有不同的理解,如对于作文“内容具体”,十个人可能会给出十种不同的说法。因此,等级描述还要加上示例补充。示例也称作品实例,指学生完成任务的典型样本及相应的说明。对于不易理解的认知能力更要重视给出这样的示例。

示例最好基于研究测试选出,以保证有典型表现。提供好的学生示例可为学生确立更清楚的预期目标。

四、研制:加强实际验证

等级描述的研制方法可分为自上而下式和自下而上式两种。自下而上式是根据课程目标设计教材,组织教学实验,通过观察、分析学生学习知识、技能的活动,判断学生能做的真实事情,从而起草标准。我国等级描述多为自上而下式草拟,即多由资深教师、学科专家结合文献、课程目标,根据其专业判断形成。其典型的操作有二:一是降低要求,如从现有成人词表选出高频词,然后根据研制者对儿童用词的专业调整即成儿童口语词汇标准;参考母语学习者标准,根据研制者已有的对非华裔学生学习情况的认识降低要求而成非华裔学习者标准。这种未作长期实地调查发展起来的标准,很可能不易反映目标对象的实际情况。二是整合目标,直接从较精要的、假设性的课程目标整合而成,其实评价等级描述须更有焦点、具可测性、体现学生课程学习实况。

自下而上式草拟前了解学生的情况,自上而下式草拟后的验证,宜有质性和量化相结合的研究。

(1)考察过往考试。由学科专家、资深教师组成小组详阅最近几年公开考试试卷与结果,分析可较好测定能力的试题的得分,把握学生的实际程度,包括学生总体的及不同类型的表现。

(2)测试。根据能力核心因素、综合能力分门别类地编制试题,选择有代表性的学校进行测试,验证评核、描述重点,简化、合并、综合评核项目。同时,可找出各等级的典型样本。

(3)课堂观察。根据课程设计教材,组织教学实验;通过观察课堂、分析作业、组织测试,判断学生真实能做的事情,或把表现分为几类,据此起草或修订评价标准。

(4)咨询。咨询方式有问卷、访谈及小组会议等,对象包括科目专家、资深教师、雇主、家长、高一级学校代表、公开考试的评分员等,内容包括标准是否涵盖各种能力、重要情境、各类学生的表现,以及等级间的区别是否真实、正面、易理解等。



(来源:《课程•教材•教法》2014.3)
您需要登录后才可以回帖 登录 | 注册

本版积分规则


QQ|联系我们|手机版|Archiver|教师之友网 ( [沪ICP备13022119号]

GMT+8, 2024-4-29 13:01 , Processed in 0.114628 second(s), 25 queries .

Powered by Discuz! X3.1 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表