美国中小学考试评价解析

教师之友网 · 发表于 2013-1-24 16:29:36

美国中小学考试评价解析

作者：教育部考试中心王蕾北京师范大学余娜
1 美国基础教育考试评价的新规则

“不让一个孩子落伍”(No Child Left Behind,NCLB)教育改革法案是美国基础教育领域近些年来最热门的话题。布什总统于2001年提出的“不让一个孩子落伍”的教育改革议案于2002年1月8日正式通过审核成为法律。这是白1965年以来最大规模的教育改革立法。这一法案极大地增强了联邦政府在保障所有儿童公共教育质量中所发挥的作用。法案要求3年级到8年级的学生每年都要参加阅读与数学测验。

议案中最关键的部分是要求每个州在数学和阅读科目上制定并实施有挑战性的学术标准，设定每年的进步目标以保证所有群体的学生在12年内达到精熟水平。然后每年对3年级到8年级学生的阅读和数学科目进行测验以测量他们的进步。这个议案尤其对“全国考试”或“联邦控制的课程”有利。由各个州自己选择和设计测验，必须保证测验与州课程标准一致。各州将会受到联邦资金的资助来发展测验。“激励机制”指的是如果联邦政府不能提供必要的资金资助，那么各州可以不编制3—8年级的阅读与数学测验。

测验结果将以“报告卡片”的形式每年向公众报告。内容将会涉及学校的成绩表现及各州朝精熟目标的进步情况。为了保证所有群体的学生适度的进步速度，测验的结果将会按照贫困情况、种族、残疾情况与英语精熟程度分开报告。这就是众所周知的“数据的解体”。这样做也是为了防止学校将多个测验的结果混合而只提供学校的平均水平以掩盖不同学生群体之间的成绩差距。

议案要求各州与学区提供每年精熟目标进展的情况。他们必须证明所有群体的学生在12年之内部达到了100％的精熟程度。各州自己确定精熟标准，每个群体的学生适当的年进步率。表现不佳的学校要参加州所实施的各种各样的学校提高和改革计划。

每个州的测验结果将与美国国家教育进展评估(National Assessment of Educational Progress,NAEP)的指标进行比较，NAEP每两年在全国范围内取样，对各州4年级和8年级的学生实施阅读与数学测试。这个规定称为“NAEP可比性”，是为了防止各州将自己的考试和标准定得过低。也就是，如果一个在自己州的测验上显示出进步，但是在NAEP上却没有显示相应的进步，那么就说明州测验和州标准的挑战性不够。最后的立法中并没有说明如果州测验分数相比于NAEP落后时的处罚，只是要求将对比的结果公开。

2 美国中小学考试评价

2.1 联邦考试

美国国家教育进展评估NAEP,又称为国家教育报告卡(The Nation’s Report Card)，是目前美国国内唯一连续、长期的中小学生学业成绩测量体系，首要目标是向美国公众报告学生的教育状况。

为达到这两个目标，NAEP设计了两种类型的评估：主要(main)NAEP全国评估(NAEP-National)和长期趋势评估(Long-term trend assessment)。主要的NAEP全国评估考察美国学生知道什么，能在关键的学科领域做些什么。NAEP的长期趋势评估是通过比较几十年以来成绩的变化，测量在一段时间内教育的进展。

NAEP评估的施测对象是美国4年级、8年级和12年级的学生。NAEP并不为单个的学生和学校报告分数。评估所报告的是以性别、种族为特征的群体的结果。

NAEP自1990年开始允许各州参与州水平的阅读、数学、科学和写作评估。有40到45个州参与了NAEP州评估(NAEP-State)。从2003年开始，“不让一个孩子落伍”法案要求所有的州和学校区域都接受联邦I号基金(Title I grant)参与两年一次针对4年级和8年级学生的NAEP阅读和数学评估。从 2002年开始，NAEP首次试验性的进行城区水平的评估(NAEP Trial Urban District Assessment)。六大公立学校的城市试验区志愿参与了这次评估，2003年有10个城市试验区开展了阅读和数学的实验性NAEP城区水平的评估。

NAEP的试卷编制与施测过程包括以下几个步骤：

1)确定评估框架

NAEP基于国家评估管理委员会(National Assessment Governing Board)制定的内容框架建构评价框架。每个科目的内容框架详细说明了特定年级的学生应该知道和应该能做的。内容框架指导试题的编制。

2)开发评估题目

NAEP的题目编制者做出了巨大努力使评估题目能够反应出教育者对于学生应该知道和应该能做的事情的最佳思考。基于NAEP的内容框架，测验专家在教师、课程专家和测量专家的帮助下编制出评估项目。为使题目更加恰当和公平，还进行了大量研究来审核以往的题目与作答反应。

“不让一个孩子落伍”法案规定国家评估管理委员会必须采取措施确保所有的题目都不存在种族、文化、性别和区域的偏差，必须是长期、中立、不带意识形态的。

在测验编制组成员、学科领域的专家和国家评估管理委员会经过最初的审核和评价之后，首先将评估测验对少量的学生进行预试。在预测验的结果分析与评审专家审核评价的基础上，对有异议的题目进行改善，组成测试卷进行实地测验。实地测验施测于成千上万的学生，评卷并进行分析。然后基于实地测验的结果和内容框架的规定选择合适的题目用于实际的评估。

3)编订评估手册

NAEP评估项目包含成百上千的题目。然而，不是每个参与NAEP的学生都完成NAEP评估的所有题目。测验题目分成不同的组，然后打包成不同的小册子。每个学生只需完成一份小册子中的题目，这些题目大约占总题量的10%-20%。将小册子分散开来，这样同一学校中只有很小部分的学生做的是同一小册子中的题目。小册子的发放是完全随机的。

NAEP中既包括了多选题，也包括了开放式的问题。开放式问题要求学生自主作答。学生既可以只言片语也可长篇大论，甚至比写作考试中写得更长。

在每次评估之后，有25％以上的测验题目公开作为样题并附有评分标准和学生作答的样本。

4)取样

NAEP选择了足够大的样本以保证评估结果的信度、效度。各州和各个行政区接受I号基金学校的4年级和8年级学生如果被选中的话都要求参与两年一次的NAEP阅读和数学评估。而其他的评估学校都是志愿参与的。

对于全国评估而言，在没有州评估的年份中，

NAEP选择公立和私立学校学生的随机样本代表全美的多样性学生总体。选择参与的学校和学生的数量会随科目的不同而有所不同。当组织一个无州评估的全国评估时，每个科目通常需要各个年级6000到10000个学生样本。

全国样本的获得通过两阶段分层取样设计：首先根据地理位置对学校进行分类，然后根据少数民族入学的水平进行分类。在每个基于位置与入学分类的类别之中，按照事先确定好的比例进行随机取样，为所有学生和所有的子群体提供精确的结果。

5)评估的实施

NAEP的实施从1月下旬开始持续到3月中旬。训练有素的NAEP实施成员与学校协作实施评估，对整个过程进行管理。要求学校指派一名校方协调者帮助NAEP工作人员进行校内的安排。每个州也都有联邦基金资助的州协调员与参与的学校一起工作。

每个参与NAEP评估的学生要求的作答时间是1小时。在完成每个测验手册中两个25分钟殴的科目相关问题后，学生还需完成两个5分钟段的背景调查。其内容主要涉及与成绩特别是所评定的科目的成绩相关的学校和家庭经历。学生可以跳过任何她／他们不想回答的题目，不过这种不参与和不回答会大大减少NAEP能提供的有用信息。

6)NAEP的评分

NAEP评估中既有多选题又有开放性的问题。多选题使用光电阅读器评分，开放式问题由经过培训的评分者依据评分指南进行评分。为了确保评分的可靠性和一致性，NAEP制定了详细的评分指南，对有经验的评分者进行训练并通过有资格的评分者对评分者的能力进行双重检验，对每个评分者评定的质量与一致性进行监控与评价。

每个开放式问题有各自的评分指南，评定标准。

扩展的开放式问题有4—5个水平的评分指南。

7)学生成绩的报告

NAEP报告每个科目每个年级学生NAEP量表的平均分数。平均量表分数概括了学生知道什么，能做什么。成就水平(Achievement Level)显示了学生在应该知道和应该会做的事情上达到的标准。依科目不同NAEP量表有两种：0-300或者0-500。报告中提供整个年级所有学生的量表平均分，通过区域、性别、种族、学校类型和其他特征所定义的各个团体的量表平均分。

除了报告特定评估年的分数以外，还报告NAEP结果随时间的变化而变化。

NAEP同时还报告成就水平，即在全国，某个州，或某个学生群体中达到特定成绩水平的学生的比例。NAEP将每个科目的成就水平划分为基本、精通和高级。成就水平的结果显示达到基本、精通和高级这三个水平的学生的百分比。

在报告量表分数和成就水平的基础上，NAEP还将数据分别按组别（例如种族、性别、有残障的学生、英语欠精熟的学生）、区域（国家的、州的、地方的）、背景（学生、教师、学校特征）进行分解。

教师、管理者和学生的完整背景调查作为NAEP评估的一部分也进行了分析。使用背景调查问卷获得的信息，就可以将学生的成绩在NAEP的报告变量之间进行比较。

NAEP的评估结果为家长、教师、教育决策者、研究者、课程专家、媒体和美国公众提供了共享的资源。在国家水平上，NAEP以多种形式进行结果报告。“报告卡”是延伸的报告，密切检查NAEP的结果，并且深入地考察评估的设计和实施。“最重要部分”对NAEP数据进行简要概括。在州的水平上，NAEP的结果打印在“最重要部分”中全国结果的旁边。另外， NAEP为每个参与的州提供一页的在线“快照”。NAEP提供的工具和资源使得各个州可以自己发展出综合的州报告和在线的快照报告。对于试验性的城市地区评估而言，可获得单独的“最重要部分”和参与的各个城市地区的在线快照。除了这些书面的资源外，NAEP的出版物和数据都可以在NAEP网站上找到。

2.2 州考试

2002年，美国颁布的《中小学教育修正法》首次要求各州必须实行统一考试，并以考试成绩衡量学校的教育质量，连续两年不达标的学校或地方必须采取措施提高成绩，否则，联邦教育部将扣减其联邦教育拨款。
美国州考的规则由各州自行决定。一般说来，考什么科目，考哪几个年级都是以立法形式来确定的。数学和英语（以阅读为主）几乎每州都考，但不一定每个年级都考。部分州还考历史（或称社会常识）和科学。有少数州在高年级有更具体的科目的考试，如将科学再具体分为物理、化学、生物、地理等。自2002年起，联邦对各州的考试提出许多要求，例如从三年级到八年级以及十年级必须每年考数学和英语阅读。小学、初中和高中必须至少各考一个年级的科学。

州考花费很大。统考的年级越多费用就越高。问答题和作文引入标准化考试之后，必须聘请教师阅卷评分，考试费用也随之攀升。另外有些考试允许学生在一年内多次参加测试直到通过。每次考试学校和学生都不必缴费，但多考一次，州政府就要多拨付一次的钱。

考试的日期具有弹性，大部分州的考试安排在3-5月之间。学校或学区集体报名。通常，学区或学校直接向专业考试机构提供学生资料，专业考试机构将学生资料制成条形码，与考卷一并寄回学校。学校将条形码贴在考卷上，然后开考。

在美国，考卷的制作是一项系统工程，需要一支强大的专业队伍来完成。各州教育部门都不是自己单独制作考卷，而是通过公开招标，签订合同把考试的具体工作外包给专业考试机构。专业考试机构根据各州的要求量身定作。

州考试题的编制施测与联邦考试的编制施测过程大致相似，一般有以下几个步骤：

1)确定考试大纲。由本州的教育工作者、课程和考试专家、家长和其他社会人士组成的考试委员会来商讨决定。依据本州有关法律和课程标准确定考试内容。

2)建立题库。专业考试机构根据考试委员会确定的考试内容和形式组织命题。州考试委员会分组审阅每一道题，将不合格的题目删除。

3)进行试考。试考分小范围的预试(Priot Test)和大规模的实测(Fiely Test)。前者为试探摸底性质，往往是几道题，而不是完整的考卷。后者是实战演练，力求接近正式考试。

4)标定(Scaling)分析。由拥有教育测量或心理测量专业知识和技能的人员来担任这项工作。标定分析在两大基本考试理论指导下进行：经典测量理论与项目反应理论。

5)敏感性和偏向审查。专业考试机构将考题的技术参数和考题一对一编排，交给试题敏感性和偏向审查委员会审查。这个委员会由州政府邀请社会各界人士组成。成员大多既不是考试专业人员，也不是教育专家。他们代表社会各界，包括少数民族、宗教界及工商界人士。他们将从不同的角度考查考题是否有偏向。

6)考卷的技术要求。信度与效度要求。

7)确定评分标准。

8)评分和成绩报告。报告的是标定分数而非原始分数。标定有两个基本目的，一是有利于比较。二是有明确的定义，使人看到分数就能明白该分数所代表的意义。

2.3 学区考试

有的学区也自己组织考试，以了解本区的学生成绩。学区一级的考试由学校委员会(School Board)负责。多数学区使用现成的商业性标准化测验，但由于此类考试范围较小，有些学区也自己编制试题。学区考试的规模较小，其重要性显然不如联邦考试与州考试。

3 美国专业考试机构

在标准化成就测验编制与评分领域有四家公司占有绝对优势，被称为考试行业四大巨头。其中三家是测验出版商，一个是评分公司。这四个公司分别是哈考特教育测量(Harcourt Educational Measure ment)、加州考试局(CTB McGraw-HiE)、河畔出版公司(Riverside Publishing-a Houghton Mifflin company)和NCS皮尔森(NCS Pearson)。根据2001年10月教育市场商报的报道，哈考特教育测量、加州考试局、河畔出版公司出版的试卷占到州水平所有施测试卷的96％。NCS皮尔森是标准测验评分公司中的领军人物。

哈考特教育测量最有名的测验是斯坦福成就测验，每年有超过1500万的学生参加此项测验。哈考特参与了“测验我们的学校”中的所有测验，如马萨诸塞州的MCAS,德克萨斯州的TAAS,学习测验标准和加利福尼亚州的SAT-9。标准化测验占到公司整个业务的70％。公司的市场份额占到测验设计市场40％。

加州考试局在测验设计市场上大约有40％的份额，略低于哈考特教育测量公司。在纽约时报2001年5月对州教育部门的调查中有19个州表示他们信赖加州考试局对学生进行评估的测验。公司最有名的测验是TerraNova,一种常模参照的成就测验。1996年，CTB推出了TerraNova标准考试，成为美国最为常用的评估方法。由于TerraNova基于对用户的深入研究，因而TerraNova提供的试题具有强烈的革新性并且十分受欢迎，而且给出的评估结果易于理解。CTB在1965年被麦格劳一希尔(McGraw-Hill)教育出版集团纳入旗下，并且作为其中一员在此后的40年里蓬勃发展。

河畔公司控制着测验设计市场剩下的20％的份额。该公司的著名测验——爱荷华州基本技能测验(ITBS)——是一种常模参照测验，每年有400万到500万名学生参加此项测验。根据纽约时报2001年5月对州教育部门的调查，有8个州使用河畔公司的测验。

NCS皮尔森公司是标准化测验评分公司中的领军者。以明尼苏达为基地的NCS成立于1962年，并于6年后逐渐为公众所知。每年NCS测量服务中心为将近4000万学生的试卷进行评分。它为15个州提供服务，包括一些最大的市场如德克萨斯州、佛罗里达州和纽约。

各个州自己也可以成为测验编制产业的主角。虽然一些州采用的是商业销售的试卷，各州自己发展的试卷也逐渐增多，或者定制与他们的课程标准更加一致的测验。

另外，其他的专业考试机构，如教育考试服务中心(ETS)，也开始进军中小学基础教育市场。

ETS在教育领域服务了50年。它在开办高等教育考试的过程中一直处于领先地位，但在美国本土基础教育评价方面呈现相对弱势，市场份额落后于哈考特教育测量、加州考试局(CTB)等私营考试评测机构。教育本身在飞速发展变化，美国对于中小学基础教育(K—12)的教育评价越来越重视，这需要有效、可信的、对教学有帮助的考试工具测量出的数据、配套的评判和针对的指导。ETS将考试和考试有关的服务结合起来进军中小学基础教育市场，与各州教育行政部门和教育工作者紧密合作，利用自己在教育测量领域的专长对基础教育的状况和结果进行评价，对学生、家长、学校和教育政策制定者提供帮助。ETS的优势在于能够提供公平、公正和标准化的考试工具来测试教育成效，测量和记录考生的进步并为教学决策提供信息。2001年10月ETS获得为期三年5000万美元加州高中结业考试合同，加州政府规定从2006年开始，所有在校生必须通过结业考试才能拿到高中文凭。2002年加州政府再次委托ETS开发组织本州2—11年级450万学生的每年评测，三年合同总额为1亿7500万美元。仅2004-2005年度ETS组织的加州中小学基础教育评价人次约600万，人数远远超过同期其他大规模考试人次。

在此基础上，ETS推出中小学基础教育解决方案（系统5)整合了评价、数据分析、指导性策略和专业开发来帮助学校超越所有教育周期的5个阶段。帮助学生和教师测评他们的表现，通过数据分析提供基于实证的策略进行指导，并展现学生与老师的进步。

ETS已推出5大产品相当5大独特解决方案：1)学校改善方案——战略化目标指导的改进；2)评价方案——基于联邦和州授权的教育表现测量；3)数据驱动的决策制定方案——使用数据证明达到和超越每年教学进展目标；4)专业发展方案——提高教师水平得以提高学生素质；5)指导方案——培养写作技巧和发展新的教学方法。

与此同时ETS建立了格式化评价题库、指导数据管理系统指导教育工作者在教学过程中科学有效地评价学生成长。ETS在中小学基础教育评价中的工作范围主要包括心理测量领域和内容开发领域。在心理测量领域主要涉及标定、等值、标准制定、研究学习和技术报告。在内容开发领域主要涉及标准联盟、每年五万道高利害（关系学生命运）考题命制、每年两万道格式化／教学过程中测验题目放人格式化评价题库和考试形式的开发。

ETS2003年7月创立新的全球发展部门，两个焦点领域即为中小学基础教育评价和国际化英语语言测试及教育解决方案。可以预计，不久的将来ETS也将成为中小学基础教育评价领域的一个新巨头。

4 考试功能及利弊

考试的积极影响，一是促进成绩差的学校和学区改进教学方式提高学生成绩。通过考试成绩所提供的信息了解学生在知识技能掌握方面的优势和不足，便于对症下药。通过联邦考试和州考试可以对教育教学质量进行监控，督促教师用心教学，督促学生努力学习，从整体上提高美国基础教育的质量。二是考试使得教学内容更加规范，考试是推行课程标准的有效工具。因为根据“不让一个孩子落伍”法案，各州的成绩要与NAEP成绩进行比较，所以在课程方面必须接近一致。很多教育评论家认为该法案是将全国统一课程指标的建立推进了一大步。三是引起全社会对教育的关注，增加对教育的预算与拨款。教育被认为是社会进步和发展的重要基础，教育拨款是各州政府财政预算中最大的一项。根据“不让一个孩子落伍”法案联邦政府每年将为各州提供联邦基金以帮助试卷的编制与实施，测量3到8年级的阅读与数学科目。仅2002年联邦中小学教育预算就从2001年的185亿美元增加到265亿美元。

考试的消极影响：第一可能导致教学以考试为中心。一些家长和教育工作者认为考试会带来为考而教、考试演练的现象，扼杀儿童的创造性。第二考试是有误差的，完全以成绩来评估教育质量难免有失公允。专业考试机构的程序中存在错误的情况已经发生过多次。由于学校与学区自己不能解决测验中的错误所以通常要在相当长一段时间后才得到专业考试机构的答复。由于专业考试机构成功地以联邦监督回应各种异议，因此他们可以自己决定什么时候承认哪些错误。由于这些标准化考试的高利害性，专业考试机构与评分公司的错误与误差会导致许多学生、学校负责人及相关人士的事业和声誉受损。尽管专业考试机构与评分公司解释说从整体来看出错的比率是非常小的，但是关于考试中发生错误的新闻报道层出不穷，而且小概率对于个人而言影响是深远的。

最终的答案是在于考试的质量好坏。不是所有的考试都给学生带来无休止的演练。如果授课的内容与考试的内容不一致，那么就陷入备考演练的旋涡。如果考试的内容与课程相一致，那么就不存在所谓的考试准备，因为平时的上课就是在进行考试准备。诚然最好的教育是要激发和培养儿童的创造性，但是有些基础的知识和技能是每个人都必须掌握的，否则就无法适应社会生活。中学毕业证决非毫无意义的一纸文凭，而是表明这个人具备了基本的技能，要获得这些基本技能就必须经过某种程度的训练。考试的目的就是确保学生都掌握基本的技能。另外，为了检验教师教学和学生学习的效果，很难找到另一种比考试更加公平有效的方法。当然，对各大专业考试机构进行规范管理，减少测量误差也是今后需要改进的方面之一。

5 我国教育考试评价之路

我国的教育评价理论研究虽然起步较晚，但自20世纪80年代以来，教育评价的理论和方法得到了长足的发展，从对学生学业成就的评价到注重学生素质的全面评价，进而又扩展到教师、课程、学校甚至区域性的教育评价，对于调节，改善、提高教育活动的作用和效果发挥了积极意义，主要表现在：

第一，明确了教育评价在教育活动体系中的地位和作用，重视了教育评价的教育性功能。第二，初步建立起了我国教育评价的理论和方法体系。第三，基本上形成了适合我国国情的教育评价的实践模式。

但是，对于教育评价中的考试评价而言，我国的考试评价有待进一步学习和提高。表面上我国的教育评价似乎是以考试评价为中心的。在“片面追求升学率的应试”教育中，对学生学习结果的评价主要集中在知识的掌握、智力的发展等认知领域，对教师教学水平的评价往往以学生的考试成绩为依据，而对学生的思想品德、个性、人格等的发展以及教师的教学行为、授课质量不够重视。现在教育行政部门已经意识到这一问题，开始强调评价内容的多元性、评价方法的多样性和评价主体的多元化。诚然，教育评价的多元化势在必行，但是考试评价仍然是其中最易操作、最切实可行的方式，只要应用得当仍能发挥巨大作用。

目前开展诊断性的以学科为单元或以认知特性为单元的评价是各国考试改革的趋势之一，其评价结果既可以为政府决策提供参考，又可以为学区、学校或考生提供服务。像上文中所介绍的美国全国教育评估(NEAP)，就是一种长期的中小学生学业成绩测量体系，首要目的是报告学生的教育状况，而与学生的升学没有关系。这样就能有效地减少学生的考试焦虑和考试之前的突击复习现象，增强评价的真实性。

教育部门应建立适合我国国情的基础教育评价项目和评价标准，尤其是通过与国际评价机构的合作，学习国外大型评价项目的设计理念和运作经验，积极开展需求分析调查，结合我国实际需要，逐步建立我国的基础教育评价体系。

更重要的一方面是要加强用心理与教育测量的最新理论来指导考试，使考试的功能得到充分的发挥。只有按照严格规范的流程来组织命题，所获得的信息才具有较高的信效度，否则考试评价的诊断功能与发展性功能都无从谈起。要在基础教育的考试评价中实现测量理论的价值就必须从以下几个方面着手努力：第一，要以测量技术为指导，形成我国学业评价的规范化程序；第二，要强调测量专家、教育专家和命题人员的结合。从国外学业评价与考试，特别是大型考试评价项目的经验来看，加强测量专家、教育教学专家和考试命题人员的结合，发挥各自所长，是提高学业评价质量和效果的关键因素。第三，要重视信息技术的应用。信息技术和测量与考试理论的结合是当前测量理论发展的重要趋势，其标志性的成果就是计算机自适应考试的出现。它能节约50％的考试时间，对考试的能力估计更为准确，并且将学生不同能力水平的估计放在同一尺度，便于报告和分析。在可以预见的未来，信息技术在学业评价的重要性将是不言而喻的。在我国的基础教育考试评价中引入计算机自适应测验无疑会推进我国学业评价体系与国际学业评价体系的接轨。
《中国考试》

教师之友网 · 发表于 2013-1-24 16:30:37

TestCollector收集了一些美国中小学考试试卷(3年级-11年级)。每套包括英文阅读, 数学各一份。这里是其中一份（PDF版）。

三年级：英文阅读，数学
四年级：英文阅读，数学
五年级：英文阅读，数学
六年级：英文阅读与数学
七年级：英文阅读，数学
八年级：英文阅读，数学
九年级：英文阅读『答案』数学『答案』
十年级：英文阅读，数学
十一年级：英文阅读，数学

注意：本网与TestCollector无任何联系，亦不保证TestCollector的商业信用。

教师之友网 · 发表于 2013-1-24 16:31:18

美国中小学语文的核心课程

SAT/SSAT考试网更新人：赵露更新时间：2011/8/17

AR－美国中小学语文阅读与理解
随着全球一体化进程的加快，越来越多的家长希望让孩子更早与国际接轨，如何才能真正实现与国际接轨，掌握并熟练地使用英文是很多家长所关心的问题。若要想让孩子彻底掌握英文，这需要全英文环境。而国内大部分英文培训机构提供的几乎全是英语的语言培训，如果应付日常生活是没有问题的。但是，与掌握英语语言文学距离还相差甚远。这也就是我们很多同学自认为英语学得很好，甚至托福成绩考得很高，但是一旦考SAT 或者SSAT往往成绩很不理想的原因，因为托福考试是针对母语为非英语人的英文水平测试，而SAT和SSAT考试里面涉及的英文是针对美国文学和文化以及历史部分理解的测试。我们可以预测对于没有在英语环境中学习和生活过的中国孩子来说这该有多难。可是，把孩子过早送到国外确实也存在诸多不利因素，譬如，由于孩子年龄太小没有完全生活自理能力；价格太贵等诸多因素。现在您终于找到了解决的办法，让孩子来参加我们美国中小学语文的课程――AR阅读与理解。

英语与美国语文的区别：

一．语言仅仅是工具，而语文是文化和历史结合的精髓。
举个例子，一个外国人学习汉语，甚至到中国生活了若干年，说得一口流利的汉语，但是，这个外国人并不一定能听懂我们的小学语文课程。我们的孩子从小开始背诵唐诗，解读历史故事，刘备三顾茅庐，后羿射日的故事我们很多幼儿园的小朋友就能读懂，但是，对于美国人来说就没那么容易了。这就是语言和文学的差异，要想掌握一门语言，离开文学和历史是根本办不到的，也就像我们在学习外语的过程中，有时单词不是问题，能读懂单词，但是还是搞不懂文章到底说的是什么意思，这就是阅读和理解能力欠缺所造成的。可见，对于未来想去美国读中学和大学的中国学生来说，最重要的是什么就不言而喻了。
二．仅仅学好英语语言并不能保证进入美国很好的学校，更不能保证进入学校后能够获得优异成绩。
美国的很多著名高中和大学，在招收国际学生的时候要求申请人提供托福（TOEFL）和小赛达（SSAT）或赛达（SAT）成绩；而全球竞争越来越激烈并没有使美国学校扩大国际学生的招生名额，反而国际学生的入学门槛越来越高。单靠托福成绩并不能进入著名学府，赛达和小赛达越来越成了必要的考试，但是，对于中国学生来说，如果早一点进行英语强化培训和托福考试培训，考托福还可以考个不错的成绩，但是考赛达和小赛达并没那么容易了。据我们了解：个别的初一，初二同学已经能够考出托福100多分，小赛达2000多分的好成绩了，他们大多来自国际学校，而且他们的英文教育和考试准备几乎从小学阶段就开始了。可见，对英语的掌握要从很小开始抓起。但是，即便是考试考了很高分数的同学，到了美国以后同样会遇到困难，初到美国的一段时间往往很难拿到好成绩，很多同学甚至觉得在国内的英语好像有白学了的感觉。其实，道理很简单，国内学的英语是将英语作为第二外语而学，与美国学校的学科英语截然不同，所以很多同学开始会有点找不到方向。美国的授课模式和我们中国的模式也不同，学校完全在于培养孩子的自主学习和解决问题的能力，所以学生要进行大量的阅读来达到学习的目的，而美国学校留作业的模式也与我们有所不同，大部分作业都是以撰写论文的形式来完成，同样需要学生自己通过查找大量信息得出自己的观点，同样要求阅读理解的能力和速度。当然，要完成一片好的论文还需要有很好的英文写作功底。而培养和提高写作能力最有效的途径是要进行大量阅读。可见，培养英文的阅读能力是真正掌握英语和学习美国语文的核心所在，也是未来成功在
用得最少的专业去学，你同样需要查阅大量的英文读物，并写出相关的论文才能获得好的成绩。其它专业就更不用说了，如果你没有一个很好的英文阅读理解能力，根本无法应付专业课的学习，就更别谈如何拿优秀成绩了。
三．阅读理解能力也是考好SAT，SSAT的基础。所有的同学都认为SAT, SSAT考试比TOEFL考试难很多。究其原因，TOEFL 只考英语的听，说，读，写, 而且是针对英语为非母语人考试；但是SAT ,SSAT考试却有阅读理解，词汇，写作，还有数学部分，该考试是美国本土考试，我们通常叫美国中考和美国高考。不管你英文有多么好，但是如果没有良好的阅读理解能力同样是考不出好成绩的。?
英文的思维模式建立的最佳年龄：

众所周知，对于一门语言的完全掌握，最晚也不能超过12岁。因为，人的思维模式一旦形成定势就很难接受其它模式。年龄越小，可接受空间就越大。而孩子是可以同时形成两种或多种思维模式的。所以，我们认为小学阶段是开始进行英语思维模式培养的最佳时机。

教师之友网 · 发表于 2013-1-24 16:32:21

美国中小学考试评价探析
转载▼

——《透视美国教育》之一读一得

书籍简介：《透视美国教育》一书是由教育学博士、教育部基础教育司副司长王定华主编，由20位留美博士编写，由北京大学出版社出版的教育专著。
探析原因：教研培训中心每年的重点工作之一就是试题命制，了解美国的考试评价和试题命制过程，或许会获得一些启示。
一读：美国中小学考试评价的法律化
1．考试法规的立法机构。
美国是一个联邦制国家，联邦政府的权限由宪法来规定。宪法没有规定的权限由各州自己做主。学校教育就是宪法没有明确规定联邦政府权限的范畴之一。学校教育在美国历来主要是州政府和地方政府的职责。州政府的财政拨款是公立中小学经费的主要来源，因此，各种教育立法其中包括考试法立法都由州政府主导。
2．考试法规的周全详尽。
以俄亥俄州为例，其《州学校教育法律大全》中第33卷为有关学校教育的法律，共779页，外加本州的其他法律中涉及学校教育的条款553页。《州政府行政细则汇编》中的教育卷413页，外加各类表格100多页。这两本书都是用很小的字体印刷，看上去像是大部头字典。
3．考试法规的主要内核。
①明确考试原则。
一是每考必有相关考试细则；二是保障所有考试与现行大纲相一致；三是试卷制作过程必须要有俄亥俄州的家长、上课教师、学校管理人员的参与；四是要保证考试的信度和效度。
②确立考试科目。
小学三年级考英文阅读和数学，四年级考英文阅读、数学和英文写作，五年级考英文阅读、数学、科学和社会科学，六年级考英文阅读和数学，七年级考英文阅读、数学和英文写作，八年级考英文阅读、数学、科学和社会科学……
③规定评价用语。
法律要求州教育委员会将考试分数分为五个成绩段：优秀、良好、及格、略知、有限。尽量避免使用贬义词来评价学生，即使一位学生考了零分，也不能说这位学生极差，而是说这位学生才刚起步或知道得有限。
④划定考试日期。
三年级英语阅读一年考两次。第一次在秋季，每年的 12月31日之前；第二次在春季，考试日期不再早于5月的第一个星期。从三年级到八年级的其他科目考试都在春季学期5月份的前两个星期进行。对于十年级的高中毕业考试，要求每年至少提供三次，第一次在秋季，不得晚于12月31日，第二次在春季，每年的3月15日前后，第三次在夏季，7月10日至31之间。
⑤严格监考阅卷。
第33卷第一章第七节第十一条是关于全州考试的监考管理、阅卷评分、考试结果的使用及补习服务。法律规定不得向学生收取任何考试费用。
一得：考试法律化是规范考试、严肃考试的有力保障。
1．有利于克服政府拨款随意性。
在中国从来没有听说过考试还有法律。虽然有许多考试的要求，但必定没有法律的严肃性大。美国的州政府每年都有考试的财政预算，如果学校和项目想要拿钱，最根本的办法就是用法律确定下来，如果法律规定要做什么事情，那州政府只好依法拨款，不会克扣。我们的考试由于没有法律的保障，政府拨款随意性大，每年、每次都需要打要钱报告，等待一级一级审批，平添了许多麻烦，降低了工作效率。
2．有利于遵循教育教学规律。
考试评价的原则、科目、时间、评价级别用语、的监考管理、阅卷评分、考试结果的使用及补习服务以及考试费用等一一用法律形式规定下来，让考试遵循教育教学规律，充分发挥客观评价，有效激励的作用。
3．有利于获得家长社会的支持
美国的试卷制作过程必须要有家长、上课教师、学校管理人员的参与。我们的试卷制作没有学生家长的参与，这对家长其实是不公平的，对教育也是不利的。家长有对学校教育教学以及考试评价的监督权和知情权。在家长监督和知晓教育的情况下对教育的理解和支持力度会加大。
二读：美国中小学考试评价的科学化
考试的结果对学生、家长、老师和教育行政人员都有切身的厉害关系，所以，美国对考试的要求是很高的。要求做到全面、合理、客观、公正、稳定、公开。这六大要素构成了考试的科学化。
1．全面。是指考试的内容要全面。即根据法律的规定，考试内容要反映州教育委员会审议通过的教学大纲。在每一个年级阶段，所有的目都会考到。而每个年级的具体教学内容指标太多，只能随机抽取，大概在若干年后，才能是差不多所有内容都被考到，这样做是为了避免教师缩减教学内容，打击片面的应试教育。
2．合理。一是指试题难度适中，二是指对学生的成绩要求要合理。如果考题都很容易或都很难，考试的结果会是绝大多数都得低分或绝大多数都得高分，那就不能真正反映学生的真实水平，也不能区分学生之间的差异，这种考试结果为学生、家长和教育工作者提供非常有限的信息。
那么如何做到合理呢？
（1）正规考试的考题由专业的考试公司来命制。
①花巨资。
通过合同招标的方式较贵考试公司制作。在俄亥俄州有两个试卷命制合同：一个是关于小学和初中的三年级到八年级考试的试题命制合同；二是关于高中毕业考试的试题命制合同。每个合同每年花费两千多万美元，两个共五千多万美元。这可谓是巨资了，为什么会这么贵呢？
②命试题。
首先考试公司必须认真研究本州的教学大纲，制出一分考试蓝图，然后培训命题人员。命题人员一般按件计酬，他们像是自由的个体专业户，每题大概20美元左右。而这仅仅是开始，在考题的制作费中仅仅是零头。
（2）试题要经过严格审查。
一审试题——审正确性和科学性。
接下来，考试公司要组织考试学术内容审查委员会对每一题的内容进行审查。一是审查学科专业知识是否正确，是否符合教学大纲要求；二是审查考题是否适合学生的智力发展水平。比如一道三年级数学题，在文字表述上是否符合学生的阅读水平。这主要根据上课教师的经验和专业知识来判断。所以考试学术内容审查委员会的成员大多数为上课教师。
二审试题——审偏向性和敏感性。
审查试题的偏向性和敏感性，要从不同角度看一道试题是否会偏向某些学生。比如说，如果一道题设计比较专业的运动知识或汽车方面的知识，就会偏向男生；如果一道数学题需要化妆方面的之四或洋娃娃的故事，就会偏向女生。还有偏向农村学生的庄稼生长和禽畜生长知识，偏向城市学生的交通灯、公园等知识。还要审查试题在文字表述上有没有冒犯某一种族或宗教信仰。如有，会惹很大的麻烦。试题偏向性和敏感性审查委员会成员主要由社会各阶层个团体代表组成。委员会的成员构成要考虑到男女比例、种族比例、宗教信仰比例。
（3）每一道考题都要在小范围内试考。
所有的考题在进入题库之前都要经过试考，试考的客观数据合格了，试题才可进入题库。对考题进行数据分析是考试行业中最专业化的工作，业内专业人员被称为心理测试师，，他们一般都有博士学位。
（4）还要对考题进行最后的复审。
在试考以后，试题还要经过考试学术内容审查委员会和试题偏向性和敏感性审查委员会的复审。经过这样一个复杂而漫长的过程，每一道题都是价值千金了。
3．客观。
对考试客观性的要求导致美国考题向标准化发展，基本上都为多项选择题。到了20世纪八九十年代，人们觉得多项选择的考试形式有一些局限性，它不能很好地反映学生的逻辑思维能力，也不能反映学生的逻辑思维能力。长此以往，学生的书面表达能力越来越差。所以，问答题又回到了美国的标准化考试当中。他们认为标准化并不是都得用多项选择题。
4．公正。
每一次考试的题目不一样，试卷的整体难度就不一样。如果一个班级考两份试卷，第一份的平均成绩是85分，第二份是45分，那么这份的45分可能就等值于那份的85分。为了让不同的试卷所得的成绩能进行比较，考试的原始分数应根据考题的难度换算成标准分。托福考试和JRE考试的结果都是用标准分来告知大家的。
5．稳定。
稳定是指考试结果是可靠的，具有可重复性。常常会听人说这次运气不好，考试的结果不理想。这说明考试成绩没有反映出自己的真实水平。如果我们承认一个人的水平是相对比较稳定的，那么考试成绩就应该是稳定的。很动人在准备托福考试时都会做大量的模拟题，做了几次以后就会发现，每次成绩都差不多，这就叫说明托福考试试题的稳定性是很高的。
6．公开。
就是公众对考题有知情权。包括试卷的制作过程要公开，考试的技术参数要公开，考题要公开，当然是考后公开。
二得：没有足够的技术保障和资金保障很难保证考试的科学化。
和美国的试题命制相比，我们的试题命制太廉价，廉价得无法相比。下面将我们的试题命制与美国进行一下过程对比，来看看我们的差距在哪里？
①我们由教研员命题，美国由专门的考试公司命题。教研员明确课标（大纲）要求，不需要花钱专门培训，在此就节约了一大笔开资。
②我们的考题没有专门的审查过程，因为资金短缺，再加上保密要求，不可能让教师、家长和社会各界人士审查。社会各界人士对此也不会感兴趣。因此，试题学术性、敏感性和偏向性到底如何，只能在实践中检验。但是一旦考试，如果试题不科学，就会对学生造成既成事实的伤害，这是非常不严肃的，违背了考试的初衷。
③我们的试题也没有经过试考。也因为保密和资金短缺的原因。“再苦不能苦孩子，再穷不能穷教育”只能是我们的愿景。不过“试考”是一种值得借鉴的方式，保密和资金短缺的困难应该是可以克服的。
④我们没有专门的博士学历的心理测试师进行考试的数据分析，而考试的数据分析和标准分等的计算工作技术含量是很高的，在美国从事这种工作的人员年薪10万美金以上。我们只能由教研员和学校教师做浅表的分析。试题的合理性、稳定性到底如何，不得而知。大家都只有摸着石头过河。我们的教学是不是有效的？我们的考试是不是科学的？我们都不清楚。难怪有效教学是我们永远面对的难题。因为考试是教学的导向，没有科学的考试就没有有效的教学。
三读：美国中小学考试评价实施过程的人性化
美国考试评价过程的人性化体现在考试过程中对有特殊需要的学生提供各种方便条件。对母语不是英语的移民学生实施语言的照顾；统一考试时，各个学校考试时间安排上的灵活性；对问答题阅卷的准确性要求；允许学生、家长、学校对考试成绩的质疑和要求重新阅卷等等。
对学习上和认知上有障碍的学生，学校根据有关法律规定要予以特殊照顾；对母语非英语的学生，如果考试困难，有专人将英语翻译为学生母语给学生读题。
三得：人性化考试需要资金的保障，更需要以人为本的理念。
我们教育经费严重短缺，制约了考试的人性化服务，比如，“允许学生、家长、学校对考试成绩的质疑和要求重新阅卷”这一点我们就很难做到。学生多，经费缺，时间紧，人手少是一个很大的问题。但是，考试的人性化实施，固然需要经费作保障，而以人为本的理念更为重要。只要有以人为本的理念做指导，在条件允许范围内，我们会做出很多让学生高兴，让家长满意的事情。而我们恰恰缺少的就是这个，我们往往无视学生，特别是作为人的学生。我们经常要求学生，却忘了教育也是一个服务行业。所以中国的学生对学校缺少感情，离开学校就再也不愿意回去。而美国的学生则不同，成才以后多数都会向母校捐款，以回报母校对他的培养和关爱。

教师之友网 · 发表于 2013-1-24 16:34:26

美国中小学语文考试的特点

作者：王爱娣

-

-

-

　　美国的联邦制度决定了各州拥有教育自主权，从教材的选择、课程的设置到考试评价、人才选拔，都实行各州独立自治。各州的考试评价在名称和要求方面有所不同，但考试类型和目的基本相通，都受制于国家教育法案，遵循着教育科学规律，实践与应用教育研究成果。因此，美国各州中小学语文考试存在许多共同之处，具体表现在以下六个方面：
　　
　　第一，把阅读放在第一位，阅读考试伴随语文教育始终
　　
　　美国《不让一个孩子掉队》教育法案要求建立“阅读第一”项目，通过“把阅读放在第一位”来提高学生的读写能力。这就决定了从幼儿园开始直到高中毕业，阅读考试伴随着学生语文学习的全过程。该法案签署并付诸实施之后，各州基本上都采取了早期阶段的语言艺术“准备评价”，为学生升入1或2年级的学习做好准备。从2或3年级开始，学生都将参加州标准考试，考试的依据是各州的课程标准。10年级时，学生就可以开始申请高中毕业考试，如果一次不能通过，到11年级或12年级还必须参加同样的考试，直到全部通过为止。这些考试中，阅读是必考的项目和内容。不同的年级阶段，阅读的文本体裁或样式不完全相同，对知识点和阅读技能与方法策略的要求也有很多差异。总之，在美国人看来，阅读是学生获得知识的重要途径，学会阅读就是学会生存。
　　
　　第二，阅读试题基本上采取标准化样式
　　
　　阅读考试主要考查学生对文本的阅读理解能力，以及对文学作品的分析和反应能力。阅读试题绝大多数采用标准化样式，学生在阅读完指定的文段后，只要按照自己的理解选择正确答案的字母代码就可以，不需要用文字表达自己对篇章的理解和感悟。虽然美国教育强调对学生批判性思维的训练，强调学生在阅读中的独特感悟，重视学生的创造性阅读，但是，试题都以标准化选择题的方式呈现出来。这在一定程度上是由美国社会文化特征决定的。作为移民国家，多民族的融合必定带来语言文化的多元化特征。阅读试题的标准化，或许使学生对语言文字的解读更实用、更直接、更有效。这种标准化测试使得美国语文教育中那些死记硬背的东西更少一些，然而，标准化试题无法测量学生实际的语言表达能力。为此，近年来有些州的语文考试中，也增加了适量的开放性试题，要求学生在阅读完一个片段之后，按照要求回答问题。比如，马萨诸塞州2004年春季3年级阅读试题中有这样一道开放性试题：“用你自己的语言描绘《贝多芬第九交响曲》在第一次演奏中发生的事情，你的答案中至少应该包括四个方面的重要细节。”为美国中学生准备的大学先修课程AP考试中，语文科目的语言与作文、文学与作文两项考试，完全采取问答题的形式，没有标准化选择题。
　　
　　第三，以能力测试为主，兼顾知识点的考试测评
　　
　　翻开美国部分州的语文阅读试题，笔者发现，其中有不少试题是对基本知识的判断与鉴别，比如文体知识、修辞知识等。这些知识要点不需要学生死记硬背，学生只要能够理解，具备一定的技能与技巧，学会辨别，就可以答对。
　　美国语文教学比较重视知识的传授，在他们看来，“知识就是力量”这句话很有生命力。那些能够生成知识和能力的基础知识是必须掌握的。比如，美国语文教材对文学体裁名称以及语言与文学方面的术语都进行了系统的梳理，分年级安排在教材之中，课堂教学中教师将会教给学生这些术语和知识，词汇教学也会涉及词源等知识。
　　
　　第四，考试评价的目的是检测学生是否达到了熟练的程度
　　
　　基础教育阶段的读写考试以分数呈现结果，分数是用来衡量学生是否达到熟练程度的标志。比如，印第安纳州3～10年级学生的英语语言艺术考试项目及其数据如下：
　　
　　如果学生的考试分数达到达标分数，就表明学生在这方面的知识和能力达到了州课程标准的熟练程度，可以进入下一阶段的语文学习。这里每一个考试项目的成绩不能相加，不可以取综合平均得分。比如，阅读词汇如果只有63分，距离达标分数的82分还差19分，而写作则比规定分数超出了19分，但是，这两个分数不可以随意调整取得平均数。如果不能达到这个熟练程度，还必须继续留在本年级学习，参加“阅读干预”训练，直至达到本年级要求的熟练程度为止。
　　再比如，加利福尼亚州2～11年级标准考试的分数共分为五个等级，分别是：远离及格（Far Below Basic）、低于及格（Below Basic）、及格（Basic）、精通（Proficient）和优秀（Advanced）。学生只要达到300分，就可以满足标准要求，低于300分的学生就得参加“阅读干预”训练。加利福尼亚州语文标准考试成绩等级分布如下：
　　
　　在美国人眼里，一个真正优秀的学生必然具备许多方面的良好素质，比如良好的沟通能力、健康的体魄、优秀的个人品质，以及挑战自我的勇气。一个学生是否优秀，需要考查其整体素质，至于考试成绩，只需达到规定的分数即可。
　　
　　第五，考试及其评价机构独立于教学机构
　　
　　在美国，考卷的制作是一项系统工程，由一支强大的专业队伍来完成。州教育部门不可能长期配备这样一大批高级专业技术人员，因此，几乎没有一个州是由教育厅自己单独命题制作考卷的。一般情况下，是由出版机构的考试公司根据各州课程标准为其特别制作，或者州教育部门购买全国通用考卷，或者在现有通用考卷基础上，考试公司为某州进行改制。例如，纽约州的标准考试试题就是由全国四大考试公司之一的CTB麦格劳-希尔（McGraw?鄄Hill）公司提供的。
　　阅卷评分，以及对试卷的量化分析也基本上由考试公司完成。至于考试结果的分析与评价，各州设有专门的评价小组，国家也有专门的评价机构，比如国家教育目标小组（the National Education Goals Panel，简称NEGP）、国际阅读协会（the International Reading Association，简称IRA）。国家教育目标小组由八位州长，两位联邦政府阁员（一位是总统内阁事务助理，一位是联邦政府教育部长），四位国会议员，四位州立法委员（同时也都是国会议员）组成。可以说联邦、州两级政府的教育决策者和最高管理者尽在其中。但这个小组对教育的监控与干预并不是依靠行政手段，而是借助法律的名义行使职权，承担一系列的责任，以便支持系统的教育改革。他们所承担的责任包括以下四个方面：报告国家和州在十年期限内朝向目标的进步；从事建立高质量的学术标准和评价体系；鉴定联邦、州和地方政府所采取的各项行为；建立一种为了达到教育目标，国家和两党所能支持的一致意见。
　　比如，国家教育目标小组在对1998年的阅读与写作考试成绩进行分析后，得出下面两组数据：
　　（1）1992年与1998年的阅读成绩中，学生成绩达到熟练程度及以上的百分比：
　　
　　（2）1998年写作成绩达到熟练程度及以上的学生百分比：
　　
　　通过各级各类形式的考试评价，衡量或监控教育质量，运用数据说明教育目标的实现程度，以此制定相应的教育改革措施，把握课程改革的方向和力度，这正是美国教育评价的核心任务。
　　第六，联邦政府对教育质量与教育效率的关注，与绝大多数美国人的期望一致
　　1983年4月，美国教育质量委员会发表了《国家处在危险中：教育改革势在必行》，该报告深刻揭示了美国教育的严重问题和面临的严峻挑战。报告发表之后，教育质量与教育效率问题成为公民关注的最大问题。自80年代以来，提高教育质量特别是公立学校的教育质量，成为教育改革的重要目的之一。1982年盖洛普民意测验显示，大多数美国人（84%）认为教育是美国未来实力的主要基础，他们甚至认为，教育比建立最好的工业体系或最强大的军事力量更重要。他们还认为，教育对个人未来的成功是极端重要的，公共教育应该是联邦追加拨款最优先考虑的对象。美国公众把教育的根本重要性理解为：教育是美满的生活、进步和文明的社会、强大的经济和安全的国家的基础。我们从各州的课程标准及其相关的教育理念中，都可以读到美国民众对教育的高度期望。
　　2001年美国政府颁布的《不让一个孩子掉队》法案就明确指出：美国今天所走的是“一条关注结果的教育改革之路”。这与美国教育提倡实用主义的观念和今天的关注教育质量与效率的现实情况相一致。
　　
　　参考资料：
　　〔1〕Guide to Test Interpretation，Fall 2005 School Year 2005-2006，2005 by State of Indiana Department of Education and CTB/McGraw-Hill，http://www.doe.state.in.us
　　〔2〕Performance Level Tables for the California Standards Tests and the California Alternate Performance Assessment，California Department of Education.
　　〔3〕张维平、马立武著《美国教育法研究》，中国法制出版社2004年版。
　　

教师之友网 · 发表于 2013-1-24 16:35:28

美国斯坦福中小学成就、诊断及英语水平考试的发展和应用

作者：王蜀东焦红发布时间：2011-03-23 来源《考试研究》

【作者简介】  王蜀东、焦红，博士，心理测量研究员，美国Harcourt测评公司。
【摘要】  本文介绍了斯坦福(Stanford)考试系列在美国中小学教育中的发展和应用。着重阐述了三个考试即斯坦福成就考试、斯坦福阅读和数学诊断考试及斯坦福英语水平考试的各自内容，相关的技术和设计原理。
【关键词】  斯坦福成就考试斯坦福阅读和数学诊断考试斯坦福英语水平考试

前言
斯坦福(Stanford)考试系列是美国最早设计的中小学考试及目前应用最广泛的考试之一。第一个斯坦福标准化成套成就考试的出版可追溯到20世纪初(1923年)。目前为止，斯坦福成就考试已经发行到第十版。每一个版本的发展都遵循四个原则。1.更新的内容符合当时教育和课程的发展趋势;2.更新的常模增强考试分数的解释效度;3.增加和改进考试信息的种类;4.修改考试的版面以适应学生的需要。像所有的标准化成套成就考试一样，斯坦福标准化成套成就考试的主要目的是提供有关学生在某一时间所掌握的各个领域的知识。标准化成套成就考试和诊断考试的目的不同。前者的主要目的是测量学生的整体能力;后者着重于测量学生对特定技能的掌握，主要针对低水平的学生。虽然这两种考试的目的不同，但他们却是互补而不是相互排除的。从1966年至今，斯坦福阅读和数学诊断考试已经发展到第四版。这两种诊断考试的主要目的是诊断学生阅读和数学某个方面的优势和不足，从而帮助老师的教学和学生的进步。随着经济和社会结构的变化，英语作为第二外语的在校学生人数与日俱增。为了使这些学生和其他处于经济，社会和生理劣势的学生得到与其他正常学生相同的教育，美国政府于2001年颁布了《一个孩子也不掉队》的法令(NCLB)。斯坦福英语水平考试是目前美国惟一的达到了《一个孩子也不掉队》法令中对英语水平考试要求的考试。此考试的主要目的是测量以英语作为非母语学生的英语水平，从而帮助这些学生学好英语，早日进入英语课堂教学的主流里学习。本篇文章主要介绍斯坦福考试系列中的三个考试(详见:http://harcourtassessment.com)。
一、斯坦福标准化成套成就考试(Stanford Achievement Test Series)
斯坦福标准化成套成就考试是针对幼儿园到高中12年级的学生而设计的常模参照考试。它像其他标准化考试一样，采用统一标准化的考试流程，以确保考试结果不因为时间、地点、考生的不同而不同。考试的质量都以科学数据为依据。本考试有以下五种特征:
(一)考试的发展
对每一年级每一科目的考试、考试手册和其他材料都提供了详尽的考试发展的信息。这些信息包括考试内容和目的、考试常模的建立和发展、信度和效度的特征以及保证考试公正性技术的使用和说明。
(二)考试的施测
保证对每一年级每一科目的考试都有两个以上的等值复本。整个考试的时间需要两到三小时，一般是进行分段考试。每门考试可提供练习试卷。对高年级考生，试卷和答卷是分开的。低年级考生可把答案直接写在试卷上。学生可参加本年级或其他年级的考试。
(三)考试常模的特征
考试常模是依据全美国的样本建立的。本考试提供春秋两季考试常模。常模的样本是分层样本，分层变量包括地区(东北、南方、中部和西部)、社经状况(高、中、低)、城区分布(市、郊、边远地区)、学校种类(公立和私立)和族群(黑、西班牙、白、亚裔和其他)。除此之外，特殊学生也包括在样本抽样中。这些学生包括孤独症、视障、听障、聋哑、发育迟缓、肢体残疾、多种残障、智障、情障、语言障碍、学习障碍、脑创伤及其他健康障碍。常模标准化加权的过程包括三个步骤:一是选择学校的人口统计数据;二是对第一步的数据和问卷调查获得的数据进行统计描述;三是改进样本并对考试分数加权以取得更接近总体特征的样本。加权过程本身主要涉及随机选取学生记录直至获得所需的样本特征。
(四)考试分数
考试可以对每一年级每一科目个人和集体(学校、学区、城市以及各州)提供原始分数(Raw Scores)、量表分数(Scale Scores)和以下几种常模参考分数:百分比(Percentile Ranks)、正态曲线等值分(Normal Curve Equivalents)，标准九(Stanines)、年级当量分数(Grade Equivalents)。考试也可提供成就和能力的比较分，例如，和奥提斯-勒农学习能力测验(Otis-Lennon)的比较。考试也提供内容群集(Content Cluster)和过程群集(Process Cluster)分数以帮助确定学生在某个科目或科目组以及在学习过程中的强势和不足。除此之外，斯坦福也提供与Lexile阅读理解测量的相关数据。
(五)考试分数报告和解释
考试对老师、学校的管理人员及咨询人员提供分数解释手册，并提供分数报告，其中包括班级及学校的分数报告及针对各个学生的总结分析。
斯坦福标准化成套成就考试发展主要包括11个组成部分:初始研究，考试的设计，试题，试卷的设计，质量控制，生产需求，生产的范围，生产周期，终审，研究与发展，数据采集审核及使用。本文只着重讲述初始研究及考试的设计。
1.初始研究
这一步骤主要着重于考试范围及人力物力资源的需求、教育趋势的研究、国家及各州的教学大纲的研究以及国家及各州的教学立法研究。由此开发出有待批准的研究原型。
2.考试的设计
这一步骤主要包括发展蓝图、编写新考试及其审核、完成考试的结构和设计以及设计及生产小组成员的确认(包括生产经理、科目专家、编辑、心理测量专家、技术支持人员、生产协调人员及操作经理)。
除了建模技术以外，斯坦福标准化成套成就考试另外一个最主要的心理测量技术是等值。等值包括横向等值(Form Equating)和纵向量表(Vertical Scaling)。横向等值是对同一科目同一年级不同试卷的等值，以确保两套试卷可以交换使用。纵向量表则是对同一科目不同年级不同试卷的量表化，使同一科目不同年级的考试可以比较。斯坦福标准化成套成就考试的等值技术的设计都是使用相同的学生(Common Person)连接不同的试卷。
斯坦福标准化成套成就考试不单本身满足一般教育市场的需求，还和各州的教育部门合作，发展某州的斯坦福考试或叫做客户化的斯坦福考试。目前测试领域最常用的四种考试设计模型是(Linn,1993)(A)常模参照考试模型(NRT Only)、(B)以常模参照考试为主的模型(NRT
Based: Customized NRT or Augmented NRT)、(C)标准参照考试模型(CRT Only)、(D)以标准参照考试为主的模型(CRT Based)。这四种考试的优缺点如下。
(A)种模型不需附加测试和费用，并且无损常模参照考试的特性。不足之处是标准参照考试的信息受到限制，知识(knowledge)、技能(Skill)及能力(Ability)(总称KSA)的某些方面也许未能测到。
(B)种模型的效度与模型A等值，此模型能提供常模参照考试和标准参照考试的信息。此外还能提供纵向等值信息，使学生学习成绩可以与跨地区跨科目的学习大纲进行比较。与模型A相比，模型B成本较高且费时。常模参照考试的内容有些部分和地方需求无关，在此模型中，标准参照类型部分的试题对常模参照类型试题的影响通常是未知的。
(C)种模型提供充分的本地(学校、学区及省市)信息，测试的施测较简便，对更改教学以适应考试的内容的需求较小。不足之处是常模参照考试特性的效度较低。
(D)种模型与本地需求相吻合，提供有效的常模参照考试分数也是可能的。但是常模参照考试的效度降低了，预测常模参照考试分数的偏性增加了，考试的等值较难完成，并且考试的成本可能增加很多。
鉴于以上考量，客户化的斯坦福标准化成套成就考试通常采用模型B。应用此模型的基本原理是项目反应理论。实施步骤是

1)开发出斯坦福常模参照考试的简化版。此版的内容和结构效度与原版的相吻合;(2)把斯坦福的简化版本和某州的标准参照考试结合起来成为一个试卷。由此而得的分数使每一学生的成绩不单能和学生所在州的教学大纲要求相比较，而且还可以提供这个学生和全国常模的比较结果。
二、斯坦福阅读和数学诊断考试(Stanford Diagnostic Reading Test and Stanford Diagnostic Mathematics Test)
虽然成就考试有可能用于某些诊断的目的，但成就考试提供的诊断信息是很有限的。相对于成就考试内容的范围而言，诊断考试提供更详细的考试内容;而且诊断考试主要针对的是低水平的学生。诊断考试的目的一般有两个(Nitko,2004)。第一是确认哪些学习目标学生还没有掌握;第二是对学生未能掌握学习目标的原因和理由进行分析和解释。如果教师了解学生对哪些学习目标未能掌握，教师可以对症下药地改进他们的教学;反之，教师将不能有针对性地对学生的学习进行纠正和补习。
斯坦福阅读和数学诊断考试就是为了这些目的而产生的。斯坦福阅读和数学诊断考试起始于1978年，到目前为止已发行了四版。斯坦福诊断考试的主要目的是为教育工作者提供一个有效的工具，以诊断学生的阅读和数学的学习状况，给教师提供对教学进行改进和对学生进行分班的信息。
(一)斯坦福阅读诊断考试
阅读困难是最常见的教育心理评估的对象。阅读是一个复杂的行为，包括许多技巧。相应的，阅读诊断考试一般测量阅读的速度、理解、词汇、视听识别、字义技能及运动技能。阅读诊断考试种类繁多，但每种阅读诊断考试测试的内容并不相同。阅读诊断考试的质量主要取决于试题的选择和准备、心理测量技术的质量以及合适的常模样本。
斯坦福阅读诊断考试的主要目的是诊断学生阅读过程的优势和不足。考试包括六个水平，分别由六种颜色代表(红、橘、绿、紫、棕、蓝色)，横跨十一个年级(2到12年级)。它主要针对这些年级学生的阅读能力进行诊断。考试时间为2小时左右，随年级而变。每一年级考试都由两个部分组成:有时间限制和没有时间限制。各年级考试包括不同内容。比如，二年级考以下内容:语音分析(单辅音、复合辅音、浊辅音、总辅音、短元音、长元音、混合元音等)、词汇(词汇阅读、名、动、副、介词、形容词等)、阅读理解(句子、谜语、填空)、短文及提问等;而高中则包括词汇(阅读词汇、同义词、分类词汇、词汇构成、专业词汇等等)、阅读理解、短文及提问、兴趣阅读、原著阅读、功能阅读、初始理解、解释、批判性分析、阅读策略及泛读等。
斯坦福阅读诊断考试提供常模和标准参照考试的两种阅读信息。本考试常模的建立方法与斯坦福成就考试常模的建立方法是相似的。常模参照考试的分数报告也和斯坦福成就考试相似(如Raw Score, Scale Score, PR, NCE, Stanine, Grade Equivalent Score等)。此考试所使用的等值技术(包括横向等值和纵向量表技术)都与斯坦福成就考试的技术相同，在此毋庸赘述。斯坦福阅读诊断考试的校标关联效度是通过此考试与斯坦福成就考试的阅读部分的相关研究而确定的。信度指数由克伦巴赫系数确定，每个年级的考试信度系数都在0.95左右(Wang, Young, & Brooks, 2003a)。
现在考生可自由选择在线考试或笔纸考试。在线考试和笔纸考试是相同的考试，但考试采用不同的媒介。研究表明，此在线考试的信度、内容效度、结构效度(Wang, Jiao, Brooks, Young, 2004)和校标关联效度(Wang, Young, Brooks, 2003b)均达到和超过美国最新的《教育和心理考试的标准》。
(二)斯坦福数学诊断考试
除阅读困难外，数学困难是另一个最常见的教育心理评估的对象。数学是最常用的技能，它包括多种技巧。斯坦福数学诊断考试的主要目的是测量解决数学应用问题之前所具备的基本技巧和概念的能力。像阅读诊断考试一样，此考试有六个水平，分别由六种颜色代表(红、橘、绿、紫、棕、蓝色)，横跨十一个年级(2到12年级)。它主要针对这些年级学生的数学能力进行诊断。考试时间2小时左右，随年级而变。试题有两种形式:多项选择和问答题。二年级的考试科目包括:概念和应用(数字系统、类型和公式、图表、问题解决、几何和测量等)及计算(整数的加减等)。高中的考试内容包括概念和应用(数字系统、类型和公式、统计和概率、图表、问题解决、几何和测量等)、计算(整数和分数的加减乘除、有理数及百分比的运算、数学公式)。总之，数学考试主要强调解决问题的能力。
像阅读诊断考试一样，斯坦福数学诊断考试提供常模和标准参照考试的两种信息。本考试常模建立的方法与斯坦福成就考试常模的建立的方法是相似的。常模参照考试的分数报告也和斯坦福成就考试相似(如Raw Score, Scale Score, PR, NCE, Stanine, Grade Equivalent Score等)。斯坦福数学诊断考试的校标关联效度是通过此考试与斯坦福成就考试的阅读部分的相关研究而确定的。信度指数由克伦巴赫系数确定，每个年级的考试信度系数都在0.90左右(Wang, Young, & Brooks, 2003a)。此考试对每一个科目及子科目提供进度指数。
现在考生可自由选择在线考试或笔纸考试。在线考试和笔纸考试是相同的考试，但考试采用不同的媒介。研究表明，此在线考试的信度、内容效度、结构效度(Wang, Jiao, Brooks, Young, 2004)和校标关联效度(Wang, Young, Brooks, 2003b)均达到和超过美国最新的《教育和心理考试的标准》(1999)。
三、斯坦福英语水平考试(Stanford English Language Proficiency Test)
斯坦福英语水平考试是依据美国当今社会结构的变化和需求孕育而生的。比如，日益增加的移民进入美国社会。根据美国人口调查局的报告，美国从1995到2000年，人口增长12.5%。语言的多样化日益明显。由此而来的后果之一是以英语为非母语的学生主要涌入美国的各个公立中小学。据不完全统计，15%到20%的在校生课外使用外语交流，并不以英语作为他们的第一语言。这些因素都给教育考试带来新的问题。《一个孩子也不掉队》的法令所针对的问题之一就是如何评测这些以英语为非母语的学生在公立学校的学习。改进这些学生的英语水平是很复杂的工作。通常这些学生需要一到两年的时间才能达到用英语流利交流的水平。如果要达到本年级学习的英语水平则需要五年或五年以上的时间。
一般而言，专家确认语言现象是由基本人际通讯技巧和认知学术语言水平两部分所组成的。对这些以英语作为非母语的学生而言，他们的语言可分为两类，一种是社会用语，另一种是学术用语。联邦政府的法令禁止公立学校免除这些学生参加正常的学习考试，并且要求学校提供相应的考试辅助和采用不同的考试形式。对于400万在校的中小学英语学习生而言，联邦政府的希望是在三年之内，他们能像其他学生一样在正常的课堂学习。因此，英语水平考试必须测量与课堂需求紧密相联的有实际意义的英语能力。对于这种特殊考试目的，能否使用合适的考试是一个非常重要的信度和公平度的问题。因此，为确保每个考试的信度，收集考试的信度证据是很重要的。收集证据的方法之一就是对以英语为非母语的学生和以英语作为母语的学生进行英语水平考试，并把他们的分数进行比较，以增加所测量的英语水平的信度。
斯坦福英语水平考试的主要目的是保证英语学习生的英语水平达到理解和流利的语言标准。具体来说，第一，考试应能决定英语学习生是否需要特殊教学指导，并且决定这些学生是否能进入正常课堂里学习;第二，监测这些学生的学习进度;第三是对教学的有效性进行评估;最后就是指导教学。
斯坦福英语水平考试分成四个等级。初级包括幼儿园到二年级，基本级包括三到五年级，中级包括六到八年级，高级包括九到十二年级。听、读和写作常规考试的题目是客观性题目，写和说是主观性题目。从初级到高级考试，考试时间从1小时25分钟到1小时40分钟不等;考试题量从81题到100题不等。考试内容包括听、说、读、写和写作常规。听力考试包括听和问答两部分。听的部分主要包括听句子、段落及文章。对低年级来说，学生选择图画回答所听的内容;高年级学生在听过较长的段落以后再回答问题。说的单项考试是对学生进行个别考试。学生可以阅读或是听录音获取考试指令。考试问题也印在试卷上，学生可以边听边看。两种考题的呈现形式:听和阅读，都是为了减少学生理解的负担。老师对学生答案的评判被录下，学生的回答不录下。阅读考试的目的是看学生是否能从所阅读的材料中得出合理的答案。所阅读文章都是由测量英语学习者英语水平的专家所写。低年级考试采用六篇短文，高年级考试采用四篇长文。所测的理解能力着重于三个方面。其一是学生理解所阅读的详细内容以及内容之间的关系;其二是所阅读内容的意义及其引申的关系;其三是学生依据上下文预测文章中生词和词组的意义。客观题型的写作常规考试的主要目的是测量学生能识别有效写作中所使用的原理，这些包括英语语法结构、识别正确的单词拼法及标点和大小写。主观题型的写作主要测量句子以上的教学标准。这些标准包括词语的选择、句子和段落结构、写作的流利程度等。
此考试有以下几个特征。1.依据研究结果，采纳和年龄相适应的考试内容;2.此考试不光测量学生学习用语的能力而且还测量学生日常生活用语的能力;3.此考试和英语作为第二外语的教学标准(TESOL)和各州的标准相吻和;4.此考试可为学生分班和分级提供测量依据并能用于测量学生学习英语的进度;5.此考试的主要对象是中小学学生;6.此考试的试卷是彩色的;7.考试具有常模并且提供纵向量表。
在此考试之前，学生可选择预考。5分钟的快速预考主要是决定学生是否有参加正式考试的英语水平。预考主要测量听、读和写作。教师使用预先确定好的评分标准改卷。
考试的分数报告分成两大类。第一类包括接收性技能(听和读)和创造性技能(说和写);第二类包括社会性技能(听和说)和学习性技能(读、写和写作常规)。这些分数报告显示学生是否已掌握基本的口语交流和学习所必须的英语技能，以加入到正规的英语教学课堂里学习。
此考试设计依据于二外学习和学习课程与目的的最新研究。考试蓝图包括考试的话题、教学的标准及每个话题下考试内容的比例。考试的标准依据于全国和州立的标准，与这些标准的拟合度超过了85%。参与标准拟合的州如下: Arizona, California, Delaware, Florida, Georgia, Hawaii, Indiana, Mississippi, Missouri, South Dakota, and Texas.
目前针对这一考试进行的研究包括2002年春秋季的试考及2003年春季试考。大约有26个州的70个学区参加了试考。考生的母语包括目前世界上广泛应运的15种语言(Arabic, Armenian, Farsi, Filipino, Haitian, Hindi, Japanese, Khmer, Korean, Mandarin, Polish, Portuguese, Russian, Spanish, and Vietnamese)。
此考试把每个等级学生的英语水平分成五个水平：准预备级，预备级，初级、中级和流利水平。分数线是通过调整的安高夫方法(Modified Angoff method)而决定的。
为确保考试的质量，专门成立了一个考试顾问委员会。此委员会由各种专家组成。其中包括把英语作为二外的测试专家、教育家和研究者、考试标准线设定的全国知名专家、中小学英语学习者的测试专家、著名的语言学家、作者和口语语篇的研究者。这些专家主要对以下方面进行指导和监督，偏性/敏感性的审查、心理测量技术的指导、考试效度的研究、写和说分项考试的框架构成、试题的编写、分数等级和标准的设定。总而言之，斯坦福英语水平考试满足了《一个孩子也不掉队》法令中对把英语作为二外的学生的测试要求，同时达到了对英语学习者进行平等教育的目标。
总结
综上所述，斯坦福考试系列既保持了考试理论发展的传统精华，又融人了考试发展的前沿理论，是测试理论在中小学考试中的具体运用的实例。这些考试对美国从前、现在及将来的中小学教育和考试起着举足轻重的作用。我们相信中国的中小学测试事业也可从中获益。

参考文献：
[1]American Educational Research Association, American Psychological Association & National Council on Measurement in Education. (1999). Standards for educational and psychological testing. Washington, DC: American Educational Research Association.
[2]Linn, R.L.(1993).Linking results of distinct assessments. Applied Measurement in Education, 6, 83-102.
[3]Wang, S, Jiso, H., Brooks, T., & Young, M.J.(August,2004). Construct equivalence between Customized and original Stanford Achievement Reading Comprehension Tests(Tenth Edition)(Research Report).San Antonio, TX: Harcourt Assessment.
[4]Wang, S., Young, M.J., & Brooks, T.(2003a).The Effects of administration mode on students’s performance on the Stanford Diagnostic Reading and Mathematics Tests(Research Report).San Antonio, TX: Harcourt Assessment.
[5]Wang, S., Young, M.J., & Brooks, T. (2003b).Examining the relationship between the reading and mathematics scores of Stanford Achievement Test(Tenth Edition) and Stanford Diagnostics Reading and Stanford Diagnostics Mathematics Tests(Fourth Edition)(Research Report). San Antonio, TX: Harcourt

教师之友网 · 发表于 2013-1-24 16:39:32

采访美国中小学校长：美国家长不太关心考分

图为哈市欧洲新城经纬小学的学生在教美国校长包饺子。

　　生活报11月9日讯 8日，美国中小学校长到哈师大附中、哈市欧洲新城经纬小学等四所学校参观访问。学生们的毛笔字、国画、篆刻作品让他们着迷，学生们亲手制作的元宵、粽子和饺子让他们“爱不释口”。
　　黑龙江新闻网8日讯今日，“汉语桥”美国中小学校长访问代表团的61人对哈师大附中、哈市第18中学、哈市兆麟小学、哈市欧洲新城经纬小学四所学校进行了参观访问。记者随同采访期间，就四个常见教育问题采访了美国校长。
　　美国学生写作业时间多长？一个小时左右
　　“在美国，学生们的学习并不像我们想象中那么轻松，和中国学生一样，他们也要完成一些作业。”来自美国康奈蒂克州亚洲研究学院的麦肯校长说，在他们学校，学生每天8时45分上课，下午4时25分放学，如果学生愿意，放学后还可以留在学校参加课后补习。学生们可以根据自己的兴趣选择艺术、烹饪、阅读等课程，也可以留在学校完成家庭作业。家庭作业一般一个小时左右就能完成，其中包括阅读训练、数学习题和第二天课程的预习等。每年寒暑假，学校会开设数学、阅读的假期辅导班，全校600名学生每年约有三分之一在假期里参加学校的辅导班，另外，也有不少同学会在假期勤工俭学。
　　美国学生如何利用网络？常用来查阅资料
　　来自美国纽约的校长克莉丝汀告诉记者，在美国，学生们对网络的利用率非常高，经常会利用网络来查阅资料，老师也会将课堂内容公布在网络上，以便学生们在课后及时复习和巩固。克莉丝汀认为，中国的学生十分刻苦，而中国和美国在教育方面最大的区别就在于对网络和科技的应用，如果中国的教育能够网络化、科技化，一定可以更好地提高学生的学习效率。
　　“和中国的学生一样，美国学生也很喜欢上网玩游戏，但家长们往往不会阻止。”克莉丝汀说，美国的中小学生多数都有自己的手机，学校虽然不阻止学生们带手机上学，但明确要求学生们不能在校园里使用手机。
　　美国家长咋看待学生考试？不重考分更重收获
　　“相比中国家长，美国家长要轻松得多，尤其是对待孩子的考试，美国家长不会有中国家长那么大的压力。”来自美国宾夕法尼亚州的校长帕梅拉表示，虽然美国家长也认为孩子的考试很重要，但他们更愿意把考试当做检验老师教学的标准，希望通过考试了解孩子学到了什么，掌握情况如何，而不是关心孩子考了多少分。
　　帕梅拉告诉记者，在美国，高中学生可以选择通过考试进入大学，也可以通过自己的一技之长获得大学录取资格，还可以通过读大学预科班提前学习，这样被大学录取会相对轻松一些。
　　美国孩子教育费占家庭收入的比例是多少？通常不超10%
　　在中国，一个家庭对孩子的教育投入往往占据家庭收入的很大一部分，尤其是一些孩子面临升学的家庭，家长更是甘愿为了孩子花下“血本”。然而，记者通过采访了解到，在美国，一个家庭对于孩子的教育投入通常不会超过家庭收入的10%。来自美国纽约的詹姆斯维尔德维特中学校长史密斯告诉记者，美国家庭对于教育的投入因人而异，相对富裕的家庭会在孩子的课后教育上投入多一些，包括让孩子多参加一些社团活动，多出去旅行，以开阔视野。

教师之友网 · 发表于 2013-1-24 16:41:15

中小学比较：美国高考难度相当于我国中考
作者：来源：新安晚报
　　没有排成长队的送考车队，没有焦虑候考的家长，也没有紧张的考生。如果不是教学楼外写着“祝贺美国ACT考试在安徽大学举办”的条幅，几乎没有人知道这里正在和美国同步进行着高考。昨日上午8:00，我省首场ACT考试即美国高考在合肥进行，9位高中生与美国学子一起同步考试，他们的成绩将会成为今后申请美国大学的重要依据。
　　没人送考，也没人候考
　　昨日上午8：00，2012年12月份的ACT美国升学考试即俗称的美国高考准时开始。“家长和学生都很淡定。没有家长在外面候考，也没有人送考，考试结束后学生们也都是自己回去。”安大ACT考试中心的陆老师说。昨天的考场设在安徽大学教学楼的一个教室里，一共9位学生参加考试。记者在现场最大的感受是没有丝毫的紧张氛围。陆老师说：“半年的学习，考生都习惯了独立吧，没觉得这次考试是多么严重的事情。”
　　除了送考外，还有一个现象也出乎监考老师的意料，那就是考生的守时。据了解，美国高考的开始时间并不统一，一般是在一个规定的时段内，等考生到齐了才开始考试，因此正式考试时，有的可能8:10开始考试，有的则是8:15。但是在安徽的首场考试，考生都提前到达考场，所以考试在8:00就准时开始了。“可能中国学生已经习惯了考试守时了吧，这与美国是个很大的差别。”
　　试卷在前一晚空运送达
　　在安徽同步参加美国高考，大家最好奇的莫过于试卷的内容了。事实上除了两位监考老师，其他所有人都没有机会见到试卷的真面目。
　　“试卷是头一天晚上空运到的，都密封得很严实，考试结束后也立刻密封寄往美国。”据了解，此次从美国寄来的试卷一共11份，其中两份是备用卷。
　　和国内高考不同，美国的试卷不是按照科目分开的，而是将考试所有科目都放在一份试卷上，一人一份。因此，除了考生本人，其他人都无法看到试卷。而另外两份备用卷如果没有使用，考试结束后也要原样寄回美国。
　　试卷会不会在快递过程中出现问题？对此，考试中心表示试卷并非通过国内普通的快递公司，而是由美国方面指定某个国际运送机构来负责投递的。昨天中午12:25考试结束后，监考老师就将试卷封存寄往美国。预计成绩将在5~8周内揭晓，届时学生可通过网上查询。
　　试卷不难，数学尤其容易
　　“相对于中国高考，美国高考显得要轻松很多。”吴非同学是我省9位考生之一，他认为轻松的原因主要是因为时间短、机会多、难度低。
　　和国内持续两天时间不同，美国高考的时间就是上午8:00到中午12:25，4个多小时内完成4个学科的考试，分别是语法、数学、阅读、科学，还有“写作”属于选考项目，不计入总分，只是部分名校在录取时需要作为参考。整个上午的考试只有中途大约10分钟的休息时间。
　　机会多是指每年有好几次机会，美国本土一年有6次机会，美国以外地区是5次机会，分别在2月、4月、6月、10月、12月，然后取其中最好的一次成绩。对于首次参加美国高考的9位考生来说，明年2月份将是他们的另一次机会。“下一次考试我还会参加的，看能不能考得更好。”吴非说。
　　“试卷不难”是这次9位考生普遍的感受。“我们考这个试卷，相当于让高中生考中考试卷。”考生董贤文形象地描述了试卷的难易程度。虽然试卷是全英文的，但对于这些考生来说，看懂英文题目是最起码的要求。4个学科中，大家感觉数学最容易，只要读懂题目，基本上没有难度，而且可以使用计算器。
　　大家认为语法和阅读相对较难。“语法的题量太大了，平均30秒就要完成一道题。”董贤文告诉记者，阅读学科的阅读量也很大，涉及小说、科学类论文等，一共四篇，很多时候只来得及一段话里看首尾两句，或者四篇文章选择三篇重点做，“时间来不及，毕竟英语不是我们的母语，阅读起来还是费劲的。
　　不重监考，重学生诚信
　　“国内高考中监考老师是主角，美国高考中考生是主角。”陆老师告诉记者，这其中一个突出的表现是考生的诚信。据了解，每个学科考完后，考生的答题卡并不上交给监考老师，就直接进入下一个学科的考试。这意味着，如果考生想修改前一个学科的答案，是有操作的可能性的。这个时候就完全依赖考生的自觉和诚信。“知道可能有机会修改，但是从没有想过，这是最起码的诚信。”董贤文说，在考试中心学习半年以来，最大的感受是学习和考试中，学生占了主导，“以前是老师催着学生交作业，这边的做法是利用学分考核，学生自己就会主动找老师交作业。”
　　这种学生主导的格局也延续到考场。虽然有监考教师，但是最终还是靠考生自己的诚信。不过，这个诚信也是有制度约束的，因为一旦发现有修改的行为，考生会被立刻驱逐出考场，并且限制当年不得参加考试，诚信记录也将留下污点，这是美国考生们所不敢轻易触犯的。(叶晓、张晓嵘)
　　新闻背景
　　今年3月份，美国ACT考试即俗称的美国高考在安徽首次设立了考试中心，面向高中招生并进行培训。这意味着我省考生不出省，即可和美国高中生同时参加美国高考。ACT成绩被全美包括哈佛大学、耶鲁大学在内的3300多所大学广泛接受作为录取标准，同时，它也是各大学发放奖学金的主要依据。最终全省有9位学生参加考试。

教师之友网 · 发表于 2013-1-24 16:42:09

对美国中小学教育的考察与思考

应城市第一高级中学
段海进

2012年4月22日，在省教育厅精心安排下，我们湖北省高中特级教师代表团一行24人赴美国加州州立大学（北岭）进行了为期21天的教学能力培训。这21天时间，比我们曾经预想的要紧张、充实、新奇、精彩许多倍。我们每一个人都以省示范高中特级教师和学校管理者的身份，聆听讲析，沉浸课堂，观察教学，走访师生，体验活动，反思比较，形成了关于美国中小学教育相对完整而深刻的印象，这印象虽不能象专家学者那样系统深入，科学严谨，但新颖、真实、鲜活、直接。在这里，我愿意把对美国中小学教育考察后的一些感受和体验与大家分享。
一、课堂——美国中小学教育的绚丽之花
之前，我们总是通过一些途经听说，美国中小学课堂上，老师很随意，盘腿坐在桌子上讲课；学生很随便，上课不会一直坐在固定的位置上，经常在教室走动，可以随意做自己想做的事，尤其是老师给学生读书或者类似学生独立阅读的课堂上，学生在地板上坐着躺着都行，甚至还可以上课吃零食。糟糕的课堂，带来糟糕的学习成绩，考试比不过中国骇子等等。这些情况，在我们走访的学校中也确实能看到一些，问及美国学校的校长老师，他们也不否认。那么美国中小学的课堂到底是怎么样的呢？我想就我们的见闻描述一下美国中小学课堂真实情形。
在美国中小学里，每个教室配属给一个教师。教室既是教师的教学的地方，也是教师办公的地方，是教师的“家”，教师欢迎学生来家里交流。教室有人性化的生活设施，如冷水热水龙头和水池，热水用于洗漱，冷水用于饮用，小学低年级和幼儿园还附设有卫生间；有书橱、教学用具用品柜、绞铅笔的机具；有现代化的教学设施、设备，如电话、多台电脑、多功能投影仪等。科学课教室有实验仪器，体育课教室有室内球场，音乐课教室有至少人手一件以上的各种乐器，教学条件是出奇的优越。最值得一提的是，教室四周的教学文化布置，有学科教学标准、教学用图、教学辅助内容，也有学生学科作业、作品展示。教室布置极具特色，作业内容极具个性。作品类别应有尽有，五花八门，富有创意。学生走进教室就像进入学习超市，这些教室文化能从多个角度濡染学生品格，启迪学生思维，激发学生想象，触发学生创新。
在美国中小学里，每个教室只有二三十名学生，学生或分列整齐而坐，或分组相围而坐，或集中席地毯而坐，都是因应教学需要。
在美国中小学里，每个教室坐的不是行政班，而是教学班。学科教师是“座班制”，学生是“走班制”，教师教学的地点是固定的，学生学习的地点是流动的。在美国，每个学生入学，都有一名咨询师根据学生的实际情况为他制定课程计划、发展计划。美国学校的课程设置是具有弹性、灵活多样的。在高中，一般的学校会有三个以上的设置计划供学生选择。一是“杰出毕业计划”，能完成这个计划的学生，会受到美国名牌大学的青睐；二是“推荐毕业计划”，是为准备读普通大学的学生设计的；三是“合格毕业计划”，为学生提供基本的技能培训和基础专业知识，对学生无论是完全就业，还是边工作边去社区大学学习，都能打下良好的基础。
计划不同，目标不同，课程设置不同，深浅层次也就拉开了。每个学生都可以选择适合自己的计划。分管学生工作的主任和课程协调员，他们会根据每个学生的课程计划，给学生电脑排课，记录考勤和学分。
在美国中小学的课堂上，教师的角色很重要。教师要根据课程标准撰写制作质量很高的学案，学案有学习目标、任务，有达到目标任务的教学环节、阅读训练材料和课内外作业。课堂上一般有两个甚至多个教师，一个是主教，一个是助教，助教往往由回母校的大学生或高年级学生充当，大学生藉此获得教学实践经验，高年级学生凭此获得毕业所需学分，课堂上有时还会出现跟踪干预（辅导）教师或特殊教育教师服务特定对象。
教师普遍采用积极性教学，特别讲究教学策略。先学后教，以学定教，精讲多练，扶放结合。着眼于学生未来的学习兴趣和学业发展，特别注重学生动手实践能力、想像创造能力的培养。
在美国的中小学的课堂上，学生始终处于学习的主体地位。学生在课堂上采用自主、合作、探究的学法，特别强调合作。积极主动，饶有兴趣地学习，注重过程体验，注重学习探究的方法，不注重探究结果，享受学习创新的快乐。
在沃恩学校的一节中学化学课上，30名学生分成5组，老师布置任务后，每个学生都拿着铅笔和画纸在翻来覆去的画着什么，开始我还以为是绘图设计之类的课程，一问才知道课题是讲酸碱反应。酸像什么，碱像什么，酸碱反应又像什么，学生发挥联想和想像，用形象思维的方式努力地去表达自己对酸、碱和酸碱反应这些物质与物质变化的认知。这种教学方法如果发生在中国的课堂上，一定会被认为是不可思议的事情。但正是这节课绝妙地反映了两国中小学科学课课堂教育目标的巨大差异，美国的课堂注重让孩子了解科学的基本过程，注重形象感受，中国课堂注重让孩子掌握已有的理论原理，注重结果结论。
至于美国中小学课堂上，学生随意做自己想做的事，课堂秩序混乱失控，这是一种误解和浅见。我们认为这不是课堂混乱无序的表现，应该看作是管理人性化、个性化的体现。沃恩学校陈黎意芳校长在回答这个提问时说，学生在课堂上无论做什么都不能离开学习，边吃零食边做作业，这些是被允许的。我个人认为，学生在动中学，在玩中学，自由随意，只要不离开学习，动动玩玩，总比不动不玩在课堂上睡大觉强百倍。美国学生在课堂上学得轻松，不唯分数，是保持学习热情和兴趣的“热认知”。
再则，自由和纪律总是结伴而行的，没有纪律也就无所谓自由，美国学生开朗活泼、自由奔放，但这种自由背后一定有一个框架约束作为前提。真实的美国教育非常注重纪律，注重规范教育，但美国教师更多时候不会采用专横粗暴的手段来维持课堂纪律，强化学生的行为规范。教师们往往将选择的自由交给学生，让学生学会对自己的行为负责。比如有的学生不合作，不完成作业，老师就会问：“你的选择是积极参与学习、尽快完成作业和大家一起去外面玩呢，还是大家在外面玩的时候，你去校长室反思呢？”将选择的权利下放给学生，并告诉他们不论自己的选择是什么，他们必须对此负责，或享受奖励，或承担后果。在我们到过的三所学校里，每个教室的一角都有一个空位，都是为给高年级犯错的学生在同班学生去玩的时候，到那里反思和补习的，你想想有哪个学生愿意在低年级学生面前“露脸”呢。
二、学校——美国中小学教育的常青之树
美国的教育管理为分权下放式，教育管理的权限归属各州政府。中小学教育主要由各州教育委员会和地方政府管理。各州学制不一，大部分为小学六年，初中三年，高中三年，实行的是12年义务教育。
州以下的市县等行政单位有学区委员会，但学区委员会与市县长无关，可直接到州里获得教育经费。市县学区主任、理事不一定要有“教育”资格，这些职务翻译过来就是督学。
学校，是真正意义的教育机构和教育单位，所以要了解真正意义的美国教育，必须了解美国的学校。
1、办学理念
美国的中小学特别讲求教育平等。每一个学校都有自己的办学思想和办学理念，培养高素质的公民，是美国公立教育的目的之一，是所有的中小学校都必须着力去做的事情，要实现这一教育目标，首先必须保证每个人平等地接受教育的权利。
最能体验美国有平等接受教育权利的是美国的特殊教育。美国没有单独的特殊教育学校，但每一个学校都有一批持有特殊教育证书的教师，对于属于自己学校的智障残疾学生进行教育。学校哪怕只有一个智障孩子，也要有单独的教室，单独的教师和助教。这些资金都来自于政府拨款。美国用在特殊教育上的投资是天才教育投资的10倍。
美国中小学特别追崇“个性”，“独持”等教育信念，并总能找到学生个性化发展成功、学校独特办学成就的正确路径。美国中小学特别注重面向全体学生的艺术教育，而不是面向少数艺术特长生的所谓的艺术教育，让所有的学生在学习过程中受到艺术的熏陶与感染，让不同语言，不同肤色，不同文化背景的学生通过艺术活动增强对不同文化的了解与尊重，从而达到真正的和谐，同时也能让学生在广阔艺术想象中闪现创造的灵光。
美国中小学还特别注重学生的社交能力培养，社交能力的培养融合贯穿于1—12年级所有学科的课堂教学活动中，同时还要作为评估、考核教师的重要内容。
由此可见，美国中小学教育特别能体现教育的社会属性和人文本质，从而能高度有力地服务于国家高素质人才的培养和社会适应性人才的培养。在这些方面，中国中小学要严肃地反思，因为这些恰恰被应试教育严重损毁。
2、校务工作
美国学校的校务管理与中国也有许多不同。
美国中小学的校长非常重要，校长必须获得大学教育管理与领导的硕士学位，必须有教师经历和行管经历，必须接受学区委员会和校董事会组成的挑选委员会的选拔任命。董事会由家长、社会人员、校长和教师工会代表组成，董事会决定学校大事，包括校长的工资。
校长什么都管，有的学校甚至没有副校长，有的学校有一名专管教学的副校长。校长主要是创造好的环境激励每一个教师和学生。学校没有会计，只有一名财务助理，与社会各部门打交道的都是校长。
学校还有一个主管学生的主任，管理学生的纪律、考勤、活动、秩序，学工处有一邦人，但都要有行政管理证书和教师证书。实际上这些管学生的职务都是由老师兼任的。学校各学科也有学科教研组，当组长可以少代一节课。中小学的主任、教研组长轮流当，想当校长必须干两年的管理工作，不感兴趣的当然例外。
3、教师管理
美国中小学教师，要有学士学位，要上教育学院取得“教师证书”，教师证书的取得要通过所有的专业课程的考试，要有45小时的实践经历（助教也算）。在美国，教师有终身制，三年试用期后转为正式教师，现在改为10年试用期。
中小学教师没有职称，教师的待遇逐年递增，学位越高，递增幅度越大，如果有很多成功的教学录像课并经过多种考试，拿到“国家教师证书”，年薪递增幅度更大。
美国中小学教师工作量很大，小学实行包班制，中学实行“座班制”，中小学每天6至7节课，教师的工作标准是每天上5个教学课时。
美国中小学教师平时和学年末要接受教学评估。实习期评估很严格，转为正式教师后相对轻一些，近年来有些学校试行用学生考试成绩评估教师。在美国要严格地检查教师每一节课的教案。
美国中小学教师的职业发展与大学联系紧密。中小学与大学结为伙伴，为教师提供在职专业培训。大学教师深入中学课堂，看教师在怎样做，做得怎么样，然后提供有效指导。大学的“理论”能在中学起到引领方向的作用，大学成为了中学的教练。中小学提出自己的需求，让大学根据具体需要提供战略性和持续性的“受教师欢迎的”在职教师专业发展计划。这一点，值得中国反思借鉴，中国的大学与中学严重脱离，大学的“理论”与中小学的“实践”是两张皮。
4、其它方面
在课程设置上，两国设置的科目大同小异，但课程计的权重和课程教学标准以及教材内容差异很大。美国所开的任何课程都比较广，但不是特别深，注重基本概念。美国高中对学有余力的学生开设了AP课程（大学先修课程）。中国的课程分割性太强，求专求深不求广，高中还分文理科。因此，从小学到大学本科，美国学生的专科知识都比不上中国，但一到硕博领域，美国学生的发展就明显强于中国。
在教学目标上，两国存在着一些较大的差异。例如，美国注重锻炼学生的批判型思维，鼓励学生批判世界，解决问题。中国学生不习惯批判，据说某地一学生将老师在课堂上批判中国文化一事告上了法庭。
在办学经费上，州政府按学生人头拨给公立中小学，学生免费入学外，州政府还给家庭条件较差的学生提供免费午餐。校园面积宽阔，办学条件特好。
在后勤服务上，多实行义工制度，家长要轮流到学校做义工，配合学校管理学生，做清洁卫生和搬运物品等杂工，学生也要做义工，服务学校，帮助有困难的学生，高年级的学生还要帮助老师管理低年级学生。
在考试和应试方面，美国学生与中国学生相差甚远。
三、社会——美国中小学教育的发达之根
在美国有限的21天时间里，教学能力培训之外，我们张开全身的触角去碰触、去感受着一个全新的社会。
美国给人初步的印象是：天空晴朗，空气清新，环境清洁，陌生人相见相互问候，汽车让行人，食品安全，买东西后可以无条件退货，排队自觉等。

如果深入一点会发现：
　　美国是个崇尚民主自由的国度，但法制意识特别强，国民素质普遍较高，很少有人犯法抗法，人们在严格守法的前提下，不愿受更多的约束，生活轻松潇洒。
美国政府强调教育发展的前提是教育经费。美国社会妇女儿童优先。美国的校车反映了美国政府对儿童切实的关爱。
　　美国是个典型的资本主义国家，但是政府很多政策却向穷人倾斜，例如大学助学金的申请，中小学家庭较困难学生的免费午餐。
　　美国人信奉财富来自社会，回报社会，例如比尔盖茨。美国的慈善机构较为完善，从事慈善的人也多。
美国社会办事不兴请客送礼、开后门、递红包之类。美国大学生靠自己的努力和真才实学在社会立足，不靠父母和关系网。
　
美国人特别讲诚信，真实坦率，也特别能包容，平和热情友好。
美国的义工很多，家长轮流到学校做义工，学生自小就接受义工的相关教育并参加义工活动。
美国经济高度发达，科技大幅领先，文化理念超前，发展均衡完善
　　……
植根在这样的社会土壤中，美国中小学教育、学校、课堂特点和优势应该都有答案了。
四、互补——中美教育未来发展的必由之路
由于国情不同和发展差异，两国教育风格迥异，但个有其优势，也各有其劣势。例如，中国教育有完备的课程体系和课程标准体系，且渐趋完善；中国学校，特别是小学，师资力量雄厚，有利于学生多方面和个性化发展；中国的学生注重习惯培养，作业训练规范，学科基础扎实等，这是美国中小学望尘莫及的地方。
但总的感觉是，中美教育似乎走到了各自的极端，如能加强务实合作，实现优势互补，相互参照，把走向极端的方面牵引回适当的程度，不失为中国教育的上上之策。为此，我们对中小学教育提出如下建议：
1、治理超级大校大班，推进教育公平；
2、实行高考分类分层，改革高考制度；
3、注重科学过程方法，突出创新能力；
4、加强教育培训实训，促进教师发展；
5、加大教育投入投资，改善办学条件。
五、结束语
我们一批批地去了解美国，是为了更好地理解中国。和中国社会、中国教育一样，美国社会和美国教育也面临了一些困境，但两国教育各有优势，只要两国加强务实合作，互相取长补短，革故鼎新，一定能找到更加适合自己的教育发展新路！

		自动登录	找回密码
密码			注册

美国中小学考试评价解析

相关帖子