自从上世纪末,高尔顿(Galton,F.)、卡特尔(Cattel)、比内(Binet,A.)等人开创智力测验以来,一直在考虑要把由于智能不同而产生的测验分数的不同从由于测验条件不同而产生的得分差异中分离出来。最早的智力测验是以个人为单位来实施的。显而易见,每个人的得分受对此人的测验方法的影响。斯皮尔曼1904年发表了一篇《“一般智力”客观地确定和测量》的文章,正式提出了观测的可能误差问题,并建立了信度系数的概念。这就使人们进一步认识到,测验实施的不同方法会对不同受试人的得分可比性产生影响,因此有必要使测验方法标准化。 标准化考试(Standardized tests)是现代教育测量领域中的一个概念,但是对于这个概念,国际上一直没有一个统一的、简要概述的定义。各个使用测验的机构、研究测验的专家,在解释标准化测验时往往都是从各个不同的侧面对标准化考试加以描述。描述大都涉及命题、施测、评分、分数转换与解释、测验的种类等方面(见由国家教育委员会考试管理中心主编的《标准化考试》)。如R.M.莫伊(moy)认为测验的标准化是一种把原始分数量表转换为稳定的、可检验的、有意义的测量单位的过程。原始测验分数本身并没有固定的意义。它们仅仅是那些无法观测的心理能力的间接指标。测验的使用者要将分数与成绩的外在标准联系起来,才能对分数作出解释和决策。依靠原始分数作决策似乎有些武断而且效果不佳。说某人得了75分,还不如说他的分数居于大学一年级学生的前30%,或说分数代表他掌握整个试题领域的60%更有意义。当提到考试的标准化时,常常要涉及试题的编制、考试的实施、阅卷、评分、分数转换与解释几个方面。前面提到了标准化考试到目前为止还没有一个统一的和公认的概念。国内研究考试的专家和从事考试的实际工作者在吸取国外考试经验的基础上,给标准化考试下了这样的定义。标准化考试是“一种按系统的科学程序组织,具有统一的标准,并对误差作了严格控制的考试”。考试标准化包括试题编制、考试实施、阅卷评分以及分数转换与解释等四个环节。 |