正文

关于考试

十九札 作者:朱青生


 

写信时间

    2000年4月20日

主题

   考试

关键词

   考试四法

内容提要

   选择:考验和互相较量

   达标:设定标准的到达

   检验:规定内容的掌握程度

   发挥:显示实力

收信人

   刘平 张欣

刘平、张欣:

你们刚刚经历了考试,无论结果如何,亦得亦失而已。

开学数周,课程展开,大家关心本课的考试,我对同学们说,将会按讲义的基本知识部分,列出20道选择题,每题a、b、c、d四个选择答案。答卷完成后,我将把所有500份卷子摞齐了,在每题的正确答案的号码上,用一根大钉子钉下去,填对号的就被钉过,得分。其实我和同学都觉得略有荒唐,一个艺术课程,十几个欣赏的傍晚,天下大作,相与分析;玄谈妙想,感悟体会,一待经过,就是“通过”了一段美育,也就通过了这次课程。各人自我修养,按其秉赋本性生发开去,尤其在座者与我以心相印,根本无以言表,不堪诉说,怎么可以用些什么知识概念来衡量评价?在北大,每位同学只有一次(2学分)的艺术课程中,知识就象糖果纸,课程面授过程就如糖果,真正传达交流的是那种甜味,糖果有时已是多余,因为它带来某种负担,糖果纸更是包裹运送糖果之外皮。庄子说“得鱼而忘筌”,持执尚在鱼也。如果得了鱼,就着水炖出一锅浓汤,尝尽鲜美,鱼亦须忘。但是期末考试却要把糖果纸拿来展玩,就只配用大铁钉钉一下了。

本来北京大学是个治学要求勤奋、严谨、求实,教课追求自由、创新的胜地。近年来考试有了一种规定,都以百分制结算,艺术课程都要闭卷(实际是把艺术课程规定为艺术学课程),分数要“正态分布”,似乎一个课程,无论全体师生多么努力,都要挤出几个不及格或勉强及格者;反之,无论师生多么敷衍,也要选出几个优异的高分得主。教务管理部门的出发点是用严格考试提高教学质量,这大概是没有办法的办法。如果大学的教授是公开聘任,权威学术委员会(本专业教授和校长组成)和受教育者(学生与其他人员组成)流动选择,再由教授尽心尽力负责治理教学,教学质量必然提高。而用考试来监督、制约教师和学生,像在北京大学这种地方,学生都是英才,是久经考场的得“道”之辈,对付考试,已在中学应试教育中将各种伎俩练就,教学中越把重点放在考试分数上,他们就越有对付的办法。如果用单一“闭卷—百分制—正态分布”的方法考我教的艺术课程,肯定是从未听课而会抄背书上条文的学生得高分,或者听课马虎,重知识而轻思想、轻感受的人得高分,而真正有会于心,感应相交的学生,分数无以显示他们的成绩,也许他们反过来会觉得在这种考试中得高分是其不屑所为。

但是,我们可以不考试来组织大学教学吗?这个问题是不能问的。最多可以恢复北京大学八十年代的考查制,选了艺术课程,就是“合格”,不选不合格,就象晨练,围着未名湖绕圈圈,跑过了,就合格。

考试是组织教学的必要手段,除了晨练和艺术课程可以考查通过之外,应该根据教学组织的确切需要来设置。至少可以分为4种:1. 选择;2. 达标;3. 测验;4. 发挥。

1.选择考试目的是选拔,使用的方法是考验和较量。比如你们报考艺术学系研究生,80人报名,选取10名,所有80人各人总分多少,平均分是多少都无意义,关键是要考验这80人中最优秀者(或者说最符合艺术学研究需要的前10名)。试题应该让80人能够充分显示出:

(1)科研能力(理性的质量);

(2)学科基本知识;

(3)科学方法的掌握程度;

(4)对艺术品的感觉力。

如果试题出得恰当,80人都可以尽力显示,在各个方面清晰地拉开距离,再由各方面综合考虑而选择人选。这时出具的考题,就要有很高的测试机制,也就是原则上是80个人的各个人的水平都能因此而得到区别,被试者应该分别各得1分—80分(或20分—100分)。虽然数人可以完全不分高下,得同一分数,但试题应该尽量变换精度,使大体不分高下者,可微见分别。设80人都是高手,可考到80,80.2……到90分之间,这是正态分布之真正意义所在。如果试题有所偏颇,就无从达到期望之目的,使测试者与被试者怅憾。这种类型的考试与大学统考、选拔官员,选拔运动员一样,就是让被试者相比。在大学中此种考试只用于选拔,而不必用于教学。

2.达标考试的目的是分段推进基础训练,使用的方法是确定标准,公布成绩。比如你们在体育课上要跑、跳、投、掷以达到规定指标,英语分四级、六级、托福、GRE等。如果一组同学人人都能达到标准,就人人都合格;无人达到,就无人合格,不存在什么“比例”,因为标准是法则,不可动摇和臆改,否则此基础训练的所有进程和分段原则将会混乱,失去了此种考试的本来意义。达标也可以采取百分制,比如我有一次公选课,预设知识项五十种,作为这段教学的训练标准,要求同学掌握,当时300多个同学选课,唯我们系同学最认真,十多个同学掌握90%以上的知识项,所以尽得90多分、100分,而有些同学专业较忙,只求过关,也有只掌握其60%者,故得60、70分。成绩报上,主管教学的一个主任来找我,让我改掉艺术系同学的成绩,质问:“哪有学生可以得100分的?”我就反问:“哪有学生不可以得100分的?”又质问:“为什么不按比例正态分布?为什么没有不及格的?”我反问:“这一班学生在这次课上恰巧人人这么努力,为什么要有不及格的?”后来他说是学校教务处的规定,我只好去教务处谢罪,但成绩不改。也许,教务处认为艺术学课程不是达标考试的对象,而我把普通艺术教育设计了一个分段等级测试方法,公式为:年龄×年级×专业参数= 知识掌握量(对小学、中学也可适用),所以在我的教学中,都使用了达标考试。

3.测验考试的目的是检测本课教学的效果。根据教学规划和教学大纲,一门课的教学目的是预先设定的,这个目的不能以教师的主观意志为根据,而是由他负责执行教学规划。教学规划为一个大学专业学生整体(平均)的学习目标和能力、知识指标而给出有理由、有证据的纲领,其中包括本门课在整体结构中的功能和目的。这个目的必须受整体教学规划和教学大纲的约束,受到管理部门和学生的稽查,所以每门课都应公布教案(我1995年回国后已经开设了17 门课,全部有教案,打算在系网页建成后,全部公布在网上以便稽查),这时测验考试才有根据。将设定的教学目的在一学期的教学之后加以测验,记录学生掌握了所授内容的百分之多少,记为百分制。

这种测验考试是大学教育中最普遍的方法,因为它是整个科学系统传授过程的质量控制。北大现行的测验考试已经出现“腐败”,就是教师成了专制的一方,他/她自己编制一个教材,这个教材从未受到本行专家委员会的委托、仔细推敲和认定,所以以此为基准来考试学生,尚未取得合法性,也就是说,本门学科的知识和方法在教材中应该是“公认”的(经过科学反复检验和权威机关审定的),这样学生才能以此为根据,作为学习的依靠。否则,学生就会偏依一人之见,而遮蔽学科之公理。因为学生没有资格挑选教材,更没有权利臧否教师(正在推行的教学评估因为无同类型可比性,而是每课单独答问,结果有可能教的不够水平的课“看起来”很好,而极严格认真的高水平课“看起来”反而不如前者),所以只能对付考试。最常用的办法就是请求教师出具复习范围,有两天一夜背会,立即迎考。我常常想,这样也是个办法,以后一门课上两天一夜就够了,大学效率提高,何必大家胡混?

4.发挥考试的目的是测试学生的本门课程的科研能力和相关知识,使用的方法是学期论文或面试。学期论文是以结果评价,所以可以花很大的时间和精力来增加论文的分数。(具体学期论文的要求见《关于科学语言》一信。)面试是互动性测试,考试是为了全面考查受试者,以及他的判断、应答能力。这时教师的主观成份很大,只能凭感觉评价,所以面试常常考的不是学生,而是考查师生的关系,即佛教中常说的“缘份”。

对于大学的考试,无论上述四种中的哪一种,都是以现有的知识为标准的,即使是发挥考试,也要符合一般的学术规范和本门学科的知识范围。假设一个学生的才能和知识的掌握超出了现有规范和教师所掌握的知识范围(在计算机联网、数据库广泛进入教学后,这种事情通常会发生),考试非但不能测试出学生的实际水平,相反,还会是非混淆,所以,一切考试将受到怀疑!

作为教师,我采用过一种考试,就是刘平参与的,让受试者在与试者(我)对话中,用各种方式显示与我的区别。区别越大,得分越高。另外的教师小组(白巍老师和高译老师)根据录相带评分,我不参与。这种方法彻底颠覆了考试的通常规则,考试不再是老师考学生,也不是教师与学生同时受到测试(教学普查),而是使考试成为一次学习的机会,创造的机会,融会的机会和觉悟的机会。我不能把这种创造考试列为第5种,因为它太不能为一般的教学系统所容,权且把它作为一种艺术。

对于学生,不对付考试是无能的表现,应该认清考试的本质和各自不同的目的和方法,甚至了解主考教师的学养和秉性,有的放矢,克服考关。只是你们不要把考试成绩作为衡量学习成果的唯一标准,尤其不要让别人以考试成绩所作的评价左右你们对真理的追求。

即此 祝

进步     

朱青生

2000年4月20日.


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号