<<  < 2011 - >  >>
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31




发表日期:2010-08-21 阅读全文 (410)

考试成绩的计算和表达
 
可以使用原始分、名次、等级、标准分来表达考试成绩,它们各有优缺点。
看完本文,您还能回答下列问题:
①    根据各科分数,能不能通过数学运算得到一个“综合成绩”(“总分”)? 
②    计算综合成绩,各科分数直接相加 还是乘以一个权重后相加? 
③    山东省曾经用标准分来表达高考成绩,后来又不用标准分了,原因是什么?  
 
1、原始分数的优点是不作任何转换,简单、直观,但有许多缺点,主要是没有可比性和可加性。
 
如果只看某一次考试一科的成绩,即不与其它学科比较,不与以前的考试成绩比较,不进行加减等算术运算,只用原始分数就足够了,原始分数是能够体现学生水平的。如果说原始分数不能代表学生实际水平的话,那是因为考试内容(题目数量、难度、覆盖面、题型等)、形式、方法不适当或不合理。如果考试内容、形式、方法恰当合理的话,原始分数一定能够代表学生的实际水平。如果考试内容、形式、方法不合理的话,不论用原始分,还是用名次,还是用等级,还是用标准分,都不能体现大部分学生的实际水平。因为我们现在只讨论考试成绩的转换和表达,因此,在我们的讨论中,假设考试内容、形式、方法是恰当合理的。 
 
原始分数缺乏可比性和可加性,举例说明:某地2004年初中学业水平考试,地理考试第2000名是87分,生物第2000名是88分;2005年初中学业水平考试,地理87分是第239名,生物88分是第13名。2004年参加考试的考生,到2005年参加中考,而地理、生物仍用2004年的原始成绩,其他考生用2005年的原始成绩,合理吗? 将历年的高 考 录 取 分数线拿来比较一下,会发现什么?
 
某考生,语文85分,数学80分,该考生语文比数学好吗?未必!数学80分可能是全市第1名,语文85分可能是全市第2000名;某个考生,上次考试语文82分,这次考试语文85分,该考生进步了吗?未必,这次的85分可能是全市第2000名,上次的82分可能是全市第20名。由于考试题目难度不同,同一次考试不同学科的分数,1分的“价值”即“含金量”是不同的;同一学科,各次考试成绩,1分的“价值”也是不同的;因此,原始分没有可比性,也没有可加性。根据语文85分、数学80分、外语75分,得到总分85+80+75=240分的计算方法,就像根据人民币85元、美元80元、日元75元,得到总钱数85+80+75=240元一样,没有什么意义。 
 
 
2、名次直观,具有可比性,但没有可加性。每个学科按照原始成绩排名次,同一次考试各学科具有可比性,同一学科各次考试具有可比性,不同学科不是同一次考试也具有可比性。名次没有可加性,不同位置的1个名次,“价值”是不同的。学生甲由50名上升为20名,考生乙由5000名上升为4970名,两位考生都上升了30个名次,但这两个30名的价值是不同的——乙几乎没有什么进步,甲的进步非常大。考生甲语文第1名、数学第5名,考生乙语文第2名、数学第2名,哪个更好?很难说!例如,某大型企业,员工1万多人,年薪第1名300万,第10名50万,第2000名10万,第3000名3万,第6000名2万,将第10名和第6000名分为一个组,将第2000名和第3000名分为另一个组,第一组名次相加:10+6000=6010,第二组名次相加:2000+3000=5000,据此能说第二组比第一组收入高吗?
 


 
3、简单的等级,也就是根据分数或名次直接转换得到的等级,没有可加性。分数是渐变的,等级是跃变的。名次所具备的缺点,等级都有。等级实际上是将原始分或名次“马赛克”化之后得到的,对比度大了(黑白分界更加分明)、分辨率低了(细节少了);在同一个“马赛克”内部,也就是在一个等级内部,各位考生的成绩将不再有任何区别,在不同的“马赛克”之间,区别更加明显;在同一个“马赛克”内部,没有区别了,也就谈不上分数的强化或弱化问题;在不同的“马赛克”之间,差别明显了,也就是分数被“强化”了。
 
例如:假设小于90分并且大于或等于80分的为B等,小于80分并且大于或等于70分的为C等。考生甲80分,考生乙79分。如果用分数表达成绩,两人仅相差1分;如果用等级表达成绩,两人相差一个等级。用等级表达成绩,考生乙就感觉到:我与甲1分之差(80-79=1),却与19分之差具有同样的效果(89-70=19),甲的80分,与89分效果相同,我的79分,与70分效果一样。分数(由许多个1分组成的分数)的作用是被“弱化”了,还是被“强化”了?这不一目了然了!
 
等级没有可加性,如:学生甲语文和数学分别是A和D,学生乙是B和B,哪个学生更好?每个学生每个学科都有一个等级,根据各学科的等级,算不出总的一个指标(等级)。
 
划分等级有三种方法:一是根据原始分数的分布划分等级,二是根据人数的分布划分等级(也就是根据名次的分布划分等级),三是根据标准分的分布划分等级(其实就是根据名次划分等级)。根据原始分数的分布划分的等级,具有原始分数的所有缺点,另外还有“马赛克”化以后所带来的新的缺点。根据人数的分布划分的等级,具有名次的所有缺点,另外还有“马赛克”化以后所带来的新的缺点。
 
等级的表达方式(呈现方式)有:用数值表示的等级(5, 4, 3, 2, 1 等),用字母表示的等级(A, B, C, D, E 等),用一个汉字表示的等级(甲、乙、丙、丁,壹、贰、叁、肆,一、二、三、四 等),用两个或几个汉字表示的等级(优秀、良好、及格、不及格,好、中、差,及格、不及格,通过、未通过,毕业、肄业 等),还可以用评语的形式(一句话)来模糊地表达。只要划分等级的方法相同,并且等级的数量相同,不同的表达方式是等价的,例如:划分五个等级,用A、B、C、D、E表达与用5、4、3、2、1表达是完全相同的。没有参加考试的学生、缺考的学生、虽参加考试但确实是0分的学生,等级如何表示?一般用空格(空白,半角字符空格)表示 或用数字0表示 或用字母Z表示 或用字母P表示,需要单独约定。
 
我们有没有办法用一个指标来综合评价学生的各门文化课的学习水平?也就是说,根据各科成绩,能不能通过数学运算得到一个“综合成绩”?回答是肯定的。学生方方面面、许许多多、千差万别的各项“素质”,我们用一个指标——“综合素质”来评价,是怎么操作的?(想一想“综合国力”)
 
 
 
4、标准分。标准分具有良好的可比性和可加性。
 
(1) 单科的标准分:
 
由原始分求标准分,有两种方法:公式法和查表法。(具体计算方法另文叙述。)
 
根据原始分,利用公式求得相应的标准分,从原始分到标准分是线性变换( y=ax+b ),不改变名次、不改变相对距离。也就是说,用标准分代替原始分没有丝毫失真(如同相片、地图的等比例 放大或缩小、平移一样)。
 
(解释相对距离:如语文考试成绩,原始分数,学生甲、乙相差15分,学生乙、丙相差30分,两距离之比是15/30=0.5。转换成标准分数后,三个学生的分数虽然变了,两个距离也变了,但两个距离的比值保持0.5不变。这就象挂在墙上的地图一样,比例尺变了,地图的整体大小变了,地图中心与地板间的距离变了,地图上各个城市距离地板的位置变了,城市间的距离也变了,但任意两个距离之间的比值保持不变。保持距离不变,就能够保证不会变形。线性变换就是平移与缩放,不改变相对位置和相对距离。)
 
用查表法求得的标准分是一个标准正态分布。如果原始分数的分布不是标准正态分布,那么从原始分到标准分就不是线性变换,虽不改变名次,但改变了相对距离,从而可能改变总分的名次。
 
转换成标准分以后,各科成绩的标准差是相同的、平均值也是相同的,并且每1分的“价值”也是相同的,因此具有可比性和可加性。
 
(2) 总分 (或称为 综合成绩):
 
求“总分”(即“综合成绩”),有两种方法,第一种是原始分相加,第二种是标准分相加。
 
2005年我市中考,用的是原始分相加,总分计算公式是:
 
  语文+数学+外语+物理*0.7+化学*0.5+(政治+历史+地理+生物)*0.4
 
式中,“语文”是语文科目的原始分,其它科目亦然。
 
第二种方法是标准分相加,步骤方法如下:
 
① 各单科的标准分加权求和,得到一个总的“分数”。
 
对于山东高考,文科是:(语文+数学+外语)*1.5+文科综合*3.0
 
对于山东高考,理科是:(语文+数学+外语)*1.5+理科综合*3.0
 
文科综合=思想政治+历史+地理,文科综合=物理+化学+生物
 
式中,“语文”是语文科目的标准分,其它科目亦然。
 
语文、数学、外语三科的原始分卷面满分都是150分,理科综合是300分,各科原始分的平均分是不同的。但是各科标准分的平均分是相同的,因此,各科标准分要乘以一个系数(权重)后再相加。
 
对于中考,公式可能与下式相同或相近:
 
(语文+数学+外语)*1.2+物理*0.8+化学*0.6+(政治+历史+地理+生物)*0.4
 
式中,“语文”是语文科目的标准分,其它科目亦然。
 
 
② 求出其对应的标准分,这就是用标准分表达的“总分”或“综合成绩”。
 
 
 
建议使用第二种方法,即使用标准分。
 
有了用等级表达的综合成绩,那些偏科而总分较高的学生就能被录取了,就不需要靠“推荐”才能录取了。或者说,我们就可以推荐最好的学生,而不是推荐综合成绩中等而偏科严重的学生了。
 
 
 
山东省高考曾使用标准分,后来又不用了,原因有两个:
 
①求各单科的标准分,不是用公式法,而是用查表法,虽不改变名次,但改变了相对距离,从而导致总分名次的改变。
 
②求综合成绩时,不是各单科标准分乘以权重后再相加,而是各单科标准分直接相加,导致各科目所占的比重一样了,与实际情况不符。
 
 
 
标准分的计算方法,另文叙述 http://eblog.cersp.com/userlog2/65453/archives/2008/973254.shtml 。
 
 
 
5、等级的计算方法
 
① 根据各单科的分数(原始分或标准分)求出相应各单科的等级。
 
② 根据用标准分表达的“总分”求出对应的等级,这就是用等级表达的综合成绩。
 
 
 
等级的数量 (分几个等级?)
 
等级是将分数(原始分或标准分)或名次“马赛克”化后的结果。
 
众多的学生,差别大、层次多。如果等级太少,学生的特长表现就看不出来了,就掩盖了学生特点和学校特色。(选拔性考试的目的是 发现和选拔“优”的、或有特长、有特点的学生,优中选优,特中选特。作文满分的,语文满分的,使用等级后,这样的“特殊”考生,类似作文奇才、数学天才的人,就表现不出来的,只是众多A等考生中的普通一员。)
 
等级的数量,多少较为合理?
 
先看看等级最多能有几个,最少能有几个。
 
如果满分是100分,那么等级不会超过100个,再考虑到30分以下的人数非常少,有的分数(如:3分)没有人,所以,如果满分是100分,等级不会超过100个,一般少于100个,通常有60个左右。
 
等级最少是1个。但是,如果只有1个等级,所有学生就没有任何区别了,所以,有意义的等级,最少不能少于2个。毕业证书上写有“成绩合格”字样,看来,对于毕业来说,只有“合格”和“不合格”两个等级就可以了。如果是用于选拔,例如用于招生录取,等级少了就不好操作。
 
等级并不是越少越好。
 
等级也并不是想要多少就有多少,等级数量不可能超过卷面满分的数值。
 
建议:等级不能太少!5~25个等级如何?
 
 
 
                                                                                        明玉有瑕
 
                                                                            二○○六年三月一日
 

  • 标签:引用 
  • 发表评论:
    天涯博客欢迎您!