小學(xué)教育學(xué)(中等師范)全冊(cè)復(fù)習(xí)材料(十九)
來(lái)源:育路計(jì)算機(jī)考試頻道發(fā)布時(shí)間:2008-09-23
第十二章 教育測(cè)驗(yàn)與評(píng)價(jià)——第一節(jié) 教育測(cè)驗(yàn)
一、教育測(cè)驗(yàn)的概念
(一)概念界說(shuō)
測(cè)量是給事物的某種屬性給定數(shù)值的過(guò)程,回答了“有多少”的問(wèn)題。教育測(cè)量包括了從身體身體素質(zhì)到興趣態(tài)度等多個(gè)方面。
測(cè)驗(yàn)是對(duì)于知識(shí)水平、情意狀態(tài)、運(yùn)動(dòng)技能等的數(shù)量化測(cè)定,有廣義和狹義之分。狹義的測(cè)驗(yàn)僅指一份測(cè)驗(yàn)卷子,而廣義的測(cè)驗(yàn)指編制試題、施測(cè)、評(píng)分到報(bào)告成績(jī)的全過(guò)程。在教育領(lǐng)域,測(cè)驗(yàn)只是測(cè)量的一種形式,主要用來(lái)測(cè)量學(xué)生的學(xué)業(yè)成績(jī)和心理特點(diǎn)。如果說(shuō)測(cè)量回答了“有多少”的問(wèn)題,只考察量的大小,測(cè)驗(yàn)則回答了“某個(gè)人做的怎么樣”的問(wèn)題,包含了對(duì)測(cè)驗(yàn)結(jié)果的解釋和評(píng)判。
規(guī)范的考試是教師在教學(xué)過(guò)程中編制試題、評(píng)定學(xué)生學(xué)業(yè)成績(jī)的過(guò)程,如期中、期末考試。它與測(cè)驗(yàn)的區(qū)別有兩種看法。第一種是從教育測(cè)量學(xué)中引出,認(rèn)為測(cè)驗(yàn)更為規(guī)范,從試題編制、實(shí)施測(cè)驗(yàn)測(cè)驗(yàn)到評(píng)分過(guò)程都有嚴(yán)格的程序,而考試則是教師可自行安排,相對(duì)靈活,技術(shù)要求不高的測(cè)驗(yàn)形式。另一種觀點(diǎn)與第一種正好相反,認(rèn)為測(cè)驗(yàn)比較隨意,而考試則較為正式。本書主要采用第一種觀點(diǎn)。
評(píng)價(jià)是對(duì)某種教育活動(dòng)的價(jià)值判斷。評(píng)價(jià)包含定性描述或價(jià)值判斷,更多的時(shí)候是兩者兼而有之。
(二)測(cè)驗(yàn)的功能
測(cè)驗(yàn)具有以下功能:(1)激勵(lì)功能;(2)診斷功能。診斷性測(cè)驗(yàn)主要考察兩個(gè)方面,一個(gè)是看基礎(chǔ)打得好不好,可否滿足學(xué)習(xí)某種新知識(shí)的需要,另一個(gè)是看理解和掌握上有什么錯(cuò)誤及其原因所在,它為教學(xué)提供了豐富的反饋信息,使教師能及時(shí)調(diào)整教學(xué);(3)區(qū)分和選拔功能。升學(xué)考試就體現(xiàn)了測(cè)驗(yàn)的選拔功能,如高考;(4)評(píng)定功能。
二、測(cè)驗(yàn)的類型
從測(cè)驗(yàn)?zāi)康纳峡紤],可以分成安置性測(cè)驗(yàn)、形成性測(cè)驗(yàn)、診斷性測(cè)驗(yàn)和總結(jié)性測(cè)驗(yàn)。從測(cè)驗(yàn)內(nèi)容上考慮,可以分成成就測(cè)驗(yàn)和學(xué)能測(cè)驗(yàn)。從規(guī)范程度上區(qū)分,可以分成標(biāo)準(zhǔn)化測(cè)驗(yàn)和教師自編測(cè)驗(yàn)。從結(jié)果解釋所參照的標(biāo)準(zhǔn)區(qū)分,又可以分成常模參照性測(cè)驗(yàn)和標(biāo)準(zhǔn)參照性測(cè)驗(yàn)。
(一)安置性測(cè)驗(yàn)、形成性測(cè)驗(yàn)、診斷性測(cè)驗(yàn)和總結(jié)性測(cè)驗(yàn)
安置性測(cè)驗(yàn)的根本目的是分班、分組。安置性測(cè)驗(yàn)涉及的范圍比較窄,難度也比較低。
形成性測(cè)驗(yàn)針對(duì)某一教學(xué)單元而設(shè)計(jì),在教學(xué)過(guò)程中進(jìn)行,其目的不在于評(píng)定學(xué)生,而是為了調(diào)控教學(xué)。
診斷性測(cè)驗(yàn)?zāi)軌蚍从硨W(xué)習(xí)中常見的錯(cuò)誤,診斷學(xué)習(xí)困難,特別是找到困難的成因。診斷性測(cè)驗(yàn)的目的是發(fā)現(xiàn)問(wèn)題,評(píng)分不作為正式成績(jī)。
總結(jié)性測(cè)驗(yàn)用于對(duì)學(xué)生學(xué)習(xí)情況的階段性總結(jié)分析。在一個(gè)段落或一門課結(jié)束后,教師會(huì)編制一套試題,全面考察學(xué)生的掌握情況。現(xiàn)行小學(xué)學(xué)科測(cè)驗(yàn)多采用閉卷形式,有時(shí)候也要求學(xué)生完成實(shí)踐性課題。
(二)標(biāo)準(zhǔn)化測(cè)驗(yàn)和教師自編測(cè)驗(yàn)
標(biāo)準(zhǔn)化測(cè)驗(yàn)在試題編制、施測(cè)和評(píng)分過(guò)程中有著嚴(yán)格的規(guī)范。標(biāo)準(zhǔn)化測(cè)驗(yàn)是由測(cè)驗(yàn)專家和教師共同編制的,試題質(zhì)量較有保障。最典型的標(biāo)準(zhǔn)化測(cè)驗(yàn)是智力測(cè)驗(yàn),如“比奈智力量表”。
教師自編測(cè)驗(yàn)是教師自己編制的測(cè)驗(yàn),是在教學(xué)過(guò)程中針對(duì)教學(xué)實(shí)際引用現(xiàn)代測(cè)驗(yàn)原理編制的。教師自編測(cè)驗(yàn)針對(duì)性、靈活性強(qiáng),能反映實(shí)際教學(xué)中遇到的特殊問(wèn)題。
(三)成就測(cè)驗(yàn)和學(xué)能測(cè)驗(yàn)
成就測(cè)驗(yàn)是對(duì)學(xué)生學(xué)業(yè)成績(jī)的檢查,常結(jié)合具體學(xué)科而設(shè)。學(xué)校平時(shí)的課堂測(cè)驗(yàn),期中、期末考試等,都是成就測(cè)驗(yàn)。
學(xué)能測(cè)驗(yàn),又稱學(xué)能傾向測(cè)驗(yàn),它考察學(xué)生在課程學(xué)習(xí)中所獲得的能力,與學(xué)業(yè)成就有較大關(guān)系。學(xué)能測(cè)驗(yàn)不局限于某門課程,關(guān)心各門課程都需要具有一般能力,主要包括文字推理測(cè)驗(yàn)和數(shù)字推理能力測(cè)驗(yàn)。學(xué)能測(cè)驗(yàn)一般在小學(xué)畢業(yè)前進(jìn)行,能在一定程度上預(yù)測(cè)學(xué)生的發(fā)展?jié)摿Α?nbsp;
學(xué)能測(cè)驗(yàn)與成就測(cè)驗(yàn)的區(qū)別在于,成就測(cè)驗(yàn)針對(duì)具體的教學(xué)內(nèi)容而定,著重考察知識(shí)的掌握情況;而學(xué)能測(cè)驗(yàn)的測(cè)驗(yàn)內(nèi)容比較寬泛,側(cè)重于能力考察。
(四)常模參照性測(cè)驗(yàn)和標(biāo)準(zhǔn)參照性測(cè)驗(yàn)
常模參照性測(cè)驗(yàn)是按照在特定群體中的相對(duì)位置決定成績(jī)的好壞。選拔性考試一般是典型的常模參照性測(cè)驗(yàn),如高考。常模參照性測(cè)驗(yàn)要在所定教學(xué)內(nèi)容中,選出一些能區(qū)分出學(xué)生水平的題目,它不一定要面面俱到,但應(yīng)該能拉開分?jǐn)?shù)距離。題目難度以中等為宜,特別難和特別簡(jiǎn)單的題目要少一些。
標(biāo)準(zhǔn)參照性測(cè)驗(yàn)是考察是否達(dá)到了預(yù)先規(guī)定的標(biāo)準(zhǔn),類似于各種執(zhí)照考試,如駕駛執(zhí)照考試。這種測(cè)驗(yàn)只關(guān)注考生是否達(dá)到了應(yīng)該達(dá)到了應(yīng)該達(dá)到的水平,而不去管別的考生怎么樣。確定“合格”或“掌握”的標(biāo)準(zhǔn)是標(biāo)準(zhǔn)參照性測(cè)驗(yàn)?zāi)芊袢〉贸晒Φ年P(guān)鍵。標(biāo)準(zhǔn)參照測(cè)驗(yàn)往往是針對(duì)某幾個(gè)特殊的知識(shí)點(diǎn)而設(shè)計(jì),題目覆蓋面廣,并盡可能把所學(xué)的重要知識(shí)都反映出來(lái)。標(biāo)準(zhǔn)參照性測(cè)驗(yàn)不去刻意拉開學(xué)生間的距離,題目該難就難,該易就易,完全隨知識(shí)點(diǎn)的要求而定。
常模參照性測(cè)驗(yàn)和標(biāo)準(zhǔn)參照性測(cè)驗(yàn)的區(qū)別是:前者著重同學(xué)間的比較,后者關(guān)心有沒有達(dá)到預(yù)定的學(xué)習(xí)目標(biāo)。常模參照性測(cè)驗(yàn)適用于選拔性考試和總結(jié)性評(píng)定;而標(biāo)準(zhǔn)參照性測(cè)驗(yàn)適用于診斷和發(fā)現(xiàn)學(xué)生的不足,從而為改進(jìn)教學(xué)提供反饋信息。 三、良好測(cè)驗(yàn)的標(biāo)準(zhǔn)
好的測(cè)驗(yàn)都應(yīng)當(dāng)符合一定的要求,通常用實(shí)用性、信度、效度、難度和區(qū)分度等指標(biāo)衡量測(cè)驗(yàn)質(zhì)量。
1.實(shí)用性
實(shí)用性反映了試題的基本質(zhì)量,其基本要求是便于組織,便于實(shí)施,節(jié)時(shí)省力。(便于組織。(2)測(cè)驗(yàn)便于實(shí)施。(3)容易評(píng)分。(4)結(jié)果要容易解釋。
2.可信度
可信度又稱信度,指測(cè)驗(yàn)結(jié)果的前后一致程度,表示了分?jǐn)?shù)的穩(wěn)定性和可靠性。具體要求是,先后兩次用同樣的試卷測(cè)查同一批學(xué)生,則兩次測(cè)驗(yàn)的分?jǐn)?shù)應(yīng)該比較相近;對(duì)同樣的答卷組織兩次評(píng)分,評(píng)分結(jié)果相近。如果上述評(píng)分結(jié)果相差懸殊,就表示可信度很低。評(píng)分的客觀性常用評(píng)分者信度來(lái)說(shuō)明。
3.有效性
有效性在測(cè)量學(xué)上也稱為測(cè)驗(yàn)的效度,指一個(gè)測(cè)驗(yàn)?zāi)軠y(cè)到預(yù)先想測(cè)的知識(shí)和能力的程度。估計(jì)測(cè)驗(yàn)效度的方法主要有兩種:(1)內(nèi)容效度,反映了題目對(duì)所考察內(nèi)容的代表性問(wèn)題。(2)效標(biāo)關(guān)聯(lián)效度,反映了測(cè)驗(yàn)分?jǐn)?shù)和所選擇的效標(biāo)分?jǐn)?shù)之間的一致程度。和信度相比,測(cè)驗(yàn)的效度更為重要。因?yàn)樾Ф雀叩臏y(cè)驗(yàn)信度一定高。
4.難度
難度即測(cè)驗(yàn)的程度,提供了試題平均通過(guò)率的信息。一份試卷的難度取決于每一道題的難度。難度用全體被試在某題的得分率(P)表示。如果全部通過(guò),難度為1;如果誰(shuí)都沒有通過(guò),難度為0。難度值在0到1之間,難度值越大,表示題目越容易。高分段人數(shù)少,低分段的人數(shù)多,表示難度較高。高分段的人數(shù)多,低分段的人數(shù)少,表示難度較低。難度中等時(shí),最容易拉開考生間的檔次。不同的測(cè)驗(yàn)對(duì)難度有不同的要求,如選拔性考試難度以中等為宜,否則很難篩選。一般來(lái)說(shuō),某一道試題答對(duì)的學(xué)生少于20%時(shí)便是過(guò)深,答對(duì)的多于80%時(shí)則是偏淺。
5.區(qū)分度
區(qū)分度是測(cè)驗(yàn)?zāi)芊窭_分?jǐn)?shù)距離的指標(biāo)。試題的區(qū)分度也稱為鑒別力,表示某道題目能夠?qū)⒉煌潭鹊膶W(xué)生鑒別開來(lái)的能力。試題難度直接影響區(qū)分度,特別難的題目大家都不會(huì)做,特別容易的題目大家都會(huì)做,這兩種題目區(qū)分度都很低。反之,中等難度的試題的區(qū)分度比較高,難度為0.5的題目,區(qū)分度最大。
四、測(cè)驗(yàn)的編制和實(shí)施
(一)確定試題內(nèi)容
在選擇試題內(nèi)容時(shí),應(yīng)設(shè)計(jì)測(cè)驗(yàn)藍(lán)圖。測(cè)驗(yàn)藍(lán)圖包括確定測(cè)驗(yàn)?zāi)康摹y(cè)驗(yàn)內(nèi)容以及編制雙向細(xì)目表等內(nèi)容。(1)確定知識(shí)點(diǎn)。(2)確定認(rèn)知水平。(3)設(shè)計(jì)雙向細(xì)目表。雙向細(xì)目表是由教學(xué)內(nèi)容和教學(xué)目標(biāo)構(gòu)成的的。
(二)選擇試題類型
課堂測(cè)驗(yàn)的題型有客觀題和論文題兩種。客觀題包括填空、判斷正誤和多項(xiàng)選擇等題型。論文題包括簡(jiǎn)答題和論述題。因?yàn)榭陀^題和論文題各具優(yōu)缺點(diǎn),所以搭配使用效果最佳。
(三)評(píng)分
計(jì)分方法可分為等級(jí)分和百分制兩類。等級(jí)分在中國(guó)隋唐一代就廣為使用,百分制則是20世紀(jì)初教育測(cè)量學(xué)的發(fā)展產(chǎn)物。等級(jí)制的計(jì)分方法除五分制和A、B、C、D、E外,還有許多變形。使用等級(jí)分的好處是避免了在同一分?jǐn)?shù)等級(jí)上同學(xué)間的攀比,會(huì)減輕過(guò)分的分?jǐn)?shù)競(jìng)爭(zhēng)。但缺點(diǎn)在于,等級(jí)分比較粗略,不容易反映個(gè)體間細(xì)微的差別,評(píng)分尺度也較難把握。在評(píng)分時(shí),教師要注意到自己對(duì)學(xué)生的看法可能會(huì)影響到評(píng)分過(guò)程。和百分制相比,等級(jí)制能避免“分分計(jì)較”的學(xué)習(xí)心理,減輕學(xué)生的考試負(fù)擔(dān)。
(四)測(cè)驗(yàn)分?jǐn)?shù)的解釋
分?jǐn)?shù)只有經(jīng)過(guò)解釋具有實(shí)際意義。解釋分?jǐn)?shù)時(shí),既可以和其他同學(xué)的學(xué)習(xí)表現(xiàn)相比較,也可以和考核標(biāo)準(zhǔn)相對(duì)照。分?jǐn)?shù)的意義是在比較中獲得的。如同樣考85分的兩個(gè)同學(xué),其分?jǐn)?shù)值雖然相同,但反映出的水平和存在的問(wèn)題并不完全相同。