(圖片來(lái)源:Pixabay)
一提到評(píng)測(cè), 人們想到的便是考試。一群人坐在房間里,拿著筆在試卷上勾選選擇題的答案。沒(méi)錯(cuò),紙筆考試的確是一種評(píng)測(cè),但它僅僅是一種評(píng)測(cè)的方式。評(píng)測(cè)的本質(zhì),是我們用以理解學(xué)習(xí)者理解程度的方式(how we understand what learners are understanding)。這里的“我們”不僅僅是指教師,還有學(xué)生和研究者。
評(píng)測(cè)的三種類型
形成性測(cè)驗(yàn)(formative assessment):當(dāng)一個(gè)測(cè)驗(yàn)是主要用來(lái)輔助學(xué)生的學(xué)習(xí)時(shí),這個(gè)測(cè)驗(yàn)就是形成性測(cè)驗(yàn)。老師在課堂上的提問(wèn),學(xué)生的家庭作業(yè),都是形成性測(cè)驗(yàn)。形成性測(cè)驗(yàn)?zāi)茏寣W(xué)生檢驗(yàn)自己是否真的學(xué)懂了知識(shí)點(diǎn)。老師也能利用形成性測(cè)驗(yàn)了解學(xué)生的學(xué)習(xí)進(jìn)度,以便進(jìn)行針對(duì)性的教學(xué)。形成性測(cè)驗(yàn)的難度不會(huì)太高,也不會(huì)計(jì)入學(xué)生的最終表現(xiàn)成績(jī)。
總結(jié)性測(cè)驗(yàn) (summative assessment):總結(jié)性測(cè)驗(yàn)是在課程結(jié)束后施驗(yàn),用以評(píng)估學(xué)生究竟學(xué)到了多少東西。期中考試和期末考試都是總結(jié)性測(cè)驗(yàn)。全國(guó)性的高考等考試也都是總結(jié)性測(cè)驗(yàn)。總結(jié)性測(cè)驗(yàn)可以檢驗(yàn)學(xué)生的水平是否達(dá)到了某個(gè)標(biāo)準(zhǔn)。通常來(lái)說(shuō),總結(jié)性測(cè)驗(yàn)的難度比較高。
表現(xiàn)性測(cè)驗(yàn) (performance assessment):表現(xiàn)性測(cè)驗(yàn)是指把學(xué)習(xí)者置于一個(gè)模擬環(huán)境下,以評(píng)判其解決問(wèn)題的表現(xiàn)。比如讓學(xué)生設(shè)計(jì)物理實(shí)驗(yàn),動(dòng)手操作一個(gè)物理實(shí)驗(yàn),然后根據(jù)實(shí)驗(yàn)數(shù)據(jù)得出結(jié)論。這樣就能評(píng)判學(xué)生在該物理學(xué)實(shí)驗(yàn)上的表現(xiàn)究竟如何。表現(xiàn)性測(cè)驗(yàn)既可以是形成性測(cè)驗(yàn),也可以是總結(jié)性測(cè)驗(yàn)。
評(píng)測(cè)真的有效嗎?
廣義地說(shuō),教育領(lǐng)域的評(píng)測(cè)就是以數(shù)字為抽象能力賦值。我們想要以數(shù)字的形式來(lái)表征學(xué)習(xí)者的知識(shí)量,表征學(xué)習(xí)者的能力水平。但是,知識(shí)量和能力水平并不像身高體重一樣,拿尺子和秤就能簡(jiǎn)單地測(cè)量出來(lái)。所以我們需要為這些抽象的能力發(fā)明一把專用的尺子。在心理測(cè)量領(lǐng)域,這些尺子就叫做量表。
我們有抑郁癥量表、人格量表、智商量表等等量表。學(xué)生在學(xué)校里參加的紙筆考試,其實(shí)也是一種量表。托福雅思考試,GRE考試等等,也都可以看做量表。但無(wú)論是哪種量表,我們都會(huì)遇到一個(gè)問(wèn)題,這些發(fā)明出來(lái)的尺子,真的能有效地丈量我們想要丈量的東西嗎?智商測(cè)驗(yàn)得分高的人就真的更聰明嗎?通過(guò)GRE考試的人就真的更擅長(zhǎng)做學(xué)術(shù)研究嗎?
在心理測(cè)量學(xué)中,我們有一個(gè)關(guān)鍵概念,叫做效度(Validity)。它是指測(cè)量工具能準(zhǔn)確測(cè)出我們想要測(cè)量的東西的程度。完美的測(cè)驗(yàn),效度的值就應(yīng)該等于1??稍谒械男睦頊y(cè)量和教育測(cè)量中,都不存在這樣完美的測(cè)驗(yàn)。效度能達(dá)到0.7就已經(jīng)是非常好的測(cè)驗(yàn)了。
或許,我們并不需要完美的評(píng)測(cè)。日常生活中的變量實(shí)在是太多太多,我們無(wú)法將之全部納入考慮中來(lái)。評(píng)測(cè)是我們用以理解學(xué)習(xí)者學(xué)習(xí)情況的輔助手段,它并不是唯一的手段。
通過(guò)評(píng)測(cè)來(lái)學(xué)習(xí)
(Inq-ITS內(nèi)某個(gè)產(chǎn)品的試用頁(yè)面)
Inq-ITS是一個(gè)針對(duì)中學(xué)生的科學(xué)學(xué)習(xí)平臺(tái)。學(xué)生可以在這個(gè)平臺(tái)上學(xué)物理學(xué)、生命科學(xué)以及地球科學(xué)。在這個(gè)平臺(tái)上,學(xué)生需要操作一系列的程序,來(lái)檢驗(yàn)他們提出的科學(xué)假設(shè)是否正確。例如,改變球的質(zhì)量會(huì)不會(huì)改變球在一定距離進(jìn)行自由落體的速度。
Inq-ITS以一種動(dòng)畫(huà)的方式,模擬真實(shí)環(huán)境下的科學(xué)實(shí)驗(yàn)。它同時(shí)也是對(duì)學(xué)生的一個(gè)評(píng)測(cè)平臺(tái)。每次實(shí)驗(yàn)過(guò)后,都會(huì)向?qū)W生反饋其假設(shè)是否正確。而且記錄下來(lái)的數(shù)據(jù)還會(huì)反饋給教師。教師可以以此來(lái)判斷學(xué)生是否掌握了某個(gè)知識(shí)點(diǎn),掌握程度又有多少。Inq-ITS不僅僅是一個(gè)評(píng)測(cè)學(xué)生科學(xué)研究能力的平臺(tái),它同時(shí)也是一個(gè)為學(xué)生學(xué)習(xí)科學(xué)提供幫助的適應(yīng)性的智能輔導(dǎo)系統(tǒng)。
科技的發(fā)展改變了評(píng)測(cè)的形態(tài)。我們可以利用計(jì)算機(jī)評(píng)測(cè)系統(tǒng)對(duì)學(xué)習(xí)者進(jìn)行適應(yīng)性的評(píng)測(cè),利用大數(shù)據(jù)為學(xué)習(xí)者的學(xué)習(xí)情況作出詳細(xì)的描繪和評(píng)價(jià)。教育評(píng)測(cè)可以以游戲的形式進(jìn)行,也可以以傳統(tǒng)的紙筆測(cè)驗(yàn)的形式進(jìn)行。只要它能實(shí)現(xiàn)我們的目標(biāo):實(shí)現(xiàn)更好的教育。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。