計(jì)算機(jī)輔助教育測量與評價(jià)概述
,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,計(jì)算機(jī)輔助教育測量與評價(jià),目錄,1,教育測量與評價(jià)的產(chǎn)生,2,計(jì)算機(jī)輔助評價(jià)的定義與分類,3,計(jì)算機(jī)輔助評價(jià)的發(fā)展,4,第四代教育評價(jià)的興起,1.1,教育測量與評價(jià)的產(chǎn)生,1.1,教育測驗(yàn)的興起,1.2,美國的教育測驗(yàn)運(yùn)動(dòng),1.3,“,八年研究,”,與教育評價(jià)的誕生,教育測驗(yàn)的興起,中國古代科舉考試制度對世界教育、政治、文化,尤其是考試制度產(chǎn)生過重大的影響。,在教育界引起人們對測驗(yàn)問題以極大關(guān)注的是著名的萊斯(,J,M,Rice,)拼字測驗(yàn)。,美國的教育測驗(yàn)運(yùn)動(dòng),教育測驗(yàn)之所以在本世紀(jì)二十年代形成,一種運(yùn)動(dòng),表面是針對論文或考試不客觀,,實(shí)際上,有更為深刻的原因:,自然科學(xué)的發(fā)展,個(gè)別差異的研究與統(tǒng)計(jì)學(xué)在教育上的運(yùn)用,對特殊兒童的研究,美國的教育測驗(yàn)運(yùn)動(dòng),美國的教育測驗(yàn)運(yùn)動(dòng)的發(fā)展可分為以,下三個(gè)時(shí)期:,1904,1915,年的開拓期,1915,1930,年的興盛期,1930,1940,年教育測驗(yàn)運(yùn)動(dòng)的批判期,“,八年研究”與教育評價(jià)的誕生,為了解決高中課程及教學(xué)問題,美國,進(jìn)步主義教育協(xié)會(huì)負(fù)責(zé)人艾欽于,1933,1940,年期間領(lǐng)導(dǎo)了一項(xiàng)長達(dá)八年之久的中學(xué),課程改革運(yùn)動(dòng),這就是美國教育史上著名的,“,八年研究,”,“,八年研究”與教育評價(jià)的誕生,為了評價(jià)其研究成果,組成了以泰勒,為領(lǐng)導(dǎo)的評價(jià)委員會(huì)。通過這場研究,泰,勒和他的同事正式提出了教育評價(jià)的概,念,,即教育評價(jià)就是衡量實(shí)際活動(dòng)達(dá)到教,育目標(biāo)的程度,測驗(yàn)是它的手段。,“,八年研究”與教育評價(jià)的誕生,同時(shí),還提出了評價(jià)的原則和方法,,其基本思想是:,教育是改變?nèi)说男袆?dòng)方式的過程;,教育目標(biāo)是各種行動(dòng)方式的變化;,教育能夠根據(jù)對該目標(biāo)實(shí)際完成情況的分析進(jìn)行評價(jià);,“,八年研究”與教育評價(jià)的誕生,人的行動(dòng)是復(fù)雜的,所以要從各方面進(jìn)行評價(jià),它不僅是分析的,而且也是綜合的;,作為評價(jià)方法僅僅靠用紙和筆的測驗(yàn)是不充分的,應(yīng)該采用包括觀察行為在內(nèi)的更為廣泛的方法。,“,八年研究”與教育評價(jià)的誕生,表,1.1,新舊課程優(yōu)劣之評價(jià)比較,2,計(jì)算機(jī)輔助評價(jià)的定義與分類,2.1,計(jì)算機(jī)輔助評價(jià)(,CAA,)的定義,2.2,計(jì)算機(jī)輔助評價(jià)(,CAA,)的分類,計(jì)算機(jī)輔助評價(jià)(,CAA,)的定義,計(jì)算機(jī)技術(shù)和教育測量與評價(jià)思想的融合促,進(jìn)了計(jì)算機(jī)輔助評價(jià)(,Computer-Assisted,Assessment,,簡寫為,CAA,)的發(fā)展,引發(fā)了評價(jià),內(nèi)容、方法和形式的深刻變革。簡單地說,凡是,借助于計(jì)算機(jī)程序、軟件和設(shè)備進(jìn)行的測試和評,價(jià)都屬于計(jì)算機(jī)輔助評價(jià)的研究領(lǐng)域。,計(jì)算機(jī)輔助評價(jià)(,CAA,)的定義,計(jì)算機(jī)輔助評價(jià)是指在評價(jià)學(xué)習(xí)者的知識、技,能和能力的過程中引入計(jì)算機(jī)作為工具或手段,主,要表現(xiàn)在以下幾方面:,在測試的過程中,傳遞材料、評分以及對測試結(jié)果進(jìn)行分析;,比較并分析通過試卷搜集到的數(shù)據(jù);,記錄并分析學(xué)習(xí)者的成就水平,生成測評報(bào)告;,通過網(wǎng)絡(luò)比較、分析和傳送測評信息。,計(jì)算機(jī)輔助評價(jià)(,CAA,)的定義,就目前應(yīng)用現(xiàn)狀來看,,CAA,支持的評價(jià)類型主,要包括下面幾種:,診斷性,目的是判斷學(xué)習(xí)者對某個(gè)主題的預(yù)備知識的掌握程度。,自測,學(xué)習(xí)者檢查自己對某個(gè)概念或術(shù)語的理解程度。,計(jì)算機(jī)輔助評價(jià)(,CAA,)的定義,形成性,目的是提供反饋來指導(dǎo)學(xué)習(xí)者的學(xué)習(xí),這些反饋表明了學(xué)習(xí)者對某個(gè)主題的知識、技能理解和掌握的程度。在,CAA,中,形成性評價(jià)通常采取客觀題的形式,在測評的過程中或者結(jié)束立即給出提示和反饋。,總結(jié)性,總結(jié)性評價(jià)能夠給出量化分?jǐn)?shù),并對學(xué)習(xí)者在某個(gè)領(lǐng)域的成績做出判斷。總結(jié)性評價(jià)通常是正式的、有組織且有監(jiān)考的評價(jià)形式。,計(jì)算機(jī)輔助評價(jià)(,CAA,)的分類,按傳遞測評內(nèi)容的手段進(jìn)行分類,可以分,為以下三類:,基于試卷的測評,基于計(jì)算機(jī)的測評,基于網(wǎng)絡(luò)的在線測評,計(jì)算機(jī)輔助評價(jià)(,CAA,)的分類,按測評依據(jù)的理論模型進(jìn)行分類,可以分,為以下兩類:,經(jīng)典測驗(yàn)理論,項(xiàng)目反應(yīng)理論,計(jì)算機(jī)輔助評價(jià)(,CAA,)的分類,與經(jīng)典測驗(yàn)理論相比,項(xiàng)目反應(yīng)理論具有,以下兩個(gè)優(yōu)點(diǎn):,題目參數(shù)估計(jì)更準(zhǔn)確;,根據(jù)信息函數(shù)可從題庫中抽取符合被試能力的題目進(jìn)行測試。,計(jì)算機(jī)輔助評價(jià)(,CAA,)的分類,按照測評的題型進(jìn)行分類,可以分為以下,三類:,客觀題測評,操作題測評,主觀題測評,計(jì)算機(jī)輔助評價(jià)(,CAA,)的分類,客觀性測驗(yàn)具有以下一些優(yōu)點(diǎn):,測評是客觀的,評價(jià)結(jié)果具有比較高的可信度;,可以快速地給出評價(jià)結(jié)果;,綜合應(yīng)用多種媒體(圖像、視頻、音頻等),試題的表現(xiàn)形式豐富多樣;,在測試的過程中或者測試結(jié)束后,可以自動(dòng)地提供相關(guān)的反饋;,計(jì)算機(jī)輔助評價(jià)(,CAA,)的分類,可以從題庫中隨機(jī)地選擇題目;,給學(xué)習(xí)者提供靈活的自測機(jī)會(huì);,可自動(dòng)閱卷,節(jié)省時(shí)間,尤其是對大批量學(xué)生能快速測評;,從試題的呈現(xiàn)、學(xué)生答題到閱卷都可以完全由計(jì)算機(jī)軟件完成,實(shí)現(xiàn)無紙化考試。,3,計(jì)算機(jī)輔助評價(jià)的發(fā)展,3.1,從經(jīng)典測驗(yàn)(,CTT,)到項(xiàng)目反應(yīng),理論(,IRT,),3.2,從常模參照測驗(yàn)到標(biāo)準(zhǔn)參照測驗(yàn),3.3,從學(xué)業(yè)成就到能力素質(zhì)測驗(yàn),3.4,從終結(jié)性評價(jià)到形成性評價(jià),從經(jīng)典測驗(yàn)(,CTT,)到項(xiàng)目反應(yīng)理論(,IRT,),經(jīng)典測量理論、概化理論、項(xiàng)目反應(yīng)理論是,當(dāng)今主流。一般說來,現(xiàn)在自編量表的測量理論,基礎(chǔ)都是這三大理論。經(jīng)典測驗(yàn)理論對測驗(yàn)的分,析直觀、具體、適用性廣;概化理論對測驗(yàn)的宏,觀分析能力強(qiáng),適用于測驗(yàn)分析研究;項(xiàng)目反應(yīng),理論在控制測驗(yàn)編制質(zhì)量上,原理科學(xué)、計(jì)量精,確,有廣泛的發(fā)展前途。,從經(jīng)典測驗(yàn)(,CTT,)到項(xiàng)目反應(yīng)理論(,IRT,),經(jīng)典測量理論(,Classical Test Theory,,簡稱,CTT,)形成于,19,世紀(jì)末,主要是以真實(shí)分?jǐn)?shù)模型,為基礎(chǔ),借用普通物理測量的基本假設(shè),采用的,計(jì)算公式簡單明了、淺顯易懂,能夠?qū)y試結(jié)果,做出合理的解釋,并且可操作性強(qiáng),便于在實(shí)際,測驗(yàn)情境(尤其是小規(guī)模資料)中實(shí)施,能滿足,人們對將測驗(yàn)作為一種選拔工具的需要。,從經(jīng)典測驗(yàn)(,CTT,)到項(xiàng)目反應(yīng)理論(,IRT,),概化理論(,Generalizability Theory,簡稱,GT,)較之經(jīng)典測量理論具有獨(dú)特的優(yōu),勢。它利用方差分析將各類誤差進(jìn)行分,解,可辨明多種誤差來源,從而揭示了測,驗(yàn)變異的影響因素和大小。,從經(jīng)典測驗(yàn)(,CTT,)到項(xiàng)目反應(yīng)理論(,IRT,),項(xiàng)目反應(yīng)理論,(Item ResponseTheory,,,簡稱,IRT),的發(fā)展是建立在潛在特質(zhì)理論的,基礎(chǔ)之上的,其主要內(nèi)容就是揭示被試測,驗(yàn)上的反應(yīng)行為與測驗(yàn)所測的被試潛在特,質(zhì)之間的關(guān)系,這種關(guān)系的形象描寫就是,項(xiàng)目特征曲線。,從常模參照測驗(yàn)到標(biāo)準(zhǔn)參照測驗(yàn),盡管在,1913,年,桑代克就已經(jīng)提出了標(biāo)準(zhǔn),參照測驗(yàn),但由于受重視個(gè)體差異文化的影響,,當(dāng)時(shí)大多數(shù)的教育成就測驗(yàn)都是用來比較某個(gè)學(xué),生與其他學(xué)生的成績,直到,20,世紀(jì)后半葉,標(biāo)準(zhǔn),參照測驗(yàn)得以快速發(fā)展。布盧姆的掌握學(xué)習(xí)理論,為標(biāo)準(zhǔn)參照測驗(yàn)的發(fā)展提供了原動(dòng)力。,從學(xué)業(yè)成就到能力素質(zhì)測驗(yàn),1993,年 “少年兒童測驗(yàn)的應(yīng)用,國際進(jìn)步,之路”宗旨是促進(jìn)全世界少年兒童的教育發(fā)展和,教育機(jī)會(huì)的改善,促進(jìn)有效的、真正為教育實(shí)踐,服務(wù)的評價(jià)政策的制定和推行,號召不發(fā)達(dá)國家,開發(fā)測驗(yàn),開展評價(jià),同時(shí)倡導(dǎo)發(fā)達(dá)國家改進(jìn)傳,統(tǒng)的評價(jià)做法,擴(kuò)大評價(jià)的應(yīng)用。,從終結(jié)性評價(jià)到形成性評價(jià),終結(jié)性評價(jià)的目的并不是為了幫助參與方案,的個(gè)體學(xué)生,而是為了決定方案是成功還是失,敗,是繼續(xù)使用、修改還是放棄。形成性評價(jià)與,測驗(yàn)反饋和診斷性功能密不可分。當(dāng)學(xué)生完成了,教學(xué)的每一個(gè)單元或階段,測驗(yàn)成績就能夠反映,他們掌握知識的情況,并告知他們是否達(dá)到了課,程目標(biāo),以及他們在哪些方面需要加強(qiáng)。在教師,的幫助下,可以使用新的補(bǔ)習(xí)材料或方法來促進(jìn),學(xué)習(xí)。,4,第四代教育評價(jià)的興起,4.1,第四代教育評價(jià)的內(nèi)涵,4.2,第四代教育評價(jià)的主要方法,4.3,將評價(jià)融入學(xué)習(xí)環(huán)境設(shè)計(jì),第四代教育評價(jià)的內(nèi)涵,“,第四代教育評價(jià),”,的教育評價(jià)理論,它是由印地安納,大學(xué)教育學(xué)院教授枯巴(,Egong Cuba,)和維德比爾特大,學(xué)副教授林肯(,Yvonna Session Lincoln,)創(chuàng)立的。他們,于,1989,年合作出版了,第四代教育評價(jià),一書,較為系,統(tǒng)地論述了他們關(guān)于教育評價(jià)的觀點(diǎn),依據(jù)各種評價(jià)出,現(xiàn)的先后時(shí)間順序,將教育評價(jià)分為四代,并著重闡述,了他們所定義的第四代教育評價(jià)。他們把教育評價(jià)劃分,為四個(gè)發(fā)展階段,認(rèn)為每一個(gè)階段各有一種理論構(gòu)建。,第四代教育評價(jià)的內(nèi)涵,第一代教育評價(jià)被稱為教育評價(jià)的,“,測量時(shí)代,”,,這一時(shí)代從,1900,到,1930,年。主要標(biāo)志是測量理論的形成和測量技術(shù)手段的大量應(yīng)用,以追求評價(jià)結(jié)果的數(shù)量化、客觀化為主要目的。,第二代教育評價(jià)被稱為教育評價(jià)的,“,描述時(shí)代,”,。這一時(shí)代從,1930,年到,1940,年。第二代教育評價(jià)的主要特征是對評價(jià)結(jié)果進(jìn)行描述。,第三代教育評價(jià)被稱為教育評價(jià)的,“,判斷時(shí)代,”,,大約從,1950,年前后開始,到,60,年代初期。這一代教育評價(jià)的特點(diǎn),是把前兩代沒有涉及到的,“,價(jià)值判斷,”,引進(jìn)了教育評價(jià),并視之為教育評價(jià)的關(guān)鍵,評價(jià)者的任務(wù)不僅是要運(yùn)用一定的測量手段搜集評價(jià)信息,而且還要制定判斷價(jià)值的目標(biāo)與評價(jià)標(biāo)準(zhǔn),運(yùn)用一定手段進(jìn)行價(jià)值判斷。,第四代教育評價(jià)的內(nèi)涵,第四代教育評價(jià)的內(nèi)容可以概括為以下,幾個(gè)方面:,心理構(gòu)建論。,價(jià)值協(xié)調(diào)論。,評價(jià)結(jié)果認(rèn)同論。,應(yīng)答性模式。,對學(xué)習(xí)資源與學(xué)習(xí)過程關(guān)注程度增大。,第四代教育評價(jià)的主要方法,檔案袋評價(jià),檔案袋評價(jià)(,portfolio assessment,),是一種綜合性的過程評價(jià)形式。隨著當(dāng)代,信息技術(shù)的廣泛應(yīng)用,出現(xiàn)了各種豐富多,彩的電子檔案袋新形式,推動(dòng)了檔案袋評,價(jià)的迅速發(fā)展。,第四代教育評價(jià)的主要方法,學(xué)習(xí)契約,學(xué)習(xí)契約(,learning contract,)是學(xué)生,與教師共同設(shè)計(jì)的一種契約,契約中界定,了學(xué)生的學(xué)習(xí)目標(biāo)、達(dá)成學(xué)習(xí)目標(biāo)的方,法、學(xué)習(xí)活動(dòng)進(jìn)行的時(shí)間以及評定學(xué)習(xí)活,動(dòng)的標(biāo)準(zhǔn)等。,第四代教育評價(jià)的主要方法,反思表評價(jià),反思表(,reflective form,)是以問題或,評價(jià)條目組成的表單,可以通過預(yù)先設(shè)計(jì),好的問題,使學(xué)習(xí)者了解到自己學(xué)習(xí)的完,成情況,有效地啟發(fā)學(xué)習(xí)者的反思,從而,增強(qiáng)反思力和自主學(xué)習(xí)能力。,第四代教育評價(jià)的主要方法,表現(xiàn)評定,表現(xiàn)評定(,performance assessment,),就是通過學(xué)生所完成的綜合性的、真實(shí)的,任務(wù)來對學(xué)生進(jìn)行評定,要求學(xué)生運(yùn)用他,們的知識和技能去完成綜合的、有意義的,任務(wù)。,第四代教育評價(jià)的主要方法,動(dòng)態(tài)評定,動(dòng)態(tài)評定(,dynamic assessment,)有兩層含,義,,“,一是跨越多個(gè)時(shí)間點(diǎn)觀察評定學(xué)生的進(jìn)步,與改變情形,了解學(xué)生動(dòng)態(tài)認(rèn)知?dú)v程與認(rèn)知能力,變化的特點(diǎn)和潛能。二是評價(jià)者與被評價(jià)者之間,產(chǎn)生大量的互動(dòng),強(qiáng)調(diào)評價(jià)與教學(xué)結(jié)合,實(shí)施個(gè),體化的診斷評價(jià)與教學(xué)補(bǔ)救。,”,一般我們運(yùn)用更,多的是第二種含義的動(dòng)態(tài)評定。,將評價(jià)融入學(xué)習(xí)環(huán)境的設(shè)計(jì),