[摘要]命題工作是教育考試的核心環(huán)節(jié),命題工作需要教學(xué)經(jīng)歷、命題經(jīng)驗(yàn)支持;命題工作更需要命題技術(shù)、教育測量理論的支撐。本文根據(jù)現(xiàn)代教育測量理論對命題工作開展研究,從正向和反向提出命題工作應(yīng)堅持的相關(guān)原則。
[關(guān)鍵詞]教育測量理論;教育考試;命題
教育考試屬于教育評價的一種常用形式,教育評價有形成性評價、過程性評價、終結(jié)性評價等多種形態(tài)。現(xiàn)代教育測量和評價理論的興起和發(fā)展對教育考試工作提供了直接的科學(xué)理論指導(dǎo),有力地促進(jìn)了教育考試工作的科學(xué)發(fā)展。
大規(guī)模的教育考試,一方面,希望命題遵循和符合課程標(biāo)準(zhǔn)要求;另一方面,還希望學(xué)生通過對問題的分析和解答真實(shí)反映他們所掌握的知識和所具備的能力。以上兩方面是教育考試的內(nèi)在需要,但它們往往受到很多現(xiàn)實(shí)問題和不確定因素的制約和影響。如課程標(biāo)準(zhǔn)規(guī)定的培養(yǎng)目標(biāo)不一定都是可測的,即使是可測目標(biāo)也受紙筆考試形式和考試時長的限制等。
近十年來,我們對項(xiàng)目反應(yīng)理論等現(xiàn)代教育測量理論開展了系統(tǒng)的學(xué)習(xí)和深入的研究,并在武漢市初中畢業(yè)生學(xué)業(yè)水平考試等大規(guī)模教育考試命題及數(shù)據(jù)分析處理工作中嘗試有機(jī)地運(yùn)用相關(guān)理論及其模型,并建立了相應(yīng)的工作機(jī)制陽。本文結(jié)合實(shí)踐對大規(guī)模教育考試命題工作從理論和技術(shù)層面進(jìn)行分析,從正向和反向提出命題應(yīng)遵循的有關(guān)原則。
一、基于教育測量理論應(yīng)遵循的幾個基本原則
根據(jù)教育測量相關(guān)理論,為了保證考試學(xué)科試題良好的信度和效度,也為了保證學(xué)科試題適宜的難度和一定的區(qū)分度,理論研究者和學(xué)科命題專家對試題設(shè)計的程序和方法開展了有益探索,形成既有理論上創(chuàng)新又能指導(dǎo)命題實(shí)踐的豐富成果。與此同時,理論研究者和學(xué)科命題專家也不斷歸納和提煉,形成了指導(dǎo)命題工作的關(guān)于試題設(shè)計的系列基本原則,如適綱性原則、科學(xué)性原則、導(dǎo)向性原則等。根據(jù)項(xiàng)目反應(yīng)理論,結(jié)合大規(guī)模教育考試命題實(shí)踐,在此我特別提出以下幾個補(bǔ)充性原則。
1.能力立意原則
能力立意原則包括:依據(jù)課程標(biāo)準(zhǔn)構(gòu)建對學(xué)科能力清晰、完整的認(rèn)識,建立學(xué)科能力結(jié)構(gòu)圖;學(xué)校教育依據(jù)課程標(biāo)準(zhǔn)和教材及學(xué)科能力結(jié)構(gòu),構(gòu)建學(xué)科能力的行為特征目標(biāo)系統(tǒng);教育考試以能力考核為主要目的,通過考查知識實(shí)現(xiàn)考查能力;教育考試命題以考查學(xué)科思維能力為核心,全面考查各種能力,強(qiáng)調(diào)能力考查過程的綜合性和應(yīng)用性,強(qiáng)調(diào)考查過程和內(nèi)容的適度開放性。
自20世紀(jì)中葉心理學(xué)家開始進(jìn)行能力測量研究以來,對能力形成及其構(gòu)成和測量的研究一直沒有停止過。特別是伴隨腦科學(xué)研究的深入、信息化技術(shù)的廣泛應(yīng)用對能力和要素的認(rèn)識越來越深刻,測量理論越來越豐富,測量的技術(shù)和方法也日益完善和成熟。但因?yàn)殛P(guān)于能力的認(rèn)識具有明顯的間接性和主觀性,所以對能力的認(rèn)識也常常包含一定程度的分歧,即使對學(xué)科能力要素及其構(gòu)成也存在認(rèn)識上的分歧。雖然如此,但人們一致認(rèn)同學(xué)校教育應(yīng)該培養(yǎng)學(xué)生的學(xué)科思維能力、創(chuàng)新精神和實(shí)踐能力;認(rèn)同大規(guī)模教育考試應(yīng)該突出能力和素質(zhì)導(dǎo)向;認(rèn)同知識與能力互相依存,能力在學(xué)習(xí)活動中逐步形成和發(fā)展,能力也在學(xué)習(xí)活動中通過認(rèn)識與行動表現(xiàn)出來。
在大規(guī)模教育考試中如何有效測量能力是一個頗具挑戰(zhàn)性的問題。凱諾爾認(rèn)為,“教育考試是一個通過設(shè)計的過程來誘導(dǎo)學(xué)生表現(xiàn)出某種行為,從而推測考生具備某些心理特征”,考試所獲得的行為樣本要與期望考查的能力之間具有匹配特征,并且兩者要可量化考核。
由于不同學(xué)科能力要素及其培養(yǎng)目標(biāo)差異較大,所以對能力的研究、考查要充分結(jié)合學(xué)科特點(diǎn)和規(guī)律來進(jìn)行。另外,由于學(xué)科能力因素的復(fù)雜性,能力立意原則的應(yīng)用也要綜合考慮學(xué)科能力的構(gòu)成因素、呈現(xiàn)形式、依存載體及其內(nèi)在聯(lián)系。總之,能力立意要通過素材、知識、應(yīng)用烘托反映出來,并且考試結(jié)果可量化分析。
2.內(nèi)容聚斂原則
內(nèi)容聚斂原則主要包括:學(xué)科考試內(nèi)容的抽樣向?qū)W科基礎(chǔ)性知識、關(guān)鍵性知識和主干內(nèi)容聚集;立足學(xué)科,在學(xué)科內(nèi)知識點(diǎn)的綜合呈現(xiàn)處設(shè)計試題,考查學(xué)生用綜合應(yīng)用知識(點(diǎn))來分析和解決問題的能力;創(chuàng)新情景在學(xué)科思維和方法交叉層面設(shè)計問題,通過此類具體問題考查宏觀、抽象層面的學(xué)科思維能力。
由于學(xué)科知識內(nèi)容豐富,有的學(xué)科知識點(diǎn)分布達(dá)數(shù)百之多,教育考試不可能覆蓋所有知識點(diǎn)。因此,教育考試對內(nèi)容的選擇必須通過抽樣來實(shí)現(xiàn),而內(nèi)容的抽樣應(yīng)該盡可能提高覆蓋率。如何提高考試內(nèi)容的抽樣覆蓋率和典型代表性,向?qū)W科基礎(chǔ)性知識、關(guān)鍵性知識和主干內(nèi)容聚斂是有效的策略。因?yàn)閷W(xué)科核心的基礎(chǔ)性知識、關(guān)鍵性知識是必須要掌握的,也是必須要考查的,只不過是需要變換考試的題型和知識載體而已。學(xué)科主干內(nèi)容是形成和支撐學(xué)科知識體系的骨架,它決定學(xué)科知識系統(tǒng)和學(xué)科理論的整體性和完備性。同時,也決定了學(xué)科主干內(nèi)容的特殊地位和作用。
學(xué)科內(nèi)有些知識內(nèi)容通過素材、情景、問題或方法可建立一個整體予以考查;還有的可以通過分層次考查來逐次綜合,在知識綜合過程中自然滲透考查能力。對學(xué)科思維和方法相對具體的學(xué)科知識而言屬于比較抽象的知識內(nèi)容,對學(xué)科思維和方法類的較高層次的知識,無論其知識的領(lǐng)會與理解,還是其知識的鞏固和掌握,乃至其知識的內(nèi)化與應(yīng)用對學(xué)習(xí)者要求都比較高。因此,對此類問題的考查能較好地測量和區(qū)分學(xué)科思維能力。
在命題時,首先可編擬包含知識能力等要素的雙向或多維細(xì)目表;然后根據(jù)學(xué)科知識與能力細(xì)目表研究如何在學(xué)科命題中依據(jù)內(nèi)容聚斂原則來設(shè)計試卷和試題。
3.創(chuàng)新性原則
創(chuàng)新性原則主要包括:對學(xué)科試題的內(nèi)容、形式、問題等創(chuàng)新設(shè)計,防止出現(xiàn)雷同試題;通過創(chuàng)新試題考查學(xué)生學(xué)習(xí)的潛能,考查其學(xué)科創(chuàng)新思維能力;通過創(chuàng)新問題考查學(xué)生的創(chuàng)新意識。
大規(guī)模教育考試是周期性進(jìn)行,對學(xué)校起著教育的反撥和引導(dǎo)作用。所以,大規(guī)模教育考試要保持適當(dāng)?shù)倪B續(xù)性和穩(wěn)定性。但是強(qiáng)調(diào)連續(xù)和穩(wěn)定又必須防止僵化和模式化,因此處理好穩(wěn)定和創(chuàng)新的關(guān)系既是現(xiàn)實(shí)需要,也是命題工作的技術(shù)要求。
教育考試命題對情景的創(chuàng)新、選材的創(chuàng)新、設(shè)問的創(chuàng)新是第一層次的創(chuàng)新;對試題結(jié)構(gòu)的創(chuàng)新、試題立意的創(chuàng)新是第二層次的創(chuàng)新;考查創(chuàng)新意識或結(jié)合知識、能力來考查創(chuàng)新意識是最高層次的創(chuàng)新。在命題實(shí)踐中,我們嘗試命制開放性問題、測試學(xué)科高端認(rèn)知技能,使用真實(shí)情景材料引導(dǎo)學(xué)生關(guān)注生活和聯(lián)系實(shí)際解決問題、預(yù)測學(xué)科學(xué)習(xí)潛能等,教育考試的實(shí)際結(jié)果分析證明其效果不錯。創(chuàng)新是必要的,但創(chuàng)新必須尊重和符合現(xiàn)實(shí);創(chuàng)新要有度,要防止異化,比如繁難偏怪、拐彎抹角、牽強(qiáng)附會等;創(chuàng)新要有技術(shù)支撐,比如有意義的情景、可測可評的試題結(jié)構(gòu)模型、創(chuàng)新思維的要素呈現(xiàn)形式等。
二、基于反向控制思想的反向控制原則
教育考試命題是一門學(xué)問,命題管理是一門藝術(shù);將教育測量理論與學(xué)科教育理論有機(jī)結(jié)合是一門科學(xué)。命題過程中既要按教育測量規(guī)律遵循一定的程序和格式,比如編制學(xué)科多維細(xì)目表、預(yù)測試題難度等,也要防止將教育測量理論玄學(xué)化、虛化。如果教育測量理論與學(xué)科教學(xué)理論分離必然會形成兩張皮現(xiàn)象,兩者不有機(jī)結(jié)合其科學(xué)性就沒有保障,對試卷和學(xué)生學(xué)習(xí)水平及能力的評價就沒有根基。
命題過程中,既要遵守既定的命題工作規(guī)程,堅持按制度、按程序工作;又要確保命題專家獨(dú)立思考、獨(dú)立判斷,發(fā)揮命題專家的創(chuàng)造性和智慧。同時,命題過程中,既要合理分工,讓命題專家集中精力思考和創(chuàng)造,又要學(xué)科內(nèi)相互協(xié)作,確保充分交流、充分質(zhì)疑,服從大局、達(dá)成共識。大規(guī)模教育考試試題是命題專家創(chuàng)造性勞動和相互協(xié)作的結(jié)晶。命題工作是一個既堅持個人專業(yè)觀點(diǎn)又合理妥協(xié)達(dá)成共識的過程。
為了確保命題工作安全、公正、科學(xué),特從實(shí)踐層面提出以下反向控制原則。
一是有宗教色彩和涉嫌各種歧視的材料堅決不用。歧視包括性別歧視、年齡歧視、地域歧視等。背景資料、試題素材不應(yīng)選擇帶有歧視觀點(diǎn)的材料,防止有傳播不正確價值觀的嫌疑,也防止影響考試公正、公平。
二是超出課程標(biāo)準(zhǔn)范圍的知識原則上不涉及。學(xué)科命題涉及的知識應(yīng)在課程標(biāo)準(zhǔn)和教材范圍之內(nèi),但對能力的考查可突破其限制。對課程標(biāo)準(zhǔn)和教材沒有要求的知識如果要涉及一定要有交代,要有所涉及知識及過程的介紹。如數(shù)學(xué)學(xué)科可以定義一個課標(biāo)和教材上沒有的新運(yùn)算來考查學(xué)生的理解和運(yùn)用能力。
三是偏離社會發(fā)展主流價值取向、有悖常識和違背科學(xué)的素材堅決不使用。社會主義核心價值觀倡導(dǎo)堅持以社會為本位,堅持集體利益,而西方價值觀是個人為本位,以個人自由為出發(fā)點(diǎn)。命題素材要堅持弘揚(yáng)社會主義核心價值觀,要堅持多選用正面素材、積極典型。對宣揚(yáng)極端個人主義、享樂主義的材料不要選用;對放大社會不公正現(xiàn)象,甚至刻意描寫社會詬病的素材要批判性對待;對無從考證、有悖常識,甚至違背科學(xué)的材料理應(yīng)增強(qiáng)判斷和辨析能力,不可違背規(guī)律、違反科學(xué)構(gòu)設(shè)搞創(chuàng)新點(diǎn)。
四是學(xué)術(shù)界尚存爭議或雖達(dá)成共識尚未列人公共標(biāo)準(zhǔn)的觀點(diǎn)不引用。作為科學(xué)家開展研究產(chǎn)生爭議是社會發(fā)展和科技進(jìn)步的正常現(xiàn)象,但并非所有研究的內(nèi)容都可以引入大規(guī)模教育考試的。學(xué)界尚存爭議的觀點(diǎn)一旦人題必將引起來自社會各個層面人士出于各種目的的爭議,從而影響社會和諧,影響教育秩序的穩(wěn)定。
五是單純反映個人學(xué)術(shù)觀點(diǎn)的內(nèi)容不引用。由于人們的認(rèn)識是螺旋上升、逐步完善的,即使普遍使用的學(xué)科教材中也難免會有認(rèn)識不到位甚至錯誤之處。對認(rèn)識不統(tǒng)一的內(nèi)容教學(xué)中可以引導(dǎo)、啟發(fā)、組織學(xué)生開展探究,教師個人也可以開展針對性深入研究,但是大規(guī)模教育考試命題時對個人學(xué)術(shù)觀點(diǎn)一定要慎重對待。因?yàn)椋笠?guī)模教育考試不是傳播個人學(xué)術(shù)觀點(diǎn)的工具,不是學(xué)術(shù)爭鳴的平臺,不是檢測個人學(xué)術(shù)觀點(diǎn)認(rèn)同的實(shí)驗(yàn)。經(jīng)驗(yàn)和實(shí)踐證明,凡是命題專家以個人極其擅長和單純個人學(xué)術(shù)觀點(diǎn)的內(nèi)容為載體命制的試題,實(shí)測效果極差,對學(xué)校教育極易產(chǎn)生不正確的誘導(dǎo)。
六是學(xué)科組內(nèi)存在分歧的素材和內(nèi)容不引用。如果學(xué)科組內(nèi)專家在認(rèn)識上存在明顯分歧,那么一旦作為正式素材和內(nèi)容形成試題在社會上勢必存在陣營對壘式分歧,既妨礙試卷的科學(xué)性也有悖公平原則。至于對學(xué)科知識內(nèi)容考查的能力層次問題,由布盧姆教育目標(biāo)分類理論結(jié)合不同學(xué)科可以形成不同的理解,所以不同學(xué)科對所要考查內(nèi)容的考試要求不盡相同。有的學(xué)科簡單分類為了解、理解、掌握三個層次;有的學(xué)科劃分為識記、理解、分析綜合、鑒賞評價等多個層次;有的學(xué)科劃分為識記、理解、簡單應(yīng)用、問題解決等層次;還有的實(shí)驗(yàn)性學(xué)科把知識性考試水平分為了解、理解和應(yīng)用水平,技能性考試水平分為模仿水平、獨(dú)立操作水平和遷移水平,體驗(yàn)性考試水平為體驗(yàn)水平、反應(yīng)和領(lǐng)悟水平。對不同層次的考查要求,特別是學(xué)科試題呈現(xiàn)的問題設(shè)計確屬仁者見仁智者見智,這不僅對參加考試的學(xué)生具有一定的不確定性,對參加命題的專家同樣具有挑戰(zhàn)性。正因如此,命題專家的思維空間才留有發(fā)揮余地,命題專家的創(chuàng)造性勞動才具備物理性根基。
七是市面教輔資料已經(jīng)出現(xiàn)過的素材及其試題堅決不用。如果素材對不同群體熟知程度不一樣勢必影響大規(guī)模教育考試的公平性。如果市面教輔資料已經(jīng)出現(xiàn)過的素材及其試題一旦引用不僅妨礙考試公平性,還沖擊考試的安全性。即使對工具書的引用也必須考慮全體考生共同使用的版本。不過,為了引導(dǎo)學(xué)校教育防止出現(xiàn)追求偏、難、怪的現(xiàn)象,為了引導(dǎo)學(xué)校教育回歸本真、回歸教材、回歸基礎(chǔ),應(yīng)提倡對學(xué)生共同使用的教科書中的素材進(jìn)行創(chuàng)造性挖掘。實(shí)踐證明,此舉對扼制過重的學(xué)業(yè)負(fù)擔(dān)、扼制資料過多過濫效果顯著。
八是社會過于關(guān)注的熱點(diǎn)話題盡量回避。學(xué)校教育應(yīng)與社會教育、家庭教育相結(jié)合,應(yīng)引導(dǎo)學(xué)生關(guān)注生活、關(guān)注社會,引導(dǎo)學(xué)生應(yīng)用所學(xué)知識分析和解決生活中的實(shí)際問題。但大規(guī)模教育考試是一種與考生利益高度相關(guān)的考試,它對學(xué)科考試內(nèi)容的選擇實(shí)則是一種有目的性的抽樣。大規(guī)模教育考試為了實(shí)現(xiàn)考試的公平公正,不得不考慮防止押(壓)題行為,而社會過于關(guān)注的熱點(diǎn)往往是市場和學(xué)校押(壓)題的重要方向。因此,講政治但不追逐熱點(diǎn)、講應(yīng)用但不脫離實(shí)際、講綜合但不牽強(qiáng)附會,應(yīng)成為命題工作的智慧選擇。
九是立足學(xué)科內(nèi)考查知識的綜合應(yīng)用,慎對跨學(xué)科知識的綜合應(yīng)用。雖然引導(dǎo)學(xué)生綜合性應(yīng)用所學(xué)知識分析和解決問題是教學(xué)的追求,學(xué)校應(yīng)通過校本課程和研究性學(xué)習(xí)等活動大力培養(yǎng)學(xué)生綜合性觀察問題、提出問題、分析問題和解決問題的能力;但是由于目前學(xué)校普遍分科設(shè)置并實(shí)施課程,學(xué)科教師單一知識背景情況普遍,特別是命題工作中不可能一個學(xué)科命題組由跨學(xué)科命題專家組成。諸多現(xiàn)實(shí)因素和技術(shù)條件的局限,使大規(guī)模教育考試考查跨學(xué)科知識的綜合時機(jī)不太理想,因此應(yīng)大力推進(jìn)立足學(xué)科內(nèi)來考查知識的綜合應(yīng)用。學(xué)科內(nèi)知識的綜合無論從課程、教學(xué)、命題技術(shù)手段、專家資源等方面,還是從學(xué)生學(xué)習(xí)方法層面,甚至從考查學(xué)生進(jìn)一步學(xué)習(xí)的潛能角度都具備可操作性。現(xiàn)在各級大規(guī)模教育(包括全國高考)都倡導(dǎo)能力立意,即立足學(xué)科內(nèi)考查知識的綜合應(yīng)用成為命題重要的指導(dǎo)思想和技術(shù)原則。
總體來說,大規(guī)模教育考試命題工作不僅是學(xué)科專業(yè)性很強(qiáng)的創(chuàng)造性勞動,而且跨學(xué)科涉及多門學(xué)科理論知識,同時還具有明顯的社會屬性。加強(qiáng)對教育考試命題工作的研究,不僅有利于提高命題工作的科學(xué)化水平,而且有利于引導(dǎo)學(xué)校教育教學(xué)工作沿著素質(zhì)教育方向發(fā)展。教育考試命題工作承載著學(xué)校、家庭、社會多方期望,其影響往往超出命題工作本身。從這個角度來講對教育考試命題工作要“減壓”,即盡可能減少社會因素的干擾,用現(xiàn)代教育測量與評價的理論指導(dǎo)命題工作,讓教育考試命題工作沿著專業(yè)化方向發(fā)展。
參考文獻(xiàn)
[1]洛林·W·安德森等.布盧姆教育目標(biāo)分類學(xué)(修訂版)[M].北京:外語教學(xué)與研究出版社,2009(1).
[2]2014年普通高等學(xué)校招生全國統(tǒng)一考試大綱(課程標(biāo)準(zhǔn)實(shí)驗(yàn)版)[S].北京:高等教育出版社2014(1):1.
[3]周遠(yuǎn)方,王池富.高考數(shù)學(xué)命題理論與實(shí)踐[M].武漢:湖北人民出版社2011(5):1.
[4]陸璟.PISA測評的理論和實(shí)踐[M].上海:華東師范大學(xué)出版社2013(5):1.
[5]2014年武漢市初中畢業(yè)生學(xué)業(yè)水平考試說明[S].武漢:武漢出版社,2014(3):1.
(責(zé)任編輯 羅登廉)