郭幸菲 任杰

題庫是基于教育測量學相關理論,經過分類、編碼的大量試題的集合。隨著計算機技術的發展,題庫不僅僅用來存放編制好的試題,還是一個集命題、審題、組卷、分析等為一體的動態管理系統。本文從浙江高考英語事件入手,分析在當前教育改革背景下建設題庫的必要性及諸多優勢,并簡要介紹題庫建設所需的條件,提出應吸取此次浙江高考英語事件的教訓,重視考試題庫的建設,充分利用題庫資源的優勢,更好地保障考試質量與考試公平。
一、前言
2018年11月24日,浙江省高考英語成績公布后,許多學生反映查到的英語成績與自己的能力不相符合,有的學生甚至出現了“倒加分”的情況。隨后,浙江省教育考試院表示,為保證英語一年兩考的試題難度大體相當,“面向所有考生,對難度系數較大的第二部分(閱讀理解)、第三部分(語言運用)的部分試題進行難度系數調整,實施加權賦分”。后來浙江省政府經調查認定,這是一起因決策嚴重錯誤造成的重大責任事故,決定取消這次考試的加權賦分,恢復原始得分。
浙江省高考推行英語“一年兩考”,是對打破“一考定終身”這一現狀的勇敢嘗試,其初衷值得肯定。但如果想把這項政策真正落到實處,關鍵在于要使考生在不同時間的考試分數具有可比性,這就需要測驗等值技術和大型題庫作為支持。舉個簡單的例子,假設有兩位同學分別參加了兩次英語考試,第一位同學參加第一次考試的成績是80分,而另一位同學參加了第二次考試,成績為75分,那我們是否可以認為80分就一定好過75分?答案顯然是否定的,因為這兩次考試的難度不一,因而無法直接進行分數的比較。而等值的目的就是平衡試卷難度,使兩次測驗的分數可以相互轉換,從而形成穩定的評價標準。那么題庫又是什么呢?會有哪些作用?建設題庫需要哪些條件呢?
二、題庫及其作用
Brennan 主編的《教育測量》(第四版)一書提出:題庫是測試項目的集合,這些項目可以被不同的測驗開發者所使用,并且能以不同的形式向被試者施測。題庫不僅可以組織和存貯項目,而且還能在測驗存在多種形式、需要不斷生成試卷和互換試題時有效地管理項目。也有學者指出,“題庫是以一定的教育測量理論為基礎,編制、收集的具有一定質量要求,并附有代表試題特性的參數,經過分類編碼便于檢索的大量試題的集合” 。不難發現,題庫的概念就好比一個超市,其中的每個商品都有自己對應的標簽、條碼及銷售區,而題庫中的試題也是按照一定的規則進行了分類與儲存,以方便隨時調取與使用。
在近些年教育改革的背景下,盡管“題庫”越來越多地受到各方關注,但許多人對“題庫”一詞依然有著很深的誤解。有人認為,題量大的練習冊就是題庫,也有人認為存放試題的系統就是題庫。針對這一誤區,測量領域專家謝小慶老師提出:“題庫不是習題集。”隨著計算機技術的發展,題庫不僅僅被用來存放編制好的試題,還是一個集遠程命題、在線審題、在線組卷等為一體的動態管理系統。因此,如今市面上很多題量很大、被稱為“題庫”的教輔資料,頂多是個“題集”。
較傳統的命題與考試方式而言,題庫建設的作用主要表現在以下幾方面:
第一,建設題庫有助于把控命題、組卷的質量。進入題庫中的試題都會被標注參數,不僅包括試題的內容、考查的能力層次、題型、字數等描述性參數,還包括已經等值過的試題難度和區分度、題目使用次數等統計參數,這些參數的標定將為試卷的組建提供科學的參考,從而有效提高命題及試卷的質量。
第二,建設題庫將改變傳統的命題入闈的方式,有效提高命題的效率。所謂命題入闈,是指將經選拔的命題人集中到封閉的命題環境,在一定的期限內命制一定量的題目。那么題庫的建設,可以將考前沉重的命題任務分散到平時,在保障安全的前提下利用系統進行試題的命制、提交、復審,可以提高命題效率。
第三,題庫中包含著大量試題,可以根據考試需要提前組建多套平行試卷。對于同一次考試而言,可以更好地應對泄題、漏題等突發狀況;對于多次考試而言,可以較好地平衡不同試卷間試題的難度、區分度等,從而實現不同試卷間分數的比較。
第四,建設題庫也是為未來將計算機化自適應測試及計算機化多階段自適應測試應用到大規模考試中提供堅實的基礎。近年來,自適應考試憑借其因人施測的優勢受到各方關注,它的原理是根據考生在一定題目上的作答,自動地從題庫中抽取既符合考生能力又符合考試要求的題目,并讓考生作答,最后根據考生在所有題目上的作答表現精確地估計出考生的能力。那么,題庫的建設正是為計算機化自適應測試搭建了平臺,不僅可以儲存大量試題,而且可根據考試需要進行試題的導入與分配。
三、題庫的建設
在高考英語“一年兩考”的背景下,如何保證高考的科學性和公平性是個非常重要的議題。要實現一年多考,就必須實現測驗的等值。但就目前的情況來看,測驗等值技術在我國高考中還有很長的路要走,一方面要考慮等值技術的科學性和合理性,另一方面還要考慮相關配套政策及社會影響。考生在某次難度較小的考試中得到的原始分數經等值很可能會降低,這樣的分數調整在廣大學生和家長群體中很難被接受。那么,在“一年兩考”成績報告采用原始分的情況下,建設一個真正意義上的題庫就為把握試卷難度提供了依據。一般來說,題庫的建設需要以下條件:
(一)試題的命制與審核
題庫建設的核心在于命題,只有命題質量高、符合考試要求的試題才能發揮題庫的作用。因此,首先命題人員需要根據課程標準或考試大綱,嚴格按照其規定的考核內容要求、能力要求、試題編制技巧等進行命題。其次,審題專家對于征集上來的試題需進行嚴格審核,從政治性、科學性、規范性等多方面判斷試題能否被采用。
(二)試測與等值
通常,試題的參數要經過試測和等值才可獲得。試測時需根據一定的等值設計,找一批代表性較好的考生樣本作答待等值試卷,然后采用基于經典測驗理論或項目反應理論的等值方法進行等值,從而獲得相應的試題的統計參數。只有經過等值技術處理,來自于不同試卷的題目之間的難度參數才是可以比較的。
(三)參數標定與試題入庫
試題參數是對試題的各種特性及相互關系的記錄,對試題參數的標定有利于試題的管理與儲存,對建立題庫而言意義重大。標定的參數主要包括兩大方面:一是試題的題型、分值、題目內容、能力范圍、命題時間等描述性參數。隨著科學技術的發展,利用人工智能技術可實現對試題的內容進行分析,從而實現參數的自動標定。二是試題的難度、區分度等統計參數。高考這種高利害的考試對試題的安全性要求更高,因此對其難度的把控要更加謹慎。那么經過參數的標定以后,符合考試要求的試題就可以錄入題庫中。至于題庫中試題的數量,一般要為實際試卷題量的十倍以上。而高考這樣的國家級考試題庫,試題的數量應該更多。
(四)題庫系統的開發與維護
當前題庫的試題管理、組卷、考試等功能,都需要計算機技術作為支撐,建構一個運行良好的題庫系統離不開與計算機專業人員的合作。題庫系統的開發應包括以下幾個核心系統:試題征集系統、試題審核系統、組卷系統、印刷系統、統計分析系統等。由于題庫中的試題需要根據實際需求進行刪減或增添,因此做好題庫的維護也非常重要。
通過以上分析不難發現,題庫的建設與運行需要學科專家、命題專家、審題專家、教育測量學專家與計算機專家的相互配合,缺一不可。同時,無論是命題審題、參數標定,或者是試題入庫及題庫系統的開發與維護,保障題庫的安全都是重中之重,基于這樣的題庫組出的試卷難度才容易保持一致。因此,在題庫建設的過程中,應提高保密意識,做好保密工作,嚴格管理相關人員進入題庫的權限。