摘要:針對現有題庫系統設計的弊端和不足,對試卷生成算法做出改進,給出建立一套科學的、高質量的試卷生成算法。優化組合庫結構,全面考慮出題意想和出題原則,使用均勻分布的隨即試卷生成算法。通過對生成試卷進行分析,比對試卷信度與試卷效度,得出了試題均勻分布算法的實用性??梢詫⒃撍惴☉糜诂F有試題庫系統中,并達到預期效果。
關鍵詞:題庫系統;均勻分布;隨即數發生器;試卷生成
中圖分類號:TP312文獻標識碼:A文章編號:1009-3044(2009)24-7020-02
Improving the Exam Paper Generation Algorithm in the Test Library System
FENG Gui-liang1, CUI Wei-nan2, YANG Jie1
(1.College of Information Science and Engineering, Hebei North University, Zhangjiakou 075000, China;2.2006 Information Science and Technology Base Class, College of Information Science and Engineering, Lanzhou University Lanzhou, Gansu 730000, China)
Abstract: Improving the exam paper generation algorithm to avoid the deficiency and shortcomings of existing examination paper systems. Methods: this exam paper generation algorithm uses the random generating algorithm with uniform distribution and based on the principle of exam and framework of package library. Result: By analyzing and testing reliability and validity of the papers, the practicality of this algorithm is to be proved. Conclusion: The algorithm can be applied to existing test library system, and to achieve the desired result.
Key words: test library system; uniform distribution; count a generator immediately; generate examination paper
考試作為重要的教學環節,一般認為,其結果應該能比較客觀地反映教和學的真實情況,然而,事實卻不盡如人
意[1-2]。長期以來,絕大多數試卷的命題是基于教師的經驗,對試題的篩選缺少科學性,對考試結果的分析也僅限于均分等的計算。因此,這樣的題庫和試卷庫,這樣的成績單就很難作為衡量教學的客觀標準,由此得出的評價結果也很難說是準確的。[3-4]
在題庫系統中,“題庫”是計算機輔助測驗的基礎,一個大的測驗系統的題庫應能容納足夠數量的題目,這些題目在題庫中的組織、分類及其特征信息的確立與描述將直接影響系統的工作效率與效果。其次“試卷生成”是計算機輔助測驗系統的關鍵環節和最終結果,要求在“題庫”的特征信息的基礎上,按照出題意向及出題原則隨機生成考試卷及相應答案;按照教育測量學的有關理論和方法,通過對試卷考試結果的測量與分析,其難度、區分度、信度、效度、正態分布等方面都要達到預期效果。
然而,目前開發的題庫系統存在著許多弊端和不足,特別是在“題庫建立”、“試卷生成”以及兩者內在聯系上缺少科學的分析和應用,至使題庫系統不能生成一份高質量的試卷,更不能客觀地、準確地反映教和學的真實情況,試題庫中的試卷抽取,成了一種空洞形式,甚至是一種誤導。[5-6]
1 全面考慮出題意想和出題原則
按照教育測量學的有關理論和方法,通過對試卷考試結果的測量與分析,其難度、區分度、信度、效度、正態分布等方面都要達到預期效果 [7-8]。為此,一份試卷至少符合以下要求的程度:
1) 試卷分值達到滿分(100分);
2) 試卷的答題時間滿足用戶的要求;
3) 各類題的分值達到用戶的要求;
4) 各類題的數量達到用戶的要求;
5) 各類題難度最接近用戶的要求;
6) 每一類題總分應在各章節均勻分布;
7) 對同一個關鍵詞的權值和不應該大于2;
8) 試卷中的每一個題目應盡可能是最少使用且最久未被使用的。
部分條件表示如下:
實現以上條件用最小覆蓋法,其設計思想是當試題庫中有足夠多的題時,相鄰2次試卷所選試題的重復率盡可能地低。利用庫結構中2個標志位字段,表示本次被選中的題,字段最近抽取時間表示上2次(或更早)被選用過的試題,這類試題已有被選中的歷史,則此次不再選用。當本次試題庫的題被選擇結束后,只要標志位字段不為true,說明此題已被選用過,下次再生成試卷時初始化數據庫系統,則系統會自動將最早用過的試題庫中標志位2不為true的試題重新置true。將標志位1不為true的重新置true,使該試題又處于一個可再次使用的初始狀態,以此達到最小的重復率。
2 建立合理的庫結構
從以上數據分析看出,題庫建立不僅包括題目內容和答案,還有題目的特征信息,題目的選取首先是獲取它的特征信息,然后根據它的特征信息取得對應的題目內容和答案,進而組合成一套試卷,因此試題的參數確定是設計中的重中之重,對試題設置以下參數(屬性)
Qst_no試題編號
Qst_title 試題題目
Qst_type 試題類型
Qst_chapter 試題章節
Qst_times 答題時間
Qst_difficult 試題難度
Qst_diffier 試題區分度
Qst_score 試題分數
Qst_course試題所屬課程號
Qst_sp 專業號
Qst_depart院系號
Qst_lever 試題級別
Qst_key關鍵詞(3個)
Qst_power關鍵詞對應權(3個)
Qst_signthis 被選標志位
Qst_signlast 近期被選過標志
Qst_answer 試題答案
Qst_count 總計被選次數
改進后部分實體關系描述如圖1。
3 均勻分布的試卷生成算法
建立合理的庫結構的基礎上,系統接受用戶輸入的出題意向,并將其轉換成查詢條件因子的數據格式參數;查詢子程序、隨機數產生機制以及出題規則算法同時作用標識庫,形成考卷中考題題號列表,進而在內容庫中抽取出的各種類型的試題組合成考試卷和相應的答案,此過程即為試卷生成。
在試卷生成的三個環節,即查詢子程序、隨機數產生機制以及出題規則算法中,隨機數產生機制最為關鍵,它直接決定試卷的均勻分布與否以及系統的運行速度,尤其在討論多卷并發試卷生成時,如何考慮好特征信息相同時的情形,即如何在同一類型的試題中抽取試題,傳統的做法是:利用系統提供的隨機函數RAND(x)產生一個0-1之間的小數,設滿足條件的題目個數為m,為了使得每次產生的隨機數均落在1-m之間,可用公式int[ 1+rand(-1)×m]求得1-m之間的一個隨機整數。
深入研究系統提供的隨機函數RAND(x)發現,此隨機數發生器,一般是用線性同余數法,即采用遞推關系
Ij+1=aIj+c(mod m),rj+1=Ij+1/m
其中m,a,c為常數,均為正整數。
線性同余數法的優點是計算量少,速度快,缺點是在逐次調用中產生的隨機數是序列相關的。為破壞這種序列相關性,采用如下方法:設v1, v2,﹒﹒﹒, vn中由RAND(x)生成的n個隨機數,現隨機地取一正整數j(1≤j≤n),取vj為一要求的隨機數,而vj再由RAND(x)生成的另一隨機數替換,替換后再v1, v2, ﹒﹒﹒, vn中隨機地取一個下一次要求的隨機數,依次重復。這種過程叫混洗過程,v=(v1, ﹒﹒﹒, vn)稱為混洗數組。
利用上述方法,改善了隨機數發生器產生的隨機數的統計性質,從而真正滿足系統在生成考卷時出題的隨機性和考題在考卷中的唯一性,達到試卷的均勻分布。
4 結論及展望
將此算法應用于實際試題庫系統中,綜合比對試卷信度、試卷效度,在試卷趨于合理的情況下,下一步要做的工作是將數據庫轉換成分布式數據庫,使現有試卷生成算法在大題庫量的前提下,來提高檢索速度,并切根據現有試題參數區分度,產生試題參數通過考試結果,做到參數回寫的功能,去除掉區分度很低的無意義的試題。
參考文獻:
[1] 李一波,張森悅.試題庫試題難度系數自適應學習鑒定[J].計算機工程,2005,31(12).
[2] 楊永斌.網絡智能試題庫系統建設研究[J].計算機科學,2007,34(12).
[3] 吳莉.應用統計中的相關分析在教育測量中的應用[J].阿壩師范高等??茖W校學報,2008,25(3).
[4] 季昊.基于三層網絡架構的網絡考試系統開發研究[D].東北師范大學,2008.
[5] 黃勇.基于SOA的高校試題庫系統的研究與實現[D].華東師范大學,2008.
[6] 孫小錐.基于QTI標準的網絡考試系統研究與實現[D].中國優秀碩士學位論文全文數據庫,2008.
[7] 胡松濤.基于ASP的工程訓練網上考試系統的研究與設計[D].合肥工業大學,2008.
[8] 趙玉.基于ASP.NET的在線考試系統的設計與實現[D].東北師范大學,2007.