韓英慧
韓英慧/黑龍江財經(jīng)學院講師(黑龍江哈爾濱150025)。
當代中國教育教學模式不斷推陳出新,并且伴隨著計算機技術的迅猛發(fā)展以及網(wǎng)絡覆蓋更加廣泛,教育工作者對于組卷的速度與效率提出了更高要求。經(jīng)過組卷后產(chǎn)生的試卷題型必須多樣、試題涵蓋的知識面要廣、注重考查學生的綜合素質(zhì)等。智能組卷系統(tǒng)在教育教學等領域以其實用性、科學性發(fā)揮著重要作用,為各類用戶減少了大量的工作量,解決了許多實際困難,然而組卷時間長、速度慢仍是現(xiàn)有組卷系統(tǒng)普遍存在的缺點,已經(jīng)很難更好地適應各類考試需求。許多專家通過較為深入的研究發(fā)現(xiàn),解決好全局尋優(yōu)、收斂速度快慢的問題,是組卷系統(tǒng)生成的試卷題目組織成為最佳或者是近乎最佳方案組合的關鍵。
1.遺傳算法基礎理論。遺傳算法的群體中的解在未達到最優(yōu)解或接近最優(yōu)解時,個體不能再繼續(xù)進化下去,性能不能超過其上一代,且個體之間存在高度相似性,這種遺傳算法特有而常見的現(xiàn)象被稱為“早熟”現(xiàn)象。這種現(xiàn)象導致算法無法向下進行,終止于一個局部最優(yōu)解,不能找到全局最優(yōu)解。
2.遺傳算法實現(xiàn)技術。遺傳算法要能正確的應用到智能組卷系統(tǒng)中,我們采用了主要技術包括遺傳編碼、初始化群體、適應度數(shù)及遺傳算法選擇操作。生物遺傳學與遺傳算法做了細致的對比分析,結(jié)合數(shù)學理論對遺傳算法的流程進行了研究。詳盡介紹了遺傳算法實現(xiàn)所涉及的主要因素,并對算法步驟進行了系統(tǒng)的分析,提出了問題解決的有效措施,保證智能組卷系統(tǒng)能正常實現(xiàn)。
1.遺傳算法編碼設計。計算機在程序運行過程中只認識二進位制編碼,因此,遺傳算法的重要編碼形式也是二進位制編碼,二進位制編碼的實現(xiàn)主要通過染色體的出現(xiàn),利用實數(shù)編碼技術進行二進位制編碼,編碼的方法有多種選擇,利用現(xiàn)代先進的科學技術進行編碼,編碼的效率也使實現(xiàn)遺傳算法能正確應用到智能組卷系統(tǒng)中,實現(xiàn)組卷系統(tǒng)的智能化。
二進制編碼雖然編碼方式簡單并且易于進行交叉與變異操作,但是當運算量大時占用計算機內(nèi)存空間過大以及表達精度下降的缺點十分明顯。實數(shù)編碼則不受計算量的影響,對于處理復雜的決策變量的約束問題,具有明顯優(yōu)勢。
2.確定適用度數(shù)。遺傳算法適應度函數(shù)的確定是采用該算法進行智能組卷的關鍵。適應度函數(shù)值為遺傳進化過程設置標準,以此標準有效地區(qū)分個體的優(yōu)劣。如果適應度函數(shù)確定的好,在區(qū)分個體優(yōu)劣時,能夠防止好的個體過快擴散、壞的個體過快淘汰,從而對群體多樣性的保持起到積極作用,遏制“早熟”現(xiàn)象的出現(xiàn)。
將第i項組卷因素對試卷重要程度的估算權值設為Wi,取值區(qū)間為[0,1]。Wi等于僅參照單類綜合誤差的收斂代數(shù)對六次僅參照誤差參數(shù)的收斂代數(shù)和的比值,得到其計算分為六部分,依重要程度高低的順序分別為:①章節(jié)分值;②知識點分值;③總分與各題型分值;④考卷難度;⑤考卷的能力層次;⑥優(yōu)先級、計算量及答題時間。將第i項組卷因素對組卷目標的誤差設為40ek(ek≥0),體現(xiàn)其滿足第k類綜合誤差的程度,等于此類參數(shù)當前誤差值對初始統(tǒng)計平均誤差值(兩百次平均)的比值。為增強ek值對適應度函數(shù)產(chǎn)生的影響,充分利于精度計算,將ek設成底數(shù)40的指數(shù)函數(shù)。
任何系統(tǒng)都有一定的指標體系,每個指標在該系統(tǒng)中有一定作用,在指標體系中,每一個參數(shù)都有一定意義,扮演一定角色,具有一定描述功能,每個指標的建立都是為智能組卷系統(tǒng)服務的,各個指標實現(xiàn)了優(yōu)化,該系統(tǒng)就有一定的優(yōu)化功能。指標體系沒有固定的模式,該智能組卷系統(tǒng)指標體系分為如下:
1.題型。試題類型的劃分可以因用戶需求不同而變化,通常設為6種題型,分別是選擇題、填空題、判斷題、概念與簡答題、計算與分析題、綜合與應用題。
2.所屬章節(jié)。題庫中的試題與課程的章節(jié)間存在對應關系。
3.知識點。亦即考核點,是試題所反映的教學大綱要求的知識點。
4.難度系數(shù)。在命題時,試題的命題難度隨著考試所針對的對象的不同、教學階段的不同而變化。按照組卷要求來搜索難度系數(shù),得到符合難度要求的試卷,試題難度系數(shù)表示為:

其中,qi為試題i的難度系數(shù),Ri為該題得分平均值,n為該題滿分值。
由于被測試群體的變化及測試環(huán)境的變化(例如測試的時間間隔)等因素對難度系數(shù)影響較大,要更加科學、客觀地確定難度系數(shù),在參考以上算式結(jié)果的基礎上,還需要結(jié)合命題人員的教學經(jīng)驗進行適當調(diào)整,將數(shù)據(jù)模糊化為4個難度等級——容易、中等、較難、難,如表1所示 。

難度等級 容易 中等 較難 難難度區(qū)間 0.00-0.25 0.25-0.50 0.50-0.75 0.75-1.00模糊化 0.2 0.4 0.7 0.9
通常試卷的平均難度控制在0.50左右,這樣試卷分數(shù)的分布才呈現(xiàn)正態(tài)分布,考試成績才具備價值。
5.信度。試題的信度能夠反映等價試卷多次對同一組被測試對象進行測試所得結(jié)果的穩(wěn)定性和一致性,是衡量試卷可靠性程度的指標。同一組被測試對象經(jīng)過等價的試卷多次測驗后,如果所得分數(shù)大致相同,就反映出試卷具有較高的信度,如果所得分數(shù)相互之間差距較大,則反映出試卷信度較低。由于考試的可靠性即信度很大程度上由試卷信度決定,因而常用試卷信度來指代。信度一般通過對同一組被測試對象進行多次內(nèi)容組成、試題題型、難度和區(qū)分度等指標相當?shù)钠叫袦y試來獲得。
6.效度。試卷的效度體現(xiàn)試卷內(nèi)容與教育教學大綱及考試大綱符合程度,是反映某項考試達到預定目標的程度的指標。一份試卷如果可以比較準確地測試出學生掌握和運用所學知識的真實度,就是效度高的試卷。依據(jù)教學大綱和考試大綱進行命題,各個章節(jié)所占分數(shù)與大綱要求的學時數(shù)呈正比關系,是試卷效度得以保障的重要基礎。
7.答題時間。答題時間是完成該道試題所需的時間,在這里“完成時間”包括大多數(shù)學生做完該題所需時間以及檢查該題所需時間兩部分。出題者可根據(jù)教學經(jīng)驗結(jié)合客觀情況做適當調(diào)整。
總之,遺傳算法是一種應用前景十分廣泛的優(yōu)化算法,在具備其他算法無法企及的諸多優(yōu)點的同時,也存在一定的缺點和不足。本論文針對性的對編碼設計、適應值函數(shù)、交叉和變異算子的設計等方面進行了改進,提出一種自適應遺傳算法,并進行了仿真實驗,在智能組卷系統(tǒng)中應用取得一定效果。遺傳算法是數(shù)據(jù)挖掘的一種常用方法,現(xiàn)在是大數(shù)據(jù)時代,人們常利用云計算技術、物聯(lián)網(wǎng)應用技術等與數(shù)據(jù)挖掘結(jié)合在一起使用,在數(shù)據(jù)挖掘領域中取得一定成果。
[1]賀榮,陳爽.在線組卷策略的研究與設計[J].計算機工程與設計,2011(6).
[2]葛宇,梁靜.基于免疫遺傳算法的智能組卷系統(tǒng)設計[J].計算機應用與軟件,2011(1).
[3]孟朝霞.基于自適應免疫遺傳算法的智能組卷[J].計算機工程,2008(14).
[4]閆麗,姜曉鋒.試卷生成系統(tǒng)智能組卷算法的研究與實現(xiàn)[J].現(xiàn)代計算機(專業(yè)版),2008(4).
[5]李銘章,陸再林,宗曄,張樹有.工程制圖試題庫智能組卷系統(tǒng)中的自動排版技術[J].浙江大學學報(自然科學版),1998(6).