蔡佳
(陜西國(guó)際商貿(mào)學(xué)院 基礎(chǔ)課部, 咸陽(yáng) 712046)
大學(xué)英語(yǔ)考試作為英語(yǔ)教育的重要環(huán)節(jié),目前主要參考《大學(xué)英語(yǔ)四級(jí)考試大綱》。以對(duì)學(xué)生英語(yǔ)能力完成準(zhǔn)確客觀的測(cè)量為目的,促進(jìn)大學(xué)英語(yǔ)教學(xué)水平的提高。大學(xué)英語(yǔ)考試面向全校學(xué)生,是一項(xiàng)大規(guī)模標(biāo)準(zhǔn)化考試,為確保考試成績(jī)的參考價(jià)值,需保證試卷整體質(zhì)量,需根據(jù)教育測(cè)量理論的試卷質(zhì)量的要求完成設(shè)計(jì)。傳統(tǒng)組卷算法已無(wú)法與教育信息化的需求相匹配。優(yōu)化智能組卷方法是大學(xué)考試實(shí)現(xiàn)自動(dòng)化的重點(diǎn)[1]。
完成智能組卷的重點(diǎn)在于構(gòu)建滿(mǎn)足實(shí)際需求的組卷模型,應(yīng)用高效優(yōu)質(zhì)的組卷算法。智能組卷以人工智能為技術(shù)支撐,通過(guò)計(jì)算機(jī)程序從試題庫(kù)中自動(dòng)選擇試題,根據(jù)要求組合試卷,考試系統(tǒng)的核心目標(biāo)之一是實(shí)現(xiàn)智能化操作,是計(jì)算機(jī)輔助教學(xué)的優(yōu)勢(shì)所在。效率和質(zhì)量作為智能組卷的兩個(gè)重要評(píng)價(jià)指標(biāo),其實(shí)現(xiàn)與否主要取決于組卷算法。設(shè)計(jì)的算法要全局尋優(yōu),能夠做到快速?gòu)念}庫(kù)中抽取一組滿(mǎn)足考試要求的試題,涉及到快速收斂問(wèn)題。本文對(duì)大學(xué)英語(yǔ)考試智能組卷問(wèn)題的研究正是基于差分進(jìn)化算法,支持軟件系統(tǒng)的開(kāi)發(fā)與優(yōu)化。提出了一種優(yōu)化組卷問(wèn)題的數(shù)學(xué)模型,滿(mǎn)足大學(xué)英語(yǔ)考試中的精確組卷需求。將差分進(jìn)化算法應(yīng)用于該數(shù)學(xué)模型中,給出一種新型智能組卷算法。
差分進(jìn)化算法(DE)以群體智能為基礎(chǔ),是一種隨機(jī)并行的優(yōu)化算法,遵循達(dá)爾文的進(jìn)化原則,即“適者生存、優(yōu)勝劣汰”。差別進(jìn)化算法具有獨(dú)特的記憶能力,可以對(duì)當(dāng)前的搜索情況實(shí)現(xiàn)動(dòng)態(tài)跟蹤,完成自適應(yīng)尋優(yōu),根據(jù)實(shí)際需要自動(dòng)調(diào)整搜索策略,具有較強(qiáng)的全局收斂性和魯棒性,能夠突破常規(guī)數(shù)學(xué)規(guī)劃方法的限制,完成復(fù)雜環(huán)境中的優(yōu)化問(wèn)題的求解,在試題庫(kù)智能組卷方面有極大的優(yōu)勢(shì)。
通過(guò)對(duì)問(wèn)題中變量間的關(guān)系進(jìn)行分辨、聯(lián)系,把實(shí)際問(wèn)題轉(zhuǎn)化為數(shù)學(xué)模型,并運(yùn)用計(jì)算機(jī)完成求解,從而實(shí)現(xiàn)智能組卷的過(guò)程,數(shù)學(xué)模型決定了組卷質(zhì)量。所以做好智能組卷的基礎(chǔ)工作首先是建立數(shù)學(xué)模型[2]。
應(yīng)用計(jì)算機(jī)技術(shù),按照一定的教育測(cè)量理論規(guī)定,組成某種學(xué)科題目的集合稱(chēng)之為題庫(kù)。智能組卷系統(tǒng)的試題都來(lái)自題庫(kù),題庫(kù)中題目的質(zhì)量起到?jīng)Q定性作用,根據(jù)經(jīng)典測(cè)量理論(CTT)的題目量化指標(biāo),對(duì)影響試卷質(zhì)量的指標(biāo)進(jìn)行分類(lèi)歸納,包括:可信度反映考試結(jié)果的穩(wěn)定程度,程度高表明考生分?jǐn)?shù)可排除偶然性因素的影響,使考生實(shí)際水平能夠真實(shí)的測(cè)量出來(lái)。可信度的影響因素包括試題數(shù)量及難度、題目用語(yǔ)準(zhǔn)確性等;有效度反映實(shí)際的考試結(jié)果同預(yù)期考試目標(biāo)匹配的程度。有效度高的試卷,能夠準(zhǔn)確地測(cè)試出考生知識(shí)掌握的程度。在考試目標(biāo)明確的前提下,提高試卷有效度需保證試題與課程標(biāo)準(zhǔn)一致;試題難度以試卷能否有效考查出學(xué)生的知識(shí)和能力水平為依據(jù)(分?jǐn)?shù)在中等難度呈正態(tài)分布,較高難度呈負(fù)偏態(tài)分布,較低難度呈正偏態(tài)分布),因?yàn)樵囶}難度值的確認(rèn)需在考試成績(jī)公布后統(tǒng)計(jì)得到,組卷時(shí)需比較準(zhǔn)確的估計(jì)試題難度;試卷區(qū)分度實(shí)現(xiàn)鑒別不同層次考生能力的目標(biāo)。試卷區(qū)分度高能有效區(qū)分不同知識(shí)水平及不同能力的學(xué)生,區(qū)分度和難度關(guān)系密切,好的區(qū)分度離不開(kāi)合適的難度[3]。
2.2.1 構(gòu)建矩陣模型
結(jié)合英語(yǔ)考試實(shí)際情況,依據(jù)組織一份試卷時(shí)的考慮因素(如確定滿(mǎn)分值、知識(shí)點(diǎn)分布、數(shù)量、試題難度及考查的能力層次等指標(biāo)),本文構(gòu)建的智能組卷數(shù)學(xué)模型由 9 項(xiàng)核心屬性,將一份試卷的參數(shù)指標(biāo)分解成一個(gè)9 維空間向量,一道試題由 9 個(gè)參數(shù)指標(biāo)(指試題編號(hào),分值,答題時(shí)間,知識(shí)點(diǎn),題型,難度系數(shù),區(qū)分度,能力層次,使用頻率)決定,由9維向量空間 (a1,a2,…,a8,a9)的特征決定。(n×9)的矩陣如下式所示,其中n表示試題數(shù)。
2.2.2 矩陣參數(shù)指標(biāo)
1)試題編號(hào)作為試題的唯一標(biāo)識(shí),由(a11,a21,…,an1)表示,對(duì)計(jì)算機(jī)處理極為重要。


4)大學(xué)英語(yǔ)教學(xué)的能力層次根據(jù)《大學(xué)英語(yǔ)課程教學(xué)要求》主要分為三個(gè)(即一般要求、較高要求、更高要求)[4],各能力層次對(duì)應(yīng)相應(yīng)的編碼(如第i道試題的能力層次編碼由ai4表示),應(yīng)根據(jù)指定的能力層次要求,完成試題的選擇。




9)使用頻率。第i題單位時(shí)間內(nèi)(可以是年或?qū)W期)使用的次數(shù)用ai9表示,使用頻率較高,則學(xué)生易于考過(guò)該題,從而影響對(duì)考生能力的真實(shí)測(cè)評(píng),組卷時(shí)要充分考察使用頻率,替換使用頻率較高的試題[5]。
差分進(jìn)化算法作為一種進(jìn)化算法,是以實(shí)數(shù)編碼為基礎(chǔ)的,本文的數(shù)學(xué)模型的構(gòu)建主要圍繞變異、交叉和選擇這三種操,其與遺傳算法的最大區(qū)別在于變異操作上,差分進(jìn)化算法中的變異操作是以染色體的差異向量為基礎(chǔ)進(jìn)行的,其余操作則和遺傳算法基本相同[6]。
變異操作主要通過(guò)差分方式實(shí)現(xiàn),是差分進(jìn)化算法的重要操作。方法是隨機(jī)從當(dāng)前種群中選取兩個(gè)相異個(gè)體,縮放其差向量,然后通過(guò)與其他待變異個(gè)體的向量運(yùn)算,進(jìn)而生成新的個(gè)體。





由上式可知,變異操作實(shí)際是將兩個(gè)不同父代個(gè)體的差值加權(quán)后,再加到第三父代個(gè)體,然后得到一個(gè)新個(gè)體。差分化算法具極好的幾何意義。
在多重約束條件下,組卷問(wèn)題實(shí)質(zhì)是求最優(yōu)解問(wèn)題,滿(mǎn)足條件的最優(yōu)解不止一個(gè)。計(jì)算機(jī)智能組卷依據(jù)數(shù)學(xué)模型進(jìn)行軟件開(kāi)發(fā)。差分進(jìn)化算法在大學(xué)英語(yǔ)考試智能組卷中應(yīng)用的流程,如圖1所示。

圖1 智能組卷程序流程圖
a.初始化組卷參數(shù),包括組卷算法數(shù)學(xué)模型的參數(shù)(包括等難度系數(shù)、知識(shí)點(diǎn)、題型、區(qū)分度、答題時(shí)間、使用頻率,能力層次等)和差分進(jìn)化算法參數(shù)(包括種群的大小、最大迭代次數(shù)、變異算子、交叉算子等)。


d.計(jì)算個(gè)體適應(yīng)度值。適應(yīng)度通過(guò)數(shù)值表示,用來(lái)評(píng)估相對(duì)于整個(gè)群體,個(gè)體向量質(zhì)量的指標(biāo)。計(jì)算適應(yīng)度數(shù)值需要適應(yīng)度函數(shù)(評(píng)價(jià)函數(shù))。DE算法的適應(yīng)度函數(shù)可隨意設(shè)定區(qū)域,不需要連續(xù)可微的限制,適應(yīng)度函數(shù)取非負(fù)值,可提高適應(yīng)性能好的個(gè)體被選擇的機(jī)率,使設(shè)計(jì)盡可能簡(jiǎn)便化,降低計(jì)算的復(fù)雜度。
e.判斷是否滿(mǎn)足算法終止條件。最大進(jìn)化代數(shù)作為算法的終止條件,還需其他判定準(zhǔn)則。通常情況下,程序終止發(fā)生在目標(biāo)函數(shù)值小于閾值(閾值常選為10)時(shí);或者經(jīng)判斷發(fā)現(xiàn),連續(xù)若干代種群中的最優(yōu)值都沒(méi)發(fā)生顯變化,程序終止。
f.差分進(jìn)化操作。依據(jù)算法模型進(jìn)行變異、交叉、選擇操作。
通過(guò)利用不同規(guī)模的真題庫(kù),進(jìn)行算法的模擬檢測(cè)。檢測(cè)結(jié)果表明,同基本遺傳算法相比,在組卷成功率與質(zhì)量方面,該算法具備更優(yōu)的性能。
大學(xué)英語(yǔ)考試實(shí)現(xiàn)自動(dòng)化的重點(diǎn)工作就是智能組卷,保證智能組卷最大程度的與考試需求相匹配,使隨機(jī)智能組卷過(guò)程科學(xué)合理。在基于差分進(jìn)化算法的智能組卷過(guò)程中,探索最優(yōu)解用變異算子來(lái)實(shí)現(xiàn),局部開(kāi)發(fā)通過(guò)交叉算子實(shí)現(xiàn),利用選擇策略保優(yōu),使種群完成最優(yōu)進(jìn)化。相比其他算法,BE算法高效穩(wěn)定,具有魯棒性強(qiáng)、原理簡(jiǎn)單、收斂性好、受控參數(shù)少等特點(diǎn)。根據(jù)大學(xué)英語(yǔ)教學(xué)和考試的需求,可快速構(gòu)建智能組卷系統(tǒng)。但同時(shí)也需進(jìn)一步完善優(yōu)化,DE算法缺少相關(guān)理論基礎(chǔ)的支撐,為了進(jìn)一步提高智能組卷系統(tǒng)的科學(xué)性合理性,需對(duì)DE算法進(jìn)行擴(kuò)展,同時(shí)注意有效融合其他算法,將是未來(lái)智能組卷算法的研究方向。