趙洋
(西安交通大學(xué) 城市學(xué)院, 西安 710049)
改革開放以來,高等教育得到長足的發(fā)展,英語在線網(wǎng)絡(luò)教學(xué)和學(xué)習(xí)系統(tǒng)在各大高校得到了廣泛應(yīng)用,在管理、學(xué)習(xí)、評價和監(jiān)控系統(tǒng)的應(yīng)用過程中,形成了大量有價值的信息數(shù)據(jù),包括學(xué)生個人信息、在線學(xué)習(xí)人數(shù)、課程考試成績、學(xué)習(xí)時長、學(xué)習(xí)興趣點、作業(yè)完成情況、學(xué)習(xí)過程評價等[1]。然而目前這些有價值的數(shù)據(jù)并未發(fā)揮其真實的作用,若能夠利用相關(guān)學(xué)習(xí)分析技術(shù)和數(shù)據(jù)挖掘方法發(fā)掘出潛在的有價值的規(guī)律,有助于英語網(wǎng)絡(luò)學(xué)習(xí)流程和管理流程的優(yōu)化設(shè)計,同時可以為英語網(wǎng)絡(luò)教學(xué)提供科學(xué)決策的依據(jù)。
隨著在線學(xué)習(xí)英語人數(shù)的大量增加,如何實現(xiàn)英語在線學(xué)習(xí)人數(shù)的準確預(yù)測,對網(wǎng)絡(luò)教學(xué)資源的合理配置和利用具有十分重要的意義。針對英語教學(xué)在線學(xué)習(xí)人數(shù)單一預(yù)測模型存在預(yù)測精度低和誤差大的缺點,在支持向量機、指數(shù)平滑和BP神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,提出一種基于IOWA算子的在線英語教學(xué)學(xué)習(xí)人數(shù)預(yù)測的組合模型。

s.t.yi[(W·Xi)+b]-1≥0(i=1,2,…,n)
(1)
其中,b表示偏置,W表示平面間隔。公式(1)描述的問題可轉(zhuǎn)化成偶化問題為式(2)。
s.t.αi≥0(i=1,2,…,n)
(2)
其中,αi表示Lagrange算子。公式(2)的矩陣表示形式如式(3)。
s.t.αi≥0(i=1,2,…,n)
yTα=0
(3)
式中,α=(α1,α2,…,αn)T,b=(1,1,…,1)T,y=(y1,y2,…,yn),Aij=yiyj(xi·xj)。
最終,SVM的決策函數(shù)可表示為式(4)。
(4)
若英語在線學(xué)習(xí)人數(shù)時間序列為{x1,x2,…,xN},則一次指數(shù)平滑(Exponential Smoothing,ES)的遞推數(shù)學(xué)模型如式(5)[3]。
(5)

BP神經(jīng)網(wǎng)絡(luò)是一種誤差反向傳播的網(wǎng)絡(luò),其結(jié)構(gòu)模型如圖1所示[4-5]。

圖1 BP網(wǎng)絡(luò)結(jié)構(gòu)圖
針對英語在線學(xué)習(xí)人數(shù)時間序列{y1,y2,…,yN},其預(yù)測流程如下:
(1)假設(shè)BP神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí)人數(shù)預(yù)測模型的輸入為Y1={y1,y2,…,yD},Y2={y2,y3,…,yD+1},…,Yk={yk,yk+1,…,yD+k},在線學(xué)習(xí)人數(shù)預(yù)測模型模型對應(yīng)的輸出為z1=yD+1,z2=yD+2,…,zk=yD+k+1。
(3)將Y1,Y2,…,Yk作為BP神經(jīng)網(wǎng)絡(luò)在線學(xué)習(xí)人數(shù)預(yù)測模型的輸入,對應(yīng)在線學(xué)習(xí)人數(shù)的預(yù)測輸出數(shù)據(jù)為z1,z2,…,zk,建立預(yù)測網(wǎng)絡(luò)并進行訓(xùn)練,訓(xùn)練之后的網(wǎng)絡(luò)模型為式(6)。
zi=f(Yi)
(6)
為了加速網(wǎng)絡(luò)的收斂速度和提高預(yù)測精度,對數(shù)據(jù)進行歸一化預(yù)處理,歸一化式如式(7)[12]。
(7)
其中,xmin、xmax分別表示英語在線學(xué)習(xí)人數(shù)時間序列{y1,y2,…,yN}中的最小值和最大值。
(4)建立模型后,進行單步預(yù)測如式(8)、式(9)。
(8)
(9)

(5)重復(fù)(2)-(4),就可以實現(xiàn)英語在線學(xué)習(xí)人數(shù)的預(yù)測。
OWA算子是對n個數(shù)x1,x2,…,xi,…,xn遞減排序之后進行賦權(quán)平均的,其中權(quán)值系數(shù)ωi只與xi所在的位置i有關(guān)。IOWA算子是在OWA算子的基礎(chǔ)上將一元函數(shù)擴展成為二維數(shù)組,若〈z1,x1〉,〈z2,x2〉,…,〈zn,xn〉表示n個二維數(shù)組,令式(10)。
(10)

假設(shè)英語在線學(xué)習(xí)人數(shù)時間序列為{xt,t=1,2,…,N},假設(shè)有m種可行的單項預(yù)測方法可以實現(xiàn)在線學(xué)習(xí)人數(shù)預(yù)測。若xit表示第i種模型在第t時刻的預(yù)測值,其中i=1,2,…,m。
當(dāng)|(x1-xit)/xt|<1時,ait=1-|(x1-xit)/xt|;當(dāng)|(x1-xit)/xt|≥1時,ait=0。ait表示第i種模型在第t時刻的預(yù)測精度,其中ait∈[0,1],ait表示xit的誘導(dǎo)值。第t時刻,研究對象的預(yù)測精度和預(yù)測值組成〈v1t,a1t〉,〈v2t,a2t〉,…,〈vnt,ant〉二維數(shù)組,設(shè)W=(ω1,ω2,…,ωm)T表示m種預(yù)測模型在組合預(yù)測模型中所占的權(quán)重系數(shù),將第m種模型在第t時刻的預(yù)測精度序列a1t,a2t,…,amt按照降序排列。設(shè)a-index(it)表示第t時刻第i個大的預(yù)測精度的下標,則式(11)。
(11)
令ea-index(it)=xt-xa-index(it),因此N期的組合預(yù)測誤差平方和S可表示為式(12)[7-8]。
(12)
因此,基于IOWA算子的新型組合預(yù)測模型可表示為式(13)。
(13)
ωi≥0,i=1,2,…,m

minS(W)=WTEW
s.t.RTW=1
W≥0
(14)
其中,R=(1,1,…,1)T,W=(ω1,ω2,…,ωm)T。
為了驗證本文算法的有效性和可行性,選擇我國2002年~2017年英語教學(xué)在線學(xué)習(xí)人數(shù)為研究對象,數(shù)據(jù)如表1所示。

表1 英語教學(xué)在線學(xué)習(xí)人數(shù)
分別研究SVM[9]、指數(shù)平滑[10]、BP神經(jīng)網(wǎng)絡(luò)[11]和IOWA組合模型的英語教學(xué)在線學(xué)習(xí)人數(shù)預(yù)測。將2002年~2015年數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),用于建立預(yù)測模型,建立模型之后對2016年~2020年英語教學(xué)在線學(xué)習(xí)人數(shù)進行預(yù)測。
為了評價預(yù)測模型的效果,選擇平均絕對誤差(Mean Absolute Error,MAE)和平均相對誤差(Mean Relative Error,MRE)作為預(yù)測模型精確度的評價指標,二者分別為式(15)、式(16)。
(15)
(16)

針對我國2002年~2015年英語教學(xué)在線學(xué)習(xí)人數(shù)時間序列,分別研究SVM、指數(shù)平滑、BP神經(jīng)網(wǎng)絡(luò)和IOWA組合模型的英語教學(xué)在線學(xué)習(xí)人數(shù)預(yù)測,其預(yù)測結(jié)果如圖2~圖5所示。

圖2 BP、ES、SVM和IOWA預(yù)測結(jié)果對比圖

圖3 BP、ES、SVM和IOWA預(yù)測絕對誤差對比圖

圖4 BP、ES、SVM和IOWA預(yù)測相對誤差對比圖

圖5 BP、ES、SVM和IOWA預(yù)測相關(guān)性
由圖2~5英語教學(xué)在線學(xué)習(xí)人數(shù)預(yù)測結(jié)果可知,組合預(yù)測模型的精確度相對于單一預(yù)測模型而言,有很明顯地優(yōu)越性,經(jīng)過計算可知,組合預(yù)測模型的精度高達96.67%。
為更清晰地反映基于IOWA算子的組合預(yù)測模型和其他單一預(yù)測模型的預(yù)測誤差,不同方法的預(yù)測指標對比結(jié)果如表2所示。

表2 不同方法預(yù)測結(jié)果評價指標對比
由表2可知,基于IOWA算子的組合預(yù)測模型的兩個評價指標均明顯低于其他三個單一預(yù)測模型,由此證明本文提出的基于IOWA算子的組合預(yù)測模型可有效提高預(yù)測精度。
對2016年~2020年英語教學(xué)在線學(xué)習(xí)人數(shù)進行預(yù)測,預(yù)測結(jié)果如表3和圖6所示。

表3 2016~2020年英語教學(xué)在線學(xué)習(xí)人數(shù)

圖6 預(yù)測結(jié)果
由表3和圖6可知,IWO組合預(yù)測模型在2016年和2017的預(yù)測結(jié)果分別為3 708.17和4 164.25,與實際值的絕對誤差的絕對值分別為37.46和109.91,相對誤差分別為1.00%和2.71%,效果較好。
選擇我國2002年~2017年英語教學(xué)在線學(xué)習(xí)人數(shù)為研究對象,在SVM、指數(shù)平滑、BP神經(jīng)網(wǎng)絡(luò)等三種單項預(yù)測模型的基礎(chǔ)上,提出一種基于IOWA算子的英語在線學(xué)習(xí)人數(shù)組合預(yù)測模型。實證分析結(jié)果表明,該方法可以有效提高預(yù)測的精度。但是,需要引起注意的是,影響預(yù)測結(jié)果的調(diào)節(jié)系數(shù)很多,如學(xué)習(xí)目標、留學(xué)政策、學(xué)習(xí)興趣、地區(qū)差異等。因此,后期需要在本文的研究基礎(chǔ)之上,進一步考慮相關(guān)影響因素,找到影響英語在線學(xué)習(xí)人數(shù)的核心因素并對其進行量化處理,進一步完善在線學(xué)習(xí)人數(shù)預(yù)測模型。