鄭 妮
隨著我國高等教育的普及與發(fā)展,準確和有效利用學生成績數(shù)據(jù)輔助教學管理和調整學生學習進程,已經成為高校教育管理的重要課題之一.已有研究大多基于傳統(tǒng)的統(tǒng)計學方法進行學生成績預測,忽略了學生成績的模糊性和不確定性,難以得到有效的結果[1-3].同時,高校教育系統(tǒng)中的各種原始數(shù)據(jù)復雜且高維,無形中增加了預測的難度[4-5].因此,探索一種新型學生成績預測模型十分重要.史耀凡等[6]通過構建PCA-GA-SVM模型對地表下沉系數(shù)進行預測,結果表明該模型具有較高的預測精度,能有效對地表下沉進行預測分析.喬守旭等[7]在研究數(shù)值下降的兩相流流型中提出了PCA-GA-SVM預測模型,該模型對兩相流流形預測具有較好的效果,在實際應用中具有一定可行性.施龍青等[8]為解決導水裂隙帶發(fā)育高度的問題,提出一種PCA-GA-Elman優(yōu)化模型,實驗結果表明,該模型對高度預測具有較高的精度,能對導水裂隙帶進行鎖定.羅正亮等[9]在水電機組異常狀態(tài)辨別中提出了一種基于PCA-GA-BP的神經網絡,該模型能對水電機組的異常狀態(tài)進行準確辨別,實現(xiàn)水電機組的實時性檢測,隨時防止危險的發(fā)生.經上述分析,GAPCA模型具有較好的優(yōu)化效果.PCA能對數(shù)據(jù)進行降維,以提升整體模型性能.GA能幫助模型跳出局部循環(huán),得到最佳解.因此借鑒已有研究,建立相關預測模型,旨在利用先進的計算方法對學生成績進行更精確的預測.研究通過構建神經網絡模型,使用GA和PCA對模型的前件參數(shù)進行優(yōu)化.并通過PCA方法將復雜的多維數(shù)據(jù)進行壓縮,提升模型的效率.另外,引入遺傳算法對模型參數(shù)進行優(yōu)化,提高模型的擬合性和預測精度.研究的創(chuàng)新點在于構建一個基于神經網絡的學生成績預測模型,此模型不僅考慮了學生成績的模糊性和不確定性,而且通過引入遺傳算法對網絡的前件參數(shù)進行優(yōu)化,提升了模型的擬合性和預測精度.
在高校教育管理中,關注和提升學生成績是十分重要的工作.當前,對學生學習成績造成影響的因素較多,例如課程難度、教學方法、學生積極性等,學習預測模型能通過影響因素對未來成績進行預估,在幫助學生進行狀態(tài)調整的同時,促使教育管理部門提前采取干預措施,進行針對性教學[10-17].因此,構建和完善學習預測模型對提升學習成績和教育質量具有積極意義.研究在自適應神經模糊推理系統(tǒng)的基礎上對主成分分析與遺傳算法進行改進,得到一個基于GA-PCA的學習預測模型.研究構建預測模型的具體流程如圖1所示.

圖1 學習預測模型構建的流程圖
圖1 中,研究采用主成分分析和遺傳算法對模糊神經網絡進行優(yōu)化,主成分分析主要用于高維數(shù)據(jù)的降維,減少數(shù)據(jù)中的多余噪聲,進而提升預測模型的運行效率和預測精度[18-20].利用減法聚類方法與粒子群算法對模型和模型結構進行初始化,采用遺傳算法對模型重要參數(shù)進行優(yōu)化,解決模型陷入局部最優(yōu)解的問題.在自適應模糊推理模型(ANFIS)中,一般有兩項輸入量,輸入量用x與y表示;系統(tǒng)還包含一項輸出量,用z表示.研究假設變量能劃分為一大一小的模糊集合,對兩條模糊規(guī)則進行定義,若輸出量均為小模糊集合,則有公式(1):
式中:f1表示偏小規(guī)則輸出;p、q、r均為輸入變量的權重系數(shù),用于調整輸入變量對輸出結果的影響.同理,若輸出量均為大模糊集合,則有公式(2):
式中:f2表示偏大規(guī)則輸出,系統(tǒng)的最終輸出z由兩項規(guī)則輸出相加得到,則有公式(3):
式中:w表示激活權重.在上述規(guī)則中,研究所構建的ANFIS模型如圖2所示.

圖2 ANFIS模型結構
圖2中,A1、B1表示小模糊集,A2、B2表示大模糊集;ω表示隸屬函數(shù)值的乘積.圖中第一層為模糊化層,該層用于將輸入變量進行模糊化操作.假設系統(tǒng)輸入變量的隸屬度函數(shù)為μA與μB,那么模型第一層的輸出由公式(4)表示.
式中:O1表示隸屬度值,而模型中隸屬函數(shù)具有不同的形式.此次研究中,隸屬函數(shù)如公式(5)所示:
式中:a、b、c均為提前參數(shù),該參數(shù)值可通過學習算法進行調整.模型的第二層為強化層,該層表示所有模糊規(guī)則下的激發(fā)強度是通過隸屬度疊加而成的,不能通過模型訓練得到.隸屬度的疊加如公式(6)所示:
模型的第三層為歸一化層,該層將激勵強度進行歸一化,以便于不同維度數(shù)據(jù)進行比較,其歸一化如公式(7)所示:
模型第四層是函數(shù)組層,該層的一個節(jié)點表示一個函數(shù),該函數(shù)可視作規(guī)則下的輸出值,并且函數(shù)呈線性函數(shù),具有一定單調性,其輸入量與函數(shù)參數(shù)成正比.第四層的隸屬函數(shù)值如公式(8)所示:
模型第五層是模型的輸出口,將前一層的輸出結果累加,最后得到最終輸出,其輸出結果如公式(9)所示:
通過上述分析,研究選用的隸屬函數(shù)決定了前提參數(shù)的形式,而規(guī)則的數(shù)量決定了結論參數(shù)的形式.
根據(jù)預測模型的構建流程,首先對樣本數(shù)據(jù)進行PCA降維[21-23].PCA降維能將多個特征壓縮成少數(shù)典型特征.假設X為數(shù)據(jù)特征指標,則可用向量對特征進行表示,記作=(X1,X2,…,XP).對X→進行線性變換后,能得到一個新的向量,并記作.新向量的特征矩陣如公式(10)所示:
假設ai=(ai,1,ai,2,…,ai,p),A=(a1,a2,…,ap),能得到一定的約束條件.
約束條件1:ai=1.
約束條件2:在滿足ai=1時,Y1的方差最大;當滿足ai=1且與Y1沒有關聯(lián)時,Y2方差越大;以此循環(huán)能得到YP方差值.這些向量的排列順序與方差大小具有一致的方向性.因此在選擇向量時,一般選取靠前的向量.在預測模型生成的部分中,研究采用減法聚類的方法生成模糊神經網絡結構.該方法在實際應用中具有一定的優(yōu)勢,可通過提供原始數(shù)據(jù)得到聚類中心點,之后采用排除法對非聚類中心進行刪除.減法聚類方法是根據(jù)數(shù)據(jù)點附近的密度情況判別聚類中心與非聚類中心.假設在多維空間中存在一定數(shù)量的數(shù)據(jù)點,聚類中心則是這些數(shù)據(jù)點中的一個,此時數(shù)據(jù)點的密度值計算公式為:
式中:γa表示數(shù)據(jù)點的計算范圍,即為聚類半徑.根據(jù)公式(11)可知,聚類中心點周圍具有越多數(shù)據(jù),那么該中心點的密度值越大.在尋找第二個聚類中心點時,需要將第一個聚類中心的影響進行消除.假設選定的第一個聚類中心點為xc1,其密度值記作Dc1,那么第二個聚類中心點密度值如公式(12)所示:
根據(jù)公式(12)可得,第二個聚類中心若與第一個聚類中心的數(shù)據(jù)點進行比較,其密度值會顯著減小,這樣便可確定該數(shù)據(jù)點不屬于相同聚類中心.在常規(guī)情況下,第二個聚類中心的半徑大于第一個聚類中心的半徑,這樣可產生距離合適的聚類中心.在減法聚類方法中,產生初始的ANFIS模型,使該初始模型進行聚類優(yōu)化,優(yōu)化具體流程如圖3所示.

圖3 減法聚類生成的ANFIS網絡結構
在ANFIS中,其參數(shù)的調整通常利用混合算法完成.網絡中的前件參數(shù)通過梯度下降法進行調整;網絡中結論參數(shù)通過最小二乘法進行調整.這樣的調整方式容易使模型陷入局部最優(yōu)解,因此研究通過遺傳算法對模型的前件參數(shù)進行優(yōu)化.在遺傳算法中,研究選取的編碼方式為實數(shù)編碼,將隸屬度函數(shù)的中心與寬度作為遺傳算法的種群個體;通過GA的適應度值計算對隸屬度函數(shù)中心和寬度進行調整;GA的遺傳操作中,研究采用輪盤算法選取最佳個體;在交叉操作中,研究選取單點交叉的方式增加種群豐富度;在變異操作中,確定個體基因的突變位置,然后根據(jù)隨機變異概率對個體進行進化;將個體中最大適應度值作為模型的前件參數(shù);設定模型的輸出誤差,并對模型進行訓練.以上是基于GA-PCA的學習預測模型的全部構建過程.
研究采用MATLAB軟件對構建的GAPCA-ANFIS模型進行仿真實驗.實驗首先利用主成分分析得到1 300組7維的學生成績,并選取其中1 000組數(shù)據(jù)作為模型的數(shù)據(jù)集,其中訓練集占比70%,剩余30%數(shù)據(jù)作為模型的測試集.使用訓練集對GA-PCA-ANFIS預測模型進行訓練,其結果如圖4所示.

圖4 GA-PCA-ANFIS模型的訓練誤差
圖4 中,GA-PCA-ANFIS模型經過20次左右的迭代訓練后,模型的訓練誤差從急劇下降變?yōu)橹饾u趨于穩(wěn)定,當模型經過40次左右的迭代訓練后,模型的訓練誤差已穩(wěn)定于0.011 9.實驗結果表明模型經過訓練,其誤差會逐漸變小,并且訓練誤差未超出給定的誤差值,表明該模型具有一定可行性.訓練后的模型對學生成績進行預測,其結果如圖5所示.

圖5 模型的成績預測結果
圖5 (a)表示模型對學生成績的預測結果,預測值曲線與實際值曲線基本處于吻合狀態(tài),該結果不僅說明模型在學生成績預測方面的可行性,而且也提供了一種在實踐中能準確預測學生成績的方法,對于學生的學習進程管理和調整學習策略均具有重要意義.圖5(b)表示模型預測結果的絕對誤差,當樣本數(shù)量在130左右時,模型正向絕對誤差達到2;當樣本數(shù)量在170左右時,模型負向絕對誤差達到-4;模型絕對誤差基本穩(wěn)定在[-2,2]區(qū)間.圖5(c)表示模型預測結果的相對誤差,當樣本數(shù)量達到170左右時,模型相對誤差為-0.07;當樣本數(shù)量為290左右時,模型相對誤差為0.05;模型的相對誤差穩(wěn)定在[-0.03,0.03]區(qū)間.實驗結果表明模型具有較小的預測誤差,并且成績預測值十分接近期望值,因此模型具有較好的擬合性.研究將改進后的模型與ANFIS模型進行性能對比,對比指標采用均方誤差和平均相對誤差,其結果如表1所示.

表1 模型性能對比結果
由表1可見,ANFIS模型訓練擬合均方誤差大小為3.474 1,平均相對誤差為0.017 9;預測的均方誤差為4.081 6,平均相對誤差為0.018 3.上述數(shù)據(jù)表明,ANFIS聚類在訓練過程中具有較好的擬合性,在預測過程中具有一定預測精度.但與GA-PCA-ANFIS相比較,改進模型的訓練擬合均方誤差為2.063 0,平均相對誤差為0.015 1;預測的均方誤差為2.239 3,平均相對誤差為0.015 4,表明改進后的模型在擬合程度上與成績預測精度上均明顯高于ANFIS模型,因此所提出的GA-PCAANFIS預測模型能在高校學習管理中進行應用.
研究針對高校管理中的學生成績預測進行分析,構建了一個基于GA-PCA的學習預測模型.該模型是通過主成分分析與遺傳算法進行優(yōu)化的網絡模型,通過PCA降維使高維數(shù)據(jù)向低維數(shù)據(jù)轉變,提升模型的綜合效率;使用減法聚類方法確定模型的聚類中心,得到最優(yōu)ANFIS模型結構;最后采用遺傳算法對網絡的前件參數(shù)進行優(yōu)化,從而得到全局最優(yōu)解.研究通過仿真實驗對模型進行驗證,結果表明構建模型的訓練誤差僅為0.017 9,訓練擬合均方誤差為2.063 0,平均相對誤差為0.015 1,預測均方誤差為2.239 3,平均相對誤差為0.015 4.實驗結果證明研究提出的模型具有較好的擬合性和較高的學習成績預測精度,同時該模型在高校管理中的實際應用效果較優(yōu).
研究仍存在不足之處,研究利用遺傳算法對模糊神經網絡的前件參數(shù)進行優(yōu)化,而結論參數(shù)未進行改進,因此后續(xù)研究可從結論參數(shù)優(yōu)化的角度出發(fā),尋找一種更適合的算法進行優(yōu)化.