郭濤 魏勇 熊杰



摘? 要: 大學生的學習成績與其學習狀態和習慣有正相關性。教師工作手冊中記錄的考勤、答問與作業信息反映了學生的學習狀態,智慧課堂中的隨堂提問、課后作業、座位偏好等信息進一步反應出學生的行為習慣。充分利用上述數據進行期末成績預測并向學生反饋學業警示和鼓勵信息,將對教學起到積極作用。設計了PSO-BP神經網絡預測模型來進行學生行為數據挖掘,篩選了具有代表性的數據作為神經網絡的輸入,選擇課程成績作為神經網絡的輸出,成績預測誤差為12%,為提高教學質量提供了新的思路。
關鍵詞: PSO算法; BP算法; 神經網絡; 成績預測; 智慧課堂; 數據挖掘
中圖分類號:G642;TP183? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2021)03-52-05
Research on the application of PSO-BP neural network predictive model in smart classroom
Guo Tao1, Wei Yong1, Xiong Jie2
(1. Electronics & Information School, Yangtze University, Jingzhou, Hubei 434023, China; 2. Huanggang Normal College)
Abstract: College students' academic performance is positively correlated with their learning status and habits. The attendance, Q&A, and homework information recorded in the teacher's work manual reflects the student's learning status. In the smart classroom, information such as in-class questions, homework, seat preference, etc. further reflects the behavior of students. Making full use of the above-mentioned data to predict the final grade and feedback the academic warnings and encouraging information to students will play a positive role in teaching. The PSO-BP neural network prediction model is designed to conduct student behavior data mining, representative data is selected as the input of the neural network, and the course score is selected as the output of the neural network, and the score prediction error is 12%, which provides a new idea for improving the teaching quality.
Key words: PSO algorithm; BP algorithm; neural network; performance prediction; smart classroom; data mining
0 引言
2017年7月,國務院印發了《新一代人工智能發展規劃》[1],首次提出要利用智能技術實現教學方法的改革,構建新型的智能教育體系。2018年10月,教育部發布的“教高 40條”[2]中明確指出要大力推動人工智能(AI)等技術在教學與管理中的應用,打造適應學生需求的智慧課堂,推進現代信息技術與教育教學深度融合。由此可見,人工智能技術方法將是實現智慧課堂和推動教育教學改革的核心技術方法。
目前,國內高校紛紛探索將大數據、人工智能等前沿技術應用于智慧課堂中。例如:文獻[3]探索構建教、學、考、評的閉環教學模式,線上與線下相互結合,為打造智慧課堂提供了合理的方法和完備的路徑。文獻[4]針對學生課堂學習過程中學習效果的量化和教學過程數據化困難的問題,提出基于微信公眾號的AI技術融合方案,如使用大數據挖掘技術來量化學習效果等方案,實現“AI+教育”的智慧課堂。
基于以上背景,借助于智慧課堂教學軟件,使用多種人工智能技術對學生學習過程中的數據進行量化(如通過圖像識別技術實現課堂考勤、抬頭率檢測和表情識別等)。量化后的學情數據結合神經網絡技術進行教育大數據的挖掘,從大量的教育數據中分析學生的學習效果,并給出成績預測。以預測結果為依據,采取不同的干預措施,這樣不僅可以為教師設計與調整教學方法提供理論依據,還可以為提高學生的課程考試成績以及提升高校的教學質量提供幫助和支持,進一步促進教育體制的改革、發展和完善[5-6]。因此,開展智慧課堂結合神經網絡預測模型的應用研究具有理論指導意義和實際應用價值。
1 智慧課堂教學
1.1 教學過程
智慧課堂的教學過程分為課前考勤、課中監管和課后答疑三個階段。課前考勤是教師對學生平時成績打分的重要依據,智慧課堂依托物聯網設備進行人臉識別打卡,有效地避免了時間和人力成本的浪費、提升效率、考勤全面。課中監管的過程中,智慧課堂軟件可以實現課堂問答,彈幕互動,座位信息識別,教師端屏幕廣播,學生端提交作業,隨堂測試等功能。例如:針對部分同學精力不集中問題可以進行課堂點名問答;對于部分實踐性較強的內容教師可以將自己的屏幕廣播給同學們進行觀看學習。在課程結束后,教師可以解答同學們的問題、根據每個同學的學習情況推送個性化的學習內容、布置課后作業來鞏固知識。
1.2 智慧課堂與成績預測
隨著“騰訊課堂”、“雨課堂”等優質線上智慧教育平臺在大學教學過程中的廣泛應用,極大地促進了智慧課堂從理念到現實的應用轉換。然而在實際應用過程中,雖然此類平臺詳實記錄了大量教學過程數據和信息,但這些數據卻只形成了單項排序和統計圖表[7],數據之間相互獨立,沒有發揮智慧課堂的全部優勢。文獻[8]以《高等數學》課程為例,運用SPSS軟件對學生的期末成績進行統計分析,結果表明,學生平時表現和期末考試成績之間的相關系數為0.785,說明學生的平時表現和課程考試成績的相關度很高。由此可見,使用智慧課堂記錄的大量學生的歷史表現數據對學生未來的課程成績進行預測是可行、可信的。如果我們針對不同預測成績,采取對應的學業預警或學業鼓勵方法,將對于改善學生的課堂表現,減少掛科率具有積極的意義。
圖2為針對不同預測成績的應對策略,其基本思想是:對于預測成績低于60分的同學,及時地發出學業預警電子郵件,警示該同學改變現狀,避免出現該門課程不及格的結果;如果發出預警后該同學仍無動于衷,這將導致后續預測成績仍然不及格,此時可以通過郵件或電話方式通知該同學的輔導員或家長,進行早期干預、使用多種手段來督促該生學習;而對于預測成績高于85分的同學,可發送學業鼓勵郵件,鼓勵其再接再厲,繼續保持當前狀態將會取得理想的分數。
1.3 成績預測模型
BP神經網絡具有很強的非線性擬合能力,可映射任意復雜的非線性關系,而且學習規則簡單,便于計算機實現,具有很強的魯棒性、記憶能力、非線性映射能力以及強大的自學習能力,因此在數值擬合預測方面得到了廣泛應用。文獻[9]篩選出影響學生表現的因素作為神經網絡的輸入數據,使用往屆學生的歷史成績作為輸出結果,基于BP算法建立了人工神經網絡預測模型,預測學生表現的測試精度達到了84.6%,說明了BP神經網絡在預測學生成績方面具有很好的魯棒性,驗證了此方法對解決成績預測問題的可行性。
使用BP神經網絡需要首先確定網絡的輸入和輸出,而智慧課堂軟件會采集課程管理過程中的各類數據,這包括考勤數據、問答統計、互動次數、測試分數、作業分數、座位信息等數據,究竟選取哪些數據作為神經網絡的輸入顯得尤為重要。文獻[10]使用聚類算法對影響學生成績的因素進行分析,結果表明在影響學生成績的主觀因素方面,學生的課程興趣、課前考勤、課堂狀態、課后作業對成績影響因素較大。綜上,選取學生的課前考勤、課堂表現、課后作業三類信息作為神經網絡的輸入;成績預測模型的輸出為一個節點,即該課程的綜合成績。
2 PSO-BP神經網絡拓撲
2.1 BP神經網絡
BP神經網絡是一種采用誤差反向傳播算法并不斷進行修正訓練的一種多層前饋式神經網絡,是目前應用最為廣泛的人工神經網絡模型之一,廣泛應用于網絡檢測、信息預測等領域中[11]。其基本思想是利用LMS學習算法,在神經網絡的訓練過程中利用損失函數和不同的優化器來更新權值、閾值,從而最小化神經網絡的輸出值與實際值之間的偏差。典型的神經網絡拓撲結構包含輸入層(Input)、隱含層(Hidden)、輸出層(Output)的3層網絡結構。
圖3中Ii,Hj,Ok分別為輸入層、隱含層、輸出層的某一單元,從輸入層單元Ii到隱含層單元Hj的連接權值為wij,閾值表示為a,從隱含層單元Hj到輸出單元Ok的連接權值為wjk,閾值表示為b。其學習過程包括前向傳播過程和依據輸出值和期望值的偏差進行反向傳播更新權值閾值兩部分。
⑴ 前向傳播計算
第j個隱層神經元的輸出為:
[Hj=? s(i=1iIiωij+bj)]? ⑴
第k個輸出層單元的輸出為:
[Ok=s(k=1kHjωij+bk)][ Ok=s(k=1kHJ·wjk.+bk)]? ⑵
⑵ 反向傳播更新
神經網絡正向傳播輸出為:
[Ok=(O1,O2,O3,…,Ok)] ⑶
則神經網絡在(Ii,Ok)的MSE損失函數為:
[Ek= 12kk=1k(Ok- Ok)2]? ⑷
為減小輸出誤差,權值的修正從輸出層開始向前一層進行修正,根據提前設定的學習率α,得到權值調整值為:
[?ωjk= -α?E?ωjk]? ⑸
然后修正權值為:
[ω=ω+?ω=ωjk-α?E?ωjk]? ⑹
至此,完成一次BP算法的訓練過程。但由于BP神經網絡中的參數眾多,每次訓練過程都會更新大量的權值和閾值,計算量也會隨著層數和節點數的增加呈幾何倍增加,容易產生收斂速度變慢的問題。同時BP神經網絡在訓練過程中,其修正值容易陷入局部最優解,從表面看誤差值符合要求,但此時得到的解卻不一定最優。
2.2 PSO算法優化BP神經網絡
考慮成績影響因素的非線性特征,以及對其影響因素的復雜性,同時為了克服BP神經網絡容易陷入局部最優的缺陷,加快BP神經網絡的收斂速度,本文采用粒子群優化算法(PSO算法)來優化BP神經網絡的初始參數。PSO算法會在更大的空間內搜索最優解,具有很強的全局尋優能力,一定程度上彌補了BP神經網絡易陷入局部最優的不足,能進一步減小神經網絡輸出誤差。PSO-BP優化算法的具體流程如下:
Step1 確定BP神經網絡的拓撲結構,對于BP神經網絡隱含層數的選擇,在滿足精度要求的情況下選取一個隱含層可以避免層數過多導致的過擬合問題。因此實驗選擇典型3層BP神經網絡結構。隱含層節點數的選擇有如下公式:
[hidden=input+output+a] ⑺
當確定了輸入節點數為3,輸出節點數為1時,調節常數a的取值范圍是1-10,因此最優隱含層節點數范圍確定為3-12之間。最后通過反復實驗對比不同隱含層節點數的神經網絡性能表現,確定隱含層最優節點數為4,最終的BP神經網絡拓撲結構如圖4所示。
Step2 初始化種群,將BP神經網絡各層的連接權值wij、wjk和閾值a、b拼接成為單個粒子的位置向量。如圖3中的權值閾值可拼接得到單個粒子的位置向量:
posn=(w11,w11, a11, b11…wij ,wjk ,aij,bij)=(posn1 …posnd)
再初始化每個粒子對應的速度向量:
vn? = (vn1…vnd)
在迭代搜索的過程中記錄第i次更新得到的個體粒子最優位置記錄為:
pbestn? = (pn1…pnd)
記錄當前群體最優值為:
gbestn = (pg1…pgd)
Step3 使用粒子群優化算法的迭代公式進行迭代尋優
[vi= ω*vi+c1*rand*pbesti-xi]
[? ? ? ? ? ? ? ? ?+c2*rand*gbesti-xi]? ? ⑻
采用迭代公式運算時,式8中的c1和c2分別代表個體學習率和群體經驗的學習率。其中,慣性因子w較大時可獲得較強的全局尋優能力,隨著迭代次數的增加,迭代的全局收益逐步降低,此時逐漸減小慣性因子w可以進行精細的局部搜索,這種方法稱為線性遞減權值策略,可以獲得更好的全局尋優結果。
Step4 粒子的適應度函數同樣使用均方差損失函數進行評估當迭代次數達到設置的上限或適應度函數滿足設置的精度要求,則停止迭代,完成優化權值閾值的初值。
Step5 優化后進行訓練,此時BP神經網絡獲得了最優的權值、閾值,在此基礎上開始訓練神經網絡,直至滿足設定的最小誤差精度,則停止訓練,輸出結果。
3 實驗與分析
3.1 數據處理和參數設置
實驗中所有的學生數據來源于多名教師教學工作手冊中的學生考勤與成績記載信息和智慧課堂軟件記錄的數據庫,如圖5所示。主要獲取以下三種信息:①課程教學的考勤信息(人工簽到和軟件統計簽到數據);②課堂上學生回答問題情況的統計信息(人工記錄和結合軟件記錄);③學生的作業完成情況統計信息(人工打分和軟件統計數據)。收集到的信息經過數據篩選和清洗后,進行統一量化,建立百分制的樣本數據集,如表1所示。
預測模型的初始化參數設置原則如下:加速因子c1=1.5,c2=1.5,初始權值采用線性權值遞減策略,wmax=0.9,wmin=0.4,種群規模N=200,最大迭代次數設置為500。實驗使用相同的網絡結構和初始化參數來訓練BP神經網絡和PSO-BP 神經網絡并進行預測輸出。
3.2 實驗結果與分析
使用PSO算法在優化BP神經網絡的權值、閾值時,其適應度函數的輸出值隨著粒子尋優的迭代更新,在模型訓練完成后,導入60個測試數據集對模型進行測試。為了便于顯示,60個測試數據集按照實際的課程成績升序排序。最終得到傳統BP神經網絡和PSO-BP網絡的輸出,對比結果如圖6所示。
從圖6可以直觀地看出,BP算法和PSO-BP算法均能較好的逼近非線性的實際課程成績。但PSO-BP算法結果的決定系數R2,要大于BP算法的結果,因此PSO-BP算法的非線性擬合效果要優于傳統BP算法的結果。
圖7進一步給出了PSO-BP和BP算法的預測誤差對比結果。其中虛線曲線代表BP算法輸出結果,誤差范圍在[-2.2,3]以內。實線曲線為PSO-BP算法結果,誤差范圍是[0.8,-0.8],對比誤差范圍可見,PSO-BP較于傳統BP算法明顯較優。
綜上所述,PSO-BP算法和BP算法均能獲得較好的預測結果,前者的全局尋優能力優于后者,有效提高了預測精度(多次測試均在±3%內),對各層次水平的學生均能達到較高的預測精度。
4 結束語
本文提出了一種應用于智慧課堂的基于神經網絡的成績預測模型,該模型可利用教師的教學工作手冊或者智慧課堂軟件記錄的學生課堂表現信息進行教育數據挖掘,能獲得較好地預測學生的期末成績,其預測精度達到±3%。若希望進一步提高預測精度,可考慮在網絡的訓練過程加入影響考試成績較強的因素,例如學生的座位偏好信息,將可以進一步提高預測結果的準確度,當然這也對智慧課堂軟件提出了更高的要求。
充分利用神經網絡預測模型,有針對性地使用多種方法來激勵學生的學習狀態朝著積極的方向發展,不僅可以為制定下一步的教學策略提供幫助,還能讓高校的教育教學工作和教育管理工作更有成效[12]。在人工智能技術不斷發展的今天,智慧課堂結合人工智能技術的應用前景是無可估量的,二者的深度融合也是未來教育發展的必然趨勢。
參考文獻(References):
[1] 中華人民共和國國務院.國務院關于印發新一代人工智能發展規劃的通知 [EB/OL].(國發〔2017〕35號).
[2] 中華人民共和國教育部.教育全面提高人才培養能力的意見 [EB/OL].(教高〔2018〕2號)(簡稱“教高40 條”).
[3] 曲雙紅,孟令顯.借助雨課堂,創新構建“教、學、考、評”閉環教學模式[J].教育現代化,2019.6(85):268-271,278
[4] 李群,徐鼎,肖甫.基于微信公眾號的“AI+教育”智慧課堂實施方法[J].計算機教育,2019.2:136-139
[5] 陳佳明,駱力明,宋潔.大學基礎課課程成績加權投票預測模型研究[J].現代電子技術,2020.43(1):93-98
[6] 彭濤,丁凌云.基于教育數據挖掘學生表現預測模型構建研究[J].黑龍江高教研究,2015.11:55-58
[7] 楊世瀚,章維亞.基于“雨課堂”的教學過程知識庫構建及學生成績智能評估[J].高教學刊,2020.14:15-18
[8] 董倩倩.基于spss的《高等數學》期末考試成績評價與預測[J].教育現代化,2019.6(85):236-237,246
[9] Samy Abu Naser, Ihab Zaqout. Predicting Student
Performance Using Artificial Neural Network: in the Faculty of Engineering and Information Technology.[C]. International Journal of Hybrid Information Technology,2015.8(2):221-228
[10] 謝娟英,張宜,陳恩紅.學生成績關鍵因素挖掘與成績預測[J].南京信息工程大學學報(自然科學版),2019.11(3):316-325
[11] Samy Abu Naser, Ihab Zaqout. Predicting Student
Performance Using Artificial Neural Network: in the Faculty of Engineering and Information Technology,2015.8(2):221-228
[12] 胡祖輝,徐毅.大數據背景下高校教育數據的分析與應用研究[J].現代教育科學,2017.1:109-11