陸 峰
(長江大學計算機科學學院,湖北 荊州 434023)
基于因子分析的自適應學習平臺算法研究
陸 峰
(長江大學計算機科學學院,湖北 荊州 434023)
為解決網絡學習平臺的自適應問題,采用因子分析方法,對決定學習內容難度和學習者能力的各影響因子進行分析,并對各影響因子進行定量分析計算,得到兼顧學習內容難度和學習者能力的智能自適應效果。實踐應用證明,該算法可以提供較好的內容適配過程,是一種可行的算法。
因子分析;自適應學習平臺;難度水平;學習者能力
隨著網絡技術的不斷發展,遠程教育、終身學習、終身教育等理念也隨之深入人心,使得越來越多有著不同文化背景、文化層次、水平能力的人使用互聯網獲取所需知識和信息。“以不變應百變”的互聯網內容體系面臨著巨大的挑戰,如何給具有不同文化層次、水平能力的人提供與之適應的內容資源已成為當前學術研究的熱點。自適應學習平臺的構建即是在線學習(E-learning)領域為解決該問題做出的探索。下面,筆者采用因子分析法[1]對自適應學習平臺進行可行性算法分析,對系統中的絕對影響因子——內容素材和學習者能力進行細化分析,并對各自細化影響因素進行量化捕捉。

圖1 系統功能層級圖
系統包含5個主要功能層級:數據庫層、學習者能力獲取層、數據挖掘層、內容適配層、表示層,其功能圖示如圖1所示。
用戶進入系統后其數據流程描述如圖2所示。
2.1學習內容難度系數D的計算
學習內容難度初始系數分為5個等級[2]:D={d1,d2,d3,d4,d5}={很難,難,適中,簡單,很簡單},且有:

如何來動態調整確定學習內容的難度系數,并把其歸屬到何種等級是需要探索的重點,筆者把其影響因子確定為3個:{專家制定,教師制定,學生制定}={D1,D2,D3},其中:

圖2 系統用戶數據流圖

式中,m、i、j分別代表參與制定的專家、教師和學生代表人數;Rm、Ri、Rj分別代表相應給出的難度系數,均受D值約束。
因專家群體,教師群體和學生群體所占權重不同,分別分配以不同權重值W1,W2,W3,且W1+W2+W3=1, 0 系統中,W1、W2、W3的值是可調整的,且因為系統用戶的動態性(包括群體能力水平的不均衡和個體的不均衡),系統中的學習內容難度也是隨之動態變化的。 2.2學習者能力水平系數A的計算 學習者能力水平系數分為5個等級:A={a1,a2,a3,a4,a5}={很高,高,一般,低,很低},且: (系統中,臨界值可以初始化調整) 如何來確定學習者能力水平,并把其歸屬到何種等級也是需要探索的重點。筆者把其影響因子確定為6個:{內容問卷,內容測試,內容學習時長,知識鏈接點擊數,搜索引擎使用數,鼠標無目標運動和點擊數}={F1,F2,F3,F4,F5,F6},其權重分配相應為{w1,w2,w3,w4,w5,w6},且w1+w2+w3+w4+w5+w6=1,且均為0~1正值,下面分析各因子計算方法。 1)內容后置問卷確定系數F1為捕捉學習者的當前學習能力,每個學習內容單元后都置有問卷,問卷內容簡單。學習者自身對內容理解的程度記為X1={完全理解,理解,一般,不完全理解,完全沒理解},其對應水平能力系數初始記為{f1,f2,f3,f4,f5}。系統采用統計學方法,對所有參與該學習單元問卷結果進行統計,計算出的具體比例值作為矯正系數F1的計算依據。 如當前學習者問卷選項為{理解},對應水平能力系數為{f2},而在統計人數中,有比例為f的人選擇了{一般}及以下,則F1應被理想化矯正為: f越靠近(f3+f4+f5)的值,則說明F1越的值越靠近f2。 2)內容后置測試反饋確定系數F2為捕捉學習者的當前學習能力,每個學習內容單元后都置有測試環節,其對當前學習單元的內容進行簡單測試,以反饋學習者的知識掌握情況,學習者測試的具體得分值轉化為百分制后歸一值即為系數F2。 3)內容頁面學習時長確定系數F3學生在利用系統進行學習時,每個單元學習內容頁面上所停留的時間(學習時長)是其能力水平的一個直觀外顯。在此信息中,系統需要過濾一些干擾信息,如停留時間過長或過短,過長可能因為沒有專注學習,轉移了注意力,過短則可能因為突發事件導致其中斷學習等。 F3=b4-(b4-b3)×(1-b) 4)內容頁面知識鏈接點擊次數確定系數F4系統采用統計方法,對所有學習者點擊次數進行記錄,統計出多于當前學習者、少于當前學習者及等于當前學習者點擊次數的比例,各自記為a,b,c,有a+b+c=1,且均為0~1正值,則當前學習水平能力系數可近似計算為: 5)內容頁面搜索引擎使用次數確定系數F5內容頁面搜索引擎是為學習者提供的又一學習輔助功能,由此所確定的系數F5和F4的計算方法相似,在此不作贅述。 6)鼠標無目標活動和點擊數確定系數F6系統利用統計學方法,把所有學習者的相應操作信息進行線性運算處理統計,即把上述幾種信息視為線性相關變量,計算出當前學習者所處的位置狀態,即為其在此維度上表現出的學習能力水平,其計算原理和F4的計算方法相似,在此不作贅述。 假設6個影響因子{F1,F2,F3,F4,F5,F6}通過計算取值分別為{0.8,0.8,0.7,0.8,0.65,0.8},其權重分配相應為{w1,w2,w3,w4,w5,w6}={0.15,0.3,0.2,0.15,0.1,0.1},可以得出: 計算結果為0.765,表明當前學習者能力水平居于a2層級,即為{高}水平能力。 2.3內容適配過程 通過上述方法進行確切計算,系統通過規則庫的推理,對學習者所反映出的能力水平高低,推出相對應級別的學習內容。系統規則庫可簡化描述為: If User=a1then Pushd1 … If User=a5then Pushd5 自適應學習是E-learning領域中研究的熱點。筆者采用因子分析法對自適應學習平臺進行可行性算法分析,對系統中的絕對影響因子——內容素材和學習者能力進行細化分析,并對各自細化影響因素進行量化捕捉。系統在獲取兩者系數之后,進行自動適配,使得學習者能夠在能力不斷變化的同時獲得對應難度的學習內容,提高學習者的學習效率。 [1]游家興.如何正確運用因子分析法進行綜合評價[J].統計教育,2003(56):10-11. [2]Chih-ming Chen, Hahn-ming Lee, Ya-hui Chen. Personalized E-learning system using Item Response Theory[J]Computers & Education,2005,44:237-255. [3]Huang Chenn-Jung, Chu San-Shine, Guan Chih-Tai. Implementation and performance evaluation of parameter improvement mechanisms for intelligent E-learning systems[J].Computers & Education,2007,49:597-614. [編輯] 洪云飛 10.3969/j.issn.1673-1409.2011.04.027 TP391 A 1673-1409(2011)04-0083-03



3 結 語