摘 要探討了智能個性化系統(tǒng)在遠程教育的主要功能,并提出了一個基于Web數(shù)據(jù)挖掘的個性化遠程教育系統(tǒng)的模型。
關(guān)鍵詞 Web數(shù)據(jù)挖掘;遠程教育;智能個性化系統(tǒng)
中圖分類號:G434文獻標識碼:A文章編號:1671-489X(2007)12-0081-03
Construction of Distance Learning System based Personality of Web Data Mining//Qiu Xiaohui
Abstract This paper inquiries the major function of intelligent personalized systems in distance education, and puts forward a model about personalized intelligent distance education system based Web data mining.
Key words Web data mining;distance education;personalized intelligent system
Author's address Department of Information Technology, Huazhong Normal University,Wuhan 430079
利用Web數(shù)據(jù)挖掘技術(shù)構(gòu)建遠程教育個性化系統(tǒng),能彌補傳統(tǒng)遠程網(wǎng)絡(luò)教學(xué)不具備的真正的“以學(xué)習(xí)者為中心”、不能隨學(xué)習(xí)者個體的差異而調(diào)整教學(xué)的缺陷,為學(xué)生的個性化學(xué)習(xí)以及教師對學(xué)生教學(xué)指導(dǎo)提供便利。
1 個性化服務(wù)及其關(guān)鍵技術(shù)
1.1 個性化服務(wù)的概念
個性化服務(wù)的根本就是尊重用戶,研究用戶的行為習(xí)慣與興趣,為用戶選擇更需要的資源,提供更好的服務(wù)。遠程教育系統(tǒng)的個性化可根據(jù)用戶的需求、興趣愛好、能力差異等,為用戶選擇對應(yīng)的學(xué)習(xí)資源,提供智能化的學(xué)習(xí)指導(dǎo),并根據(jù)用戶的需求變化,動態(tài)呈現(xiàn)資源。
1.2 個性化服務(wù)關(guān)鍵技術(shù)
個性化推薦系統(tǒng)中應(yīng)用的一項關(guān)鍵技術(shù)即Web挖掘(Web Mining),Web挖掘就是從Web文檔和Web活動中抽取用戶感興趣的、潛在的有用模式和隱藏的信息。Web挖掘根據(jù)需要分析的數(shù)據(jù)分為3種類型:Web內(nèi)容挖掘、Web使用挖掘以及Web結(jié)構(gòu)挖掘。
2 智能個性化學(xué)習(xí)系統(tǒng)實現(xiàn)的主要功能
智能個性化學(xué)習(xí)系統(tǒng)實現(xiàn)的主要功能有:(1)跟蹤學(xué)習(xí)者網(wǎng)上學(xué)習(xí)行為,統(tǒng)計分析學(xué)生近期訪問情況,分析瀏覽路徑,發(fā)現(xiàn)學(xué)習(xí)者興趣,預(yù)測學(xué)生可能的訪問頁面,進行頁面推薦;(2)根據(jù)學(xué)生的學(xué)習(xí)進度、作業(yè)與測試、答疑及交互信息,統(tǒng)計分析學(xué)生對知識點的掌握情況,為學(xué)生提供學(xué)習(xí)指導(dǎo)與建議,對掌握薄弱的知識點及感興趣的知識點進行推薦;(3)網(wǎng)上學(xué)習(xí)者的學(xué)習(xí)風(fēng)格、認知特點等都存在較大差異,個性化學(xué)習(xí)系統(tǒng)根據(jù)學(xué)生的基本信息及學(xué)生學(xué)習(xí)行為的分析,提供不同的學(xué)習(xí)指導(dǎo),推薦不同類型學(xué)習(xí)資源,適應(yīng)網(wǎng)上學(xué)習(xí)者的學(xué)習(xí)需求;(4)通過聚類、分類,能對相同學(xué)習(xí)偏好以及學(xué)習(xí)風(fēng)格的學(xué)習(xí)者進行分組,利于學(xué)生的協(xié)作學(xué)習(xí);(5)通過統(tǒng)計分析,系統(tǒng)地為教師提供有關(guān)學(xué)習(xí)者個體以及群體的學(xué)習(xí)進度、學(xué)習(xí)績效等相關(guān)信息,并通過可視化呈現(xiàn)給教師,方便教師進行教學(xué)指導(dǎo)。
3 智能個性化遠程教育系統(tǒng)的構(gòu)建
3.1 個性化推薦系統(tǒng)的基本工作原理
為描述用戶的特征,有必要為每個用戶建立一個用戶概貌文件(user profile)以刻畫用戶的特征。本系統(tǒng)采用基于XML的RDF(resource definition framework)來表達用戶描述文件,利用支持XML的數(shù)據(jù)庫系統(tǒng)來存儲用戶概貌文件。系統(tǒng)采用顯示跟蹤和隱式跟蹤相結(jié)合的方式獲取學(xué)習(xí)者學(xué)習(xí)信息。在學(xué)習(xí)者首次登錄時,填寫注冊信息并進行個性化測試,結(jié)合對學(xué)習(xí)者網(wǎng)上學(xué)習(xí)行為、學(xué)習(xí)者基本信息、作業(yè)及考試信息以及交互信息的收集、處理、挖掘,建立學(xué)習(xí)者概貌文件(如圖1所示),根據(jù)該文件為每個學(xué)習(xí)者進行個性化推薦,并隨著學(xué)習(xí)者網(wǎng)上學(xué)習(xí)的繼續(xù)而不斷進行,逐步優(yōu)化學(xué)習(xí)者個性化概貌文件,從而提供最適合的推薦給學(xué)習(xí)者。學(xué)生個性化推薦的系統(tǒng)原型見圖2。

Web個性化推薦系統(tǒng)分在線處理和離線處理。在線階段,根據(jù)用戶的推薦請求,觸發(fā)個性化推薦引擎,推薦引擎根據(jù)用戶ID以及用戶個性化數(shù)據(jù)庫產(chǎn)生個性化推薦結(jié)果,并把推薦結(jié)果通過服務(wù)器反饋到用戶瀏覽器。在離線階段進行對用戶各類信息的挖掘處理,從而縮短系統(tǒng)的響應(yīng)時間。
3.2 學(xué)生個性化推薦的離線階段處理
3.2.1 收集數(shù)據(jù)
遠程教育站點能提供大量有用的信息。在遠程學(xué)習(xí)中,學(xué)生以學(xué)號登錄系統(tǒng),系統(tǒng)根據(jù)學(xué)號記錄學(xué)習(xí)行為,信息包括網(wǎng)絡(luò)日志(學(xué)習(xí)者訪問URL、訪問時間、資源類型等)和相應(yīng)的學(xué)習(xí)記錄(學(xué)習(xí)者的學(xué)號、訪問的課程、訪問時間、停留時間等信息;學(xué)生作業(yè)與測試信息:學(xué)生ID、考試時間、成績、題庫編號等;在線討論以及答疑信息:學(xué)生ID、討論時間、問題)。
3.2.2 數(shù)據(jù)預(yù)處理
在數(shù)據(jù)預(yù)處理階段,去除原始數(shù)據(jù)中的無關(guān)信息,并識別用戶,對用戶的訪問進行會話識別和事物識別,為數(shù)據(jù)挖掘作好數(shù)據(jù)準備。
3.2.3 進行數(shù)據(jù)挖掘
(1)統(tǒng)計分析。通過分析學(xué)習(xí)者日志文件以及服務(wù)器數(shù)據(jù)庫中的數(shù)據(jù),讀出各種統(tǒng)計分析描述,如學(xué)習(xí)者在某頁面上停留的平均時間,學(xué)生作業(yè)及考試統(tǒng)計信息,學(xué)生交互信息(提問、回答的次數(shù))等等。
(2)關(guān)聯(lián)規(guī)則發(fā)現(xiàn).通過關(guān)聯(lián)規(guī)則發(fā)現(xiàn)學(xué)習(xí)者興趣知識點之間的聯(lián)系,并動態(tài)地呈現(xiàn)給學(xué)生。例如,當(dāng)訪問了頁面a后訪問頁面b的學(xué)生數(shù)量超過預(yù)定的值時,認為a與b頁面存在關(guān)聯(lián),在學(xué)生訪問頁面a時,系統(tǒng)就會自動地提供指向頁面b的鏈接。
(3)分類聚類。聚類分用戶聚類和頁聚類,用戶聚類能挖掘出具有相似瀏覽模式的用戶,頁聚類發(fā)現(xiàn)相關(guān)內(nèi)容的頁面。用分類來為一組用戶建立概貌文件,利用分類聚類技術(shù)把具有形似瀏覽行為的學(xué)習(xí)者歸為一類,當(dāng)同類學(xué)習(xí)者登錄站點時,根據(jù)同類用戶概貌文件進行推薦。
(4)序列模式。序列是指在時間戳有序的事務(wù)集中挖掘訪問Web網(wǎng)頁的先后順序的模式。70%學(xué)完A、B章的學(xué)生一個月后學(xué)習(xí)C章,且頻繁訪問A、B章節(jié)中A1、A5、B3知識點,這說明對這些知識點的掌握情況在一定時間后開始下滑。因此在1個月內(nèi)可以對學(xué)習(xí)過A、B章的學(xué)習(xí)者推薦一些輔助練習(xí)和定期測試,幫助他們牢固掌握知識點。
綜合運用以上4種Web挖掘方法,建立學(xué)生概貌文件,得到用戶個性化數(shù)據(jù)庫,根據(jù)用戶登陸ID對學(xué)習(xí)者的網(wǎng)上學(xué)習(xí)進行實時推薦。
3.3 教師的個性化推薦
教師推薦模塊中,對學(xué)生的學(xué)習(xí)偏好、作業(yè)、提問以及學(xué)習(xí)風(fēng)格等信息進行挖掘,為教師提供學(xué)習(xí)者個體及群體的可視化圖表,便于教師掌握學(xué)生情況,因材施教。教師推薦流程見圖3。

(1)對學(xué)生網(wǎng)上瀏覽行為、作業(yè)與測試以及交互情況的統(tǒng)計分析,為教師提供有關(guān)全班學(xué)生的總體情況的信息。教師通過這些數(shù)據(jù)了解哪些知識點學(xué)生掌握較好,哪些知識點學(xué)生掌握不足,了解學(xué)生學(xué)習(xí)問題存在的普遍性和個別性。
(2)通過可視化圖表,大體獲得學(xué)生學(xué)習(xí)興趣、偏好以及學(xué)習(xí)風(fēng)格、學(xué)習(xí)進度等相關(guān)信息,使教師對每位學(xué)生有大致的了解,方便教師有針對性地進行教學(xué)指導(dǎo)。
(3)運用分類聚類,可以將有相似學(xué)習(xí)風(fēng)格以及相似學(xué)習(xí)偏好的學(xué)生進行分組,為學(xué)生進行合作化學(xué)習(xí)及小組學(xué)習(xí)提供幫助。
(4)對師生交互信息進行挖掘,使教師可以獲得學(xué)生對教師的評價,進行教學(xué)改進。