向陽 郭鑫 陳千 黃震華
摘要:本文在數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的特色和內容的研究基礎上,討論了該課程實驗教學的重要性和意義,開發(fā)了教學實驗平臺。實踐表明該平臺能提供在線交互式教學,有效管理教學,激發(fā)學生積極性。
關鍵詞:實驗平臺;教學管理;數(shù)據(jù)倉庫;數(shù)據(jù)挖掘
中圖分類號:G642 文獻標志碼:B 文章編號:1674-9324(2013)09-0253-03
一、引言
21世紀是國家全面推進學生素質培養(yǎng)的時期,計算機專業(yè)課既具有較強的理論性,又具有較深的實踐性。目前,計算機專業(yè)的教學過程中往往理論教育與實際脫節(jié),很多學生通過了專業(yè)理論課的考試,卻不能將理論付諸于實踐,學生對課程知識并沒有深刻的理解和消化,對課程理論的實際應用沒有感觀上的體驗。經調查顯示,60%以上的學生認為在校期間的計算機理論課的學習對就業(yè)和實際工作幫助不大,這給學生學習計算機理論的積極性帶來了消極的影響,更有很多學生熱衷于參加社會上的計算機培訓機構,放棄在高校的課程學習。因此,在培養(yǎng)學生的理論創(chuàng)新能力的同時,提高學生的動手操作能力,加強學生理論聯(lián)系實際的能力是計算機教學十分緊迫和必要的任務。
隨著信息技術和網絡技術的快速發(fā)展,在短短幾年內數(shù)據(jù)倉庫和數(shù)據(jù)挖掘就已經成為IT信息領域廣泛應用和熱點研究的領域。該領域主要是研究如何從浩如煙海的海量數(shù)據(jù)中有效地提取并挖掘知識,對其進行自動分析和匯總,是計算機行業(yè)中最熱門、最有前景的領域之一[1]。數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程也順應計算機發(fā)展的需要,進入到高校計算機教育的專業(yè)課課程列表中。
本論文在深入研究了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的內容和特點的基礎上,采用B/S(Browser/Server)架構,即瀏覽器/服務器架構,開發(fā)了web課程教學實驗平臺。
二、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘學科教學現(xiàn)狀
隨著數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程在各大高校成功試教后,近年來各大高校都為計算機專業(yè)都設立了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程,時至今日,其課堂理論教學已經比較成熟。然而,絕大多數(shù)學生在經過該課程的學習后,普遍反映雖然基本了解了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘相關理論知識,卻缺乏感性認識和實踐應用能力。這主要是因為該課程的實驗教學較難開展,缺乏一個符合以下特點的教學實驗平臺。
市場中通用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘軟件昂貴且難以使用,大量的專業(yè)術語、專業(yè)業(yè)務理論、數(shù)學知識和挖掘模型讓人無從下手。因此我們需要的僅僅是一個實驗平臺,并非大型企業(yè)應用軟件,只要學生能通過它更簡易地完成該課程的實驗環(huán)節(jié)即可。
1.可視化、易操作。可視化和易操作可以提高學生的學習興趣,讓學生更直觀的參與到教學活動中來,而不是苦惱于如何使用該平臺完成實驗。
2.交互性。一個好的教學平臺不僅是一個可以提供給學生傳授知識的平臺,還應該是一個可以和學生及老師有交互性的平臺,并且使學生和學生有交互性,老師和學生有交互性[2]。
3.教學與實驗相結合。我們需要不僅僅是一個數(shù)據(jù)倉庫與數(shù)據(jù)挖掘實驗軟件,而是綜合課程教學和課程實驗的平臺。教學與實驗相結合、理論與實踐并重,這才是計算機專業(yè)教育的核心。
4.擁有合理和充足的實驗數(shù)據(jù)。對于一個實驗平臺來說,數(shù)據(jù)的缺乏將使得實驗無法進行。尤其是對于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘這個特殊的領域,數(shù)據(jù)不僅要足夠的多而且要合理,否則會嚴重影響實驗結果和教學效果。
三、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘學科教學實驗平臺的構建
為適應教育發(fā)展需要,秉承深化教學改革的方針,改革數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程原有的普通教學模式,啟動了“數(shù)據(jù)挖掘課程設計平臺建設”教學改革項目。該平臺依托我校電信學院985平臺的優(yōu)良硬件環(huán)境,由遠程開放實驗平臺服務器和終端PC機組成,其成本低廉、維護方便、部署容易。該實驗平臺服務器直接部署于本校的學院985實驗基地,具有操作穩(wěn)定性、魯棒性和容錯性。通過該實驗教學平臺,學生對該課程的學習過程將不受場地限制,只要通過網絡就可以登錄該平臺。該平臺主要框架如圖1所示。
1.用戶管理模塊實現(xiàn)了對不同用戶的權限設置、登錄和注冊等功能,超級管理員可以為普通學生用戶分配權限。
2.實驗平臺模塊給學生提供了算法模擬和試驗的平臺,主要分為以下兩個部分。
(1)數(shù)據(jù)倉庫的維度建模設計模塊。雪花模型設計案例;星型模型設計案例;ETL抽取操作平臺。
(2)數(shù)據(jù)挖掘算法實驗模塊。數(shù)據(jù)預處理程序實現(xiàn)算法平臺;Apriori算法實驗平臺;ID3算法實驗平臺;BP算法實驗平臺;K-Mean和K-Medoid算法實驗平臺;C4.5算法和決策樹算法實驗平臺;KNN算法實驗平臺;貝葉斯算法實驗平臺。
維度建模設計平臺和數(shù)據(jù)挖掘算法實驗平臺模塊是該平臺的核心模塊。
3.實驗課程模塊主要向學生介紹該實驗課程的相關內容、教學大綱和教學任務,也包含數(shù)據(jù)倉庫環(huán)境的具體安裝和配置視頻演示。
4.作業(yè)提交模塊更是改變了傳統(tǒng)的提交紙質作業(yè)的模式,讓學生將動手完成的實驗和相關作業(yè)通過該平臺提交,一個學生一個賬戶,避免了作業(yè)抄襲和拷貝。學生提交的作業(yè)只要運行正確,按題目要求編程,不論采用何種語言或者何種算法都是可以的,并沒有唯一性的標準答案。當實驗課程考核的時候,學生能夠通過作業(yè)提交系統(tǒng)向服務器提交指定課程內容的作業(yè),供教師在線評閱和打分。
5.教學資源下載提供給學生自學的資料,給感興趣的學生提供了進一步學習的捷徑。
6.當有學生對實驗環(huán)節(jié)和該課程有任何疑問,都可以登錄在線答疑系統(tǒng),給授課老師留言,這些信息都會以郵件的形式發(fā)送到授課老師的收件箱,從而實現(xiàn)即時的答復,讓學生在第一時間接受老師的指導。當有問題重復出現(xiàn)三次以上,系統(tǒng)就會自動識別,將問題和答復展示在FAQ中,提供給更多的學生共享該問題和該問題的解答,避免重復提問,也給還未遇到該問題的學生共享和學習。在線答疑給學生和教師提供了交互、交流和學習的平臺。
7.數(shù)據(jù)挖掘實驗平臺的在線代碼編譯環(huán)境主要采用gcc編譯器,能夠對學生提交的各種代碼進行實時編譯,給用戶的感覺就像是在本地執(zhí)行一樣。它能夠支持的在線運行編程語言包括java、C和C++等,給學生提供多樣化的語言實現(xiàn)方式,體現(xiàn)了非機械化的計算機應試理念。
四、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘學科教學實驗平臺的教學效果
在數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程中使用該教學實驗平臺,具有教育的先進性和優(yōu)越性。
(一)建設了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的實驗教學體系
1.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘模型。本平臺可以培養(yǎng)學生自己動手創(chuàng)建多維星型模型、多維雪花模型、緩慢變化維、ETL模型、數(shù)據(jù)立方體模型及其實例等,還可以增加學生對各類重要挖掘算法的特點和應用場景的理解,讓學生在實驗平臺上體驗基于數(shù)據(jù)倉庫的主要數(shù)據(jù)挖掘算法。
2.模型評估。當學生創(chuàng)建完畢自己的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘模型后,可以通過調整不同的參數(shù)值和更改數(shù)據(jù)集來檢驗算法的輸出結果,并通過記錄在不同的應用場景下的參數(shù)值和結果值得到最優(yōu)值。
3.優(yōu)化創(chuàng)建模型和算法的性能。學生通過使用計算機領域中的一些經典優(yōu)化技術,如創(chuàng)建位圖索引、哈希索引、S-tree索引等來優(yōu)化模型和算法的性能,并記錄和比較不同優(yōu)化技術對模型和算法的效率和響應時間的影響。
4.定期對學生所學實驗內容進行測試,根據(jù)學生的實驗測試結果對平臺的遠程實驗操作功能進行改進和完善。
(二)部署和實施了基于網絡的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程遠程實驗教學環(huán)境
本項目通過構建基于網絡技術的遠程實驗教學平臺,不僅給學生和教師提供這樣一個教學實驗平臺,而且還實現(xiàn)了實驗教學的網上開放式管理,改革原有相對封閉的實驗教學模式為開放的實驗教學模式,構建了一個符合實踐教學環(huán)節(jié)需求、虛擬和真實環(huán)境相結合、基于Web的多應用場景的遠程開放實驗平臺。
(三)基于采樣評估證明了遠程網絡實驗教學的可行性和優(yōu)越性
根據(jù)采樣評估結果,該系統(tǒng)體現(xiàn)了遠程網絡實驗的可行性和優(yōu)越性。在該平臺真正投入使用之前,我們將一批學生分為兩個組進行數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的學習,A組學生使用現(xiàn)有的課程教學方法,而B組學生使用該平臺的遠程實驗教學環(huán)境。具體教學內容為多維數(shù)據(jù)模型和數(shù)據(jù)立方體的概念以及k-means聚類和Apriori關聯(lián)分析算法。兩組學生通過不同的教學方式學習后,對他們進行了問卷調查和統(tǒng)計,結果如圖2所示。
從圖2的數(shù)據(jù)結果可以看到,無論是從學生興趣程度、作業(yè)完成度還是考試成績的角度對兩組學生的學習效果進行評估,使用該數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教學實驗平臺的教學方式都具有明顯的優(yōu)勢。在實驗過程中學生是主體,用所學知識發(fā)揮創(chuàng)造性思維進行實踐。當實驗取得結果時,不論結果成功與否,都能帶給學生一定的鼓勵,從而在某種程度上激發(fā)學生的創(chuàng)造力和積極性,真正加速問題解決和理論創(chuàng)新。因此,我們有理由相信該平臺的使用可以極大地提高學生的學習興趣,促進教學目標的實現(xiàn)。
五、結論
在計算機專業(yè)的教學中,如何提高學生的實踐能力和獨立解決問題的能力是當前高等教育發(fā)展的新形勢下所面臨的主要問題。本文首先介紹了基于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘課程的實驗平臺的整體架構,展示了該平臺的優(yōu)點,證明了該平臺可以將課堂學習和課后練習、理論教育與工程實踐有機結合,為實施更加行之有效的教學組織和教學管理模式提供了可能。只有教育者和學生充分認識到計算機課程中實驗環(huán)節(jié)的重要性,更有效地利用現(xiàn)有的社會資源和計算機技術為我們的教育服務,專業(yè)學科教學模式和方法才能不斷推陳出新,不斷進步和發(fā)展。
參考文獻:
[1]Jiawei Han,Micheline Kamber.Data Mining Concept and Technology[M].Beijing:China Machine Press,2007:10-12
[2]李旭晴.學科教學網站設計的應用探討[J].計算機教育,2009,(02):1-2.
基金項目:同濟大學實驗教學改革項目專項基金支持(基于校園網的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程課外實驗平臺建設與應用)
作者簡介:向陽(1962-),男,重慶人,博士,教授,博士生導師,主要研究領域為決策支持系統(tǒng)、人工智能。