葉根梅 杜丹
(馬鞍山師范高等??茖W校軟件工程系 安徽省馬鞍山市 243041)
近年來,網絡課程在高校越來越普及。各高校紛紛引入或建設屬于自己的網絡課程平臺,教師基于網絡平臺建立在線課程,以此更好地輔助課堂教學,或實施翻轉課堂或實現在線教學。網絡課程的質量決定了網絡課程的績效水平[1],而網絡課程的訪問量則一定程度反應其建設質量和實施效果。但是,目前對網絡課程訪問的研究相對較少,且主要集中在運用學習分析技術對學生學習行為的分析方面。文獻[2]通過對學生訪問網絡課程日志數據的分析,獲得學生對不同模塊和資源的訪問頻次,以發現學生訪問網絡課程的特征并提出網絡課程建設的建議;文獻[3]構建層次模型,基于模型對某一門網絡課程的學習行為數據進行分析;文獻[4]通過構建六層次模型,以發現網絡課程學習存在的問題?;趯W習分析技術往往局限于對某一門課程的數據分析,且結論并不足以體現與網絡課程訪問量的直接聯系。因此,本文提出運用關聯規則算法Apriori 算法,對某高校課程平臺批量已運行的在線網絡課程的實施數據,進行關聯規則挖掘,并結合在線網絡課程現狀調查、教師研討、學生訪談等方面進行規則分析,以發現網絡課程訪問量的可能影響因素,為提高網絡課程的訪問量,進而提高網絡課程實效提供依據和參考。
關聯規則算法主要用于發現數據集中數據項之間的相互依賴性,以及存在的有意義的聯系。這些聯系可以用關聯規則或頻繁項集表示。
Apriori 算法是挖掘關聯規則的最有影響力的有效算法,該算法主要通過逐層搜索迭代的方法,利用k 項集搜索k+1 項集,通過不斷迭代,直至找不出頻繁項集[5]。為了有減少大量候選集的產生,采用的基本方法是設置合適的支持度和置信度。支持度Support 表示事務集中同時包含X 和Y 的事務數與所有事務數的比例,反映了X 和Y 同時出現的概率。而置信度Confidence 則表示同時包含X 和Y 的事務數與包含X 的事務數的比例,表示關聯規則的強度。一般來說,只有支持度和置信度較高的關聯規則才是用戶感興趣的。文獻[6]-[7]研究了關聯規則算法;文獻[8]-[9]則將Apriori 算法應用于網絡課程的關聯分析,從而實現教學平臺中的網絡課程推薦。
收集的數據來自某高校在線教學平臺所有已實施在線課程,原始統計數據由課程平臺管理后臺導出并提供。對原始課程數據進行清洗,如原始數據中共有84 個統計數據項,根據問題要求,對數據項進行歸納和合并,刪除與目標問題完全無關的數據項,最終選擇保留8 個列數據項;刪除諸如測試建課及曾未實施類課程,以及學生數過少、使用頻率過低的課程,最終選取有效課程267 個行數據項。
由于關聯規則算法Apriori 算法適用于完全的標稱型數據,因此首先需要對課程統計數據進行離散化處理,以形成有序標量。離散化數值型屬性的一般方法是將值域分割成多個間隔區間,通常采用等寬離散法和等頻離散法。等寬離散法將屬性值從最小值到最大值平均分成若干份,并映射為若干個離散值,其弊端在于容易導致記錄分布不均勻;等頻離散化按照屬性數值大小順序,將所有屬性值劃分成若干數目相等的區間,其弊端在于有可能使得某些屬性進入到不合適的區間。綜合上述兩種離散方法,根據課程統計數據項的特點及網絡課程實施情況,本文采用“區間寬度動態調整法”。將每個數據項按數值從大到小的順序均劃分為N 個區間,每個區間將映射為一個離散值。而對于每個區間寬度,先運用等寬離散法進行大致劃分,然后對每個區間及相鄰區間屬性值進行分析,結合在線課程中該數據項值的判斷,按照值相近原則,對邊界區間值進行動態調整,從而確定每個區間寬度和邊界。
據上所述,對于選取出的章節資源數數據列resource,任務點數數據列task,現有作業數數據列work,章節測驗數數據列test,考試數數據列exam,總討論數數據列discussion,人均活動總參與人次數據列activity,人均課程瀏覽量數據列pv;以字母a~g 分別表示上述對應數據列的值。將每個屬性列根據其區間劃分映射為5個離散值,并按照值的大小順序,分別以編號4 表示離散值對應數值高,3 表示較高,2 表示一般,1 表示低,0 表示無。最終形成課程統計數據如表1 所示。
開發工具采用Eclipse,數據庫MySQL,對事務數據進行關聯規則挖掘。通過不斷調整,最終設置最小支持度0.2,最小置信度0.6,產生36 條關聯規則,部分挖掘結果如表2 所示。
資源數resource 用于統計已上傳至課程網站的資源數量。其中,資源類型包括視頻、音頻、文檔(包含PPT 文檔、Word 文檔、PDF 文檔、Excel 文檔及其它類型文檔)。教師在上傳各類資源時,可選擇是否設置任務點,以檢測學生是否瀏覽資源,并可借助平臺技術查看任務的總體完成統計。因此,任務點數與資源數有直接的關系。上述規則1,2 分別表示,在資源數較高、任務點數低和資源數一般、任務點數一般的情況下,訪問量卻均較低。
教師在建設在線課程時,一種較為常見的認識是課程資源要豐富,才能獲得學生的關注和使用。因此教師將課件、教案,以及視頻等資源分章節上傳至課程平臺,以吸引學生關注并瀏覽。眾多的資源可以使知識呈現更加完整,也讓學生有更多的選擇。但上述規則呈現的結論卻是資源數較高時訪問量仍然較低。聯系在線課程實施現狀,建立課程資源是前提,沒有資源的課程網站相當于無源之水。但資源是否被充分利用,一方面取決于學生是否有足夠的學習自主性,如自主借助課程資源進行課前預習、課后復習及完成作業;一方面在于教師是否積極引導,如布置任務,并對資源設置任務點,教師定期向學生提供任務參與度的反饋,或將學生完成的任務點納入學習績效等。因此,對于資源的運用,而非單純資源的數量,才是影響訪問量的更為直接因素。

表1:課程事務數據表

表2:部分挖掘結果
規則3,4 顯示資源數與任務點數之間的關系,即有了資源才能夠有任務點,但任務點數與資源數并沒有呈現正比的關系,這跟課程平臺功能相關。對于教師上傳的資源,平臺默認設置其包含任務點,但平臺也提供了教師可以取消任務點的操作。借助平臺的統計技術,教師對資源設置任務點數,無疑能夠更好地評定學習者任務的完成程度;將任務點納入學生成績評定,也可以引導學生瀏覽課程資源。
活動參與總人次用于統計學生直接參與在線課程的各項活動,具體包括課堂簽到人次、評分參與人次、搶答參與人次、投票參與人次、問卷參與人次、作業參與人次、測驗參與人次、考試參與人次等,每項活動的完成必須通過瀏覽相應的課程頁面實現。
上述規則5,6,7 表示,人均活動參與總人次activity 與網站訪問量pv 關系密切。規則5,6 分別表示,在任務點數、討論數、章節測驗數和考試數均為0 的情況下,人均活動參與總人次與訪問量幾乎成正比;規則7 表示,在作業數一般的情況下,人均活動參與總人次較高,則可以帶來高瀏覽量。在其他參照規則中,該結論仍然表現明顯。
在線課程能否真正發揮作用,主要在于學生的參與和運用。活動參與人次真正體現了學生對于網絡課程的參與和投入。從活動參與人次所包含的活動來看,其類型主要體現在兩類,一類是諸如課堂簽到、問題搶答、選人和評分等,是學生在課堂必須配合教師完成的教學活動,具有典型的教師主導行為特征;另一類是諸如作業、考試和測驗等,用以鞏固或檢測學生的學習效果,直接與學生的平時成績或期末成績掛鉤,學生無論出于教師強制要求還是自身成績考慮,都會主動參與和完成。因此,這兩類活動的頻次直接影響課程瀏覽量。事實上,教師在運用在線課程為教學服務時,課程平臺提供的技術支持和功能,確實能夠一定程度地提高教學效率,激發學生學習積極性。如課堂簽到,相對傳統逐個點名,可以節約時間;搶答、選人和投票通過設置積分或獎勵調動學生學習積極性;學生互評在減少教師工作量的同時讓學生體驗“小老師”的感覺;測驗和考試的自動評分功能以及統計分析功能,極大減少了教師批閱試卷的工作量,且能夠準確快速地形成學習數據分析。從上述規則來看,活動參與在教學中的有效運用,直觀上能夠提高網絡課程訪問量,但對于教學的實際意義,不僅僅是提高教學效率,而是真正促進學生的參與和投入。
建設優質在線網絡課程,并讓學生積極運用網絡課程資源,是每個實施在線課程的教師都要關注的問題。本文基于某高校課程平臺在線課程的統計數據,運用Apriori 算法挖掘影響網絡課程訪問量的可能影響因素。從發現的規則來看,課程資源數量本身并不能直接影響學生對課程網站的訪問,學生對教學活動或任務的參與則能明顯提高訪問量。網絡課程的建設是前提,設計合理、內容豐富的一定數量和質量的教學資源是網絡課程的基礎,而鼓勵并引導學生充分參與和投入、合理應用網絡課程、提高課程使用率更是關鍵。對于高校而言,如何科學地建設并合理使用在線網絡課程,將教學與信息技術有效結合,尚需要不斷總結、實踐和完善。