羅麗紅++陳仲華++柯靈
摘 要 大數據技術的出現為在線教育帶來了新的機遇,同時也帶來了新的挑戰。利用好教育數據對之進行挖掘和分析,使之更好的服務于在線教育顯得尤為重要。本文介紹了在線教育和大數據的基本概念和特點,介紹了教育數據挖掘的步驟和常用的學習分析方法,希望能有助于大數據在在線教育領域的發展。
【關鍵詞】在線教育 大數據 數據挖掘 學習分析
大數據時代的到來,促進了在線教育的興起,聚合了海量課程資源的在線教育平臺紛紛出現。這些在線教育平臺讓任何人隨時隨地都可以利用各種終端進行學習。在我國教育資源分配不合理的情況下,在線教育為人們的學習提供了學習機會。同時大數據時代也對在線教育帶來了挑戰,如何從大量的學習管理數據庫中提煉出有價值的數據,發現學習者行為之間的關系以及其內在邏輯關系,并以此為依據更好的制定教學計劃,從而能提供更好的在線教育。
1 基本概念
1.1 在線教育
在線教育即e-learning,是一種基于網絡的學習行為。在線教育采用多元化的教學形式,通過多媒體和網絡技術來傳遞文字、聲音、圖片、動畫和視頻等資源信息,將線下資源放置到線上,使學習者通過互聯網即使相隔萬里也能進行學習。具有代表性的在線教育平臺為MOOC,其中首個中文MOOC平臺截止2017年5月在線注冊用戶已經超過700萬,學習者覆蓋175個國家和地區。
1.2 大數據
大數據(big data)指的是無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新的處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。大數據具有5V的特點,即Volume(大量)、Velocity (高速)、Variety(多樣)、Value(價值)以及Veracity(精準性)。
2 關鍵技術
在線教育平臺上提供的數據主要包括:用戶信息、課程信息、習題信息、視頻信息、論壇信息、用戶行為信息和知識圖譜信息。其中知識圖譜信息指的是教師總結的知識點的集合信息,根據不同學習者學習知識點的情況進行動態更新,得到每個學習者的學習圖譜。面對在線教育平臺上如此龐大繁雜的數據,顯得對在線教育領域的大數據研究尤為重要。在線教育上大數據的研究主要包括教育數據挖掘和基本分析技術兩方面。
2.1 教育數據挖掘及其過程
來自數據挖掘網站的教育數據挖掘的定義為:教育數據挖掘指的是應用數據挖掘方法從教育系統中的數據提取出有用的信息,從而更好的理解學生及其學習系統的新興學科。2011年出版的《教育數據挖掘手冊》上是這樣定義的:“教育數據挖掘是開發、研究和應用計算機方法來對傳統教育環境中的大量數據進行分析和監測,而數據的容量之大是其他方式很難或基本上無法進行的”。教育數據挖掘主要要經過以下過程。
2.1.1 數據的準備
指的是從長期無規律的原始數據中,經過數據的選擇、清洗、推測、轉換等操作得到準備要挖掘的數據。數據的準備工作是后續工作的基礎,直接決定著后續工作的質量和效率。
2.1.2 數據挖掘
指的是按照挖掘的目標要求,搭配合適的算法來挖掘數據的規律,常用的算法有決策樹、分類、神經網絡、Apriori等。這步是整個挖掘程序的關鍵。
2.1.3 模式評價、分析
指的是對挖掘過的數據結果進行解釋、分析,提出有價值的規律并將其還原為人們能夠理解的數據語言。
2.1.4 知識運用
指的是挖掘的結果在現實決策中的運用,這是數據挖掘的最終目的所在,也是其價值體現。
2.2 基本學習分析技術
數據挖掘的基本分析技術側重于模型的建立,著眼于整個系統,而不是細節和算法,意在滿足各類對象的需求。常用的分析技術有聚類分析、分類和預測、關聯分析等、人工神經網絡、遺傳算法。
2.2.1 聚類分析
指的是將數據分類到不同的類或簇的這樣一個過程,但這個類是未知的,由聚類學習算法自己確定標記。聚類分析是一種探索性分析,能從準備的數據樣本出發,自動進行分析。
2.2.2 分類和預測
分類是一種監督的學習過程,根據訓練數據集發現準確描述來劃分類別。常見的分類算法有粗糙集、決策樹、貝葉斯等。預測是建立連續值函數模式,是根據分類和回歸來預測將來的規律。常見的預測方法有時間序列法、回歸分析法和局勢外推法。
2.2.3 關聯分析
指的是利用事物之間存在的聯系或關聯性,發現事物之間的規律,然后通過這個規律進行預測。
2.2.4 人工神經網絡
指的是試圖通過模擬大腦神經網絡一處理、記憶信息的方式進行信息處理,是由大量處理單元互聯組成的非線性、自適應信息處理系統。
2.2.5 遺傳算法
指的是模擬達爾文生物進化論的自然選擇和遺傳學機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。包括初始化、個體評價、選擇運算、交叉運算、變異運算的過程。
3 總結
本文簡單介紹了在線教育與大數據的基本概念,對在大數據時代如何利用在線教育平臺的數據促進在線教育的發展中所涉及的教育數據挖掘及過程和基本學習分析技術進行了介紹。如何在繁雜、無序的數據中,利用數據挖掘及學習分析技術找到具有教育價值的數據,并得出對決策有利的結論,仍然是一個艱巨的任務,還需要進一步加強大數據在在線教育中的研究力度。
參考文獻
[1]張枝實.大數據時代在線教育的發展研究[J].江蘇開放大學學報,2017(05):54-56.
[2]徐海波.淺析面向在線教育的大數據應用[J].數據技術與應用,2015(12):85-86.
[3]李平榮.大數據時代的數據挖掘技術與應用[J].重慶三峽學院學報,2014(03):45-47.
作者簡介
羅麗紅(1985-),女,江西省人,現為重慶電訊職業學院講師。研究方向為軟件開發,數據庫技術及應用。
柯靈(1983-),男,重慶市人,任職于重慶郵電大學移通學院。
陳仲華(1981-),男,重慶市人,任職于重慶郵電大學移通學院。
作者單位
1.重慶電訊職業學院 重慶市 401520
2.重慶郵電大學移通學院 重慶市 401520endprint