白 楊
(遼東學院 信息工程學院,遼寧 丹東 118003)
近年來,隨著多媒體技術和網絡技術的發展,在線學習已成為人們學習的另一種主要方式。在線學習打破了傳統教學在時間和空間上的限制,給學習者提供了一個寬松、自由、開放的學習環境。大數據技術的興起對社會生產和生活都產生著深刻的影響,過去無法收集和分析的數據被大數據技術賦予了新的可能性,近年來涌起了對人們行為和喜好挖掘的研究熱潮,大數據技術成為了教育變革與創新的重要推動力。大數據所特有的“全面性”的數據、潛在的“大價值”及先進的技術手段,為充分挖掘學習者的情感語義進而促進個性化學習平臺構建提供了有力的支撐。在大數據環境下,教育學習資源變得越來越豐富,學習者模型的內容不僅包含了學習者的知識狀態,而且還包含了學習者的興趣偏好、學習風格和認知能力等特征,因此個性化學習成為新時期學習者的更高要求。同時,在線學習中學習者以自主學習為主,長時間處于孤立的學習狀態,缺乏情感支持。現有的研究對學習者的動機、情感等非智力因素還關注不夠,不僅缺乏有效的表示方法,而且缺乏恰當的建模技術,嚴重影響了在線學習的效果。因此,如何為學習者構建一個智能化、個性化的學習環境,成了近年來人工智能教育應用領域的研究熱點。通過對大數據個性化學習模型的分析,能夠深入探究學習者的學習過程與情境,發現學習規律,并根據每一個學生的需求和能力為其提供個性化自適應學習。本研究從學習者文本情感分析的視角,重點研究在線教學網絡的學習者的個性化學習模式,使智能學習系統具有情感能力,符合智能推薦、信息共享等個性化服務發展的實際需要。
文本情感分析是利用計算機自動挖掘出主觀性文本中表達的情緒、態度和意見[1]。隨著Web2.0的迅猛發展,人們從被動地瀏覽信息到主動地發表意見、表達思想,網絡由此而產生了海量的、主觀的文本數據。在線教學網絡如慕課、可汗學院等平臺不僅提供了大量的學習資料,還為學習者提供了一個自由表達情感的空間,學習者通過參與討論、發表評論等方式進行知識交流和共享,而由此產生的數據大部分以文本形式存在,許多學者開始分析和挖掘這些文本數據中的情感信息。文本情感分析已經成為自然語言處理中的研究熱點,通常包括以下4個方面研究內容[2]。
(1)詞語極性判定。詞語的情感分析是句子、篇章情感分析的基礎。詞語情感分析包括情感詞語自動識別和詞語情感極性判斷兩方面內容,實現的基本思路通常有兩種:基于語料庫的方法和基于語義詞典的方法。
(2)文本情感分類。根據文本中表達的觀點、態度,將其劃分為“肯定”、“否定”或“中立”3種基本的文本情感分類。目前,主要有基于情感詞語和基于機器學習的兩種實現文本情感分類的思路。
(3)評論意見挖掘。學習者評論文本中一般包含多個主題,學習者對不同的主題往往持有不同的意見。為了深入挖掘用戶對某個主題的態度和意見,目前流行的挖掘方法是細粒度的意見挖掘。
(4)文本情緒識別。以上3種一般是面向評論文本,而對于博文、日志等文本內容,通常需要識別學習者高興、悲傷、生氣等情緒。目前比較流行的研究方法是通過情感詞和語義規則來識別文本中的情感信息。
在線學習者在學習過程中情感狀態會隨著學習活動的進行而發生變化,這一變化產生的因素主要有學習內容、學習時間、學習結果等。譬如,學習之初由于學習內容較為簡單,學習者的情緒往往表現為輕松、高興;而隨著學習內容難度的加深,學習者的情緒逐漸呈現沮喪、難過。這時,學習者參加的討論活動中,這些情緒會在相應的文本數據中有所體現,學習模式系統通過對這些文本數據進行情感識別,建立情感模型,以智能學習系統為支持,為學習者提供個性化服務,比如為學習者推薦相應的學習資料、分享多數人在此時的經驗、做法,甚至推送一段輕松的音樂等,已達到對學習者進行情感調節,使他們在學習過程中脫離孤立無援的狀態的目的。融合本文情感分析的個性化學習模式框架結構如圖1所示,主要包括4個環節內容。

圖1 融合本文情感分析的個性化學習模式框架
分詞處理將確定語句的粒度,如詞(words)或詞項(terms)。分詞方法包括詞典分詞和無詞典分詞兩種,前者是利用詞典中包括的領域術語,根據設定好的切詞字數,通過最大正向匹配將語句從左至右進行切分。后者是利用統計思想來分詞,如最大概率法公式為:一個詞的概率=其出現的次數/語料中總的詞數,以此區分詞在一個文檔中的重要程度。另外,還有一些常用的切詞工具如Standard Analyzer,Chinese Analyzer等都各具優勢。
情感建模是個性化學習模式的關鍵環節。隨著情感計算的發展,研究者已提出了許多有效的情感識別技術,為學習者情感建模打下了良好的技術基礎。可以通過文本挖掘技術識別學習者某一時間的情感狀態,主要包括情感特征選擇、情感語義描述、情感類別分類3個步驟。通常的做法是在文本分詞之后,結合情感語義詞典選擇文本的情感特征項,采用向量空間模型來實現文本語義內容的形式化描述,然后基于Apriori,FP-樹等分類方法進行情感分類器的訓練、情感類別判定和文本情感分析,從而實現學習者的情感建模。
該系統存儲了學習模型的適應性規則,如定義了如何根據學習者的知識狀態、學習者選擇的知識點、學習者的學習風格以及學習者的情感狀態,從領域知識本體中選擇出合適的知識點,并包括導航學習的過程的內容。
主要用于對學習者實現個性化推薦,如根據學習者的學習風格和情感狀態向學習者推薦難度匹配和類型恰當的學習資源,根據學習者的知識狀態和情感狀態推薦學習內容。還可以進行學習者社區的挖掘,為實現知識的共享提供支持。
個性化學習模型是智能學習系統的核心組件。在大數據環境下,融入文本情感分析的個性化學習模式能夠實現全面地記錄、跟蹤、掌握學習者的不同學習特點、學習需求、學習基礎和學習行為,為學習者建立個性化學習模型,打造個性化的學習路徑,推薦個性化學習資源。因此,融入文本情感分析讓教育變得千人千面,暗合了“因材施教”的理念,適應個性化和人性化的學習變化,使學習者在學習過程中真正找到幸福感。本研究重點討論文本情感分析的過程,并未探討學習者知識狀態及學習風格等內容的存儲和識別,未來的工作將進一步完善個性化學習模型的內容。