羅 純, 楊 晗, 李海雯,2, 紀晨然
(1. 上海應用技術大學 理學院, 上海 201418; 2. 捷孚凱市場咨詢有限公司, 上海 200040;3. 濟南大學 生物科學與技術學院, 濟南 250022)
隨著現代信息技術的飛速進步,人工智能時代已悄然而至。人工智能已逐漸滲透到社會的各個領域,如:金融、安保、零售、交通、教育等領域,無人駕駛、無人超市、智能機器人、AlphaGo、面部識別、智能音箱、人臉支付等已經走進人們的工作、學習和生活。人工智能在社會生活、工作方式甚至經濟結構等多個領域引起了深刻變革并將持續在未來的全球發展中起到舉足輕重的作用。在國際范圍內,人工智能引起了廣泛關注,并被多個國家提升為國家戰略,并出臺了相關政策和規劃,力爭搶占科技的制高點。
百年大計,教育為本。教育作為民族復興、社會進步的基石,一直是我國優先發展的行業。為推動教育智能化,我國在教育財政投入方面與教育科技政策方面雙管齊下。據國家統計局統計顯示,自2012年以來我國財政性教育經費支出在GDP中所占比例連續7年保持在4%以上。
數據挖掘、云計算、移動計算、人工智能等新技術的廣泛應用,為教育服務的發展帶來了全新的技術環境,人們需要綜合考慮了學習者的認知水平、情感因素、學習動機、個性差異、學習風格等因素影響的個性化、智能化教育服務。技術正推動著教育行業向著更加靈活、便捷、高效以及個性化的方向發展,新一輪教育科技革命和教育產業變革正在興起??梢灶A見,在國家“互聯網+”的戰略推動下,物聯網、云計算、數據挖掘、人工智能等信息技術的快速發展以及在教育中的廣泛應用將為人工智能自適應教育的發展帶來難得的歷史發展機遇。
基于時代大背景下,本文闡述了數據挖掘技術在人工智能自適應教育中的主要應用并結合相關教育學、心理學理論,利用數據挖掘技術,構建多元線性回歸模型,根據個體學習風格匹配最優學習策略,定制個性化學習方案。
人工智能的2大核心是機器學習和數據挖掘,而數據挖掘技術誕生至今,一直受到各行各業的廣泛關注。隨著計算機技術的飛速發展和廣泛應用,如何對累積的海量數據信息進行統計分析、利用及決策成為了迫切需要解決的問題。正是數據挖掘技術的出現解決了海量數據的有效利用這一難題。人工智能自適應教育的基本步驟可以概括為:搜集大數據——構建學習模型——輸出學習建議。

圖1 人工智能自適應教育系統基本原理
在流程中,構建學習模型的過程最為復雜,需要從成千上萬個相互連接的函數點中用數據挖掘方法找出其中的學習規則。這個過程的最大的難點之一就在于海量數據的處理和分析,而對大量數據的處理正離不開數據挖掘技術。因此在人工智能自適應教育領域,數據挖掘技術展現出較強的優勢性。
人工智能自適應教育的要求是自適應教育系統擁有歸納及推理能力,可以大量定制個性化的學習方案。本模型將根據學生的個人學習行為及學習成果,為不同學習風格生成匹配合適的學習策略,生成個性化學習方案。
本模型根據不同學生的不同學習行為及學習成果,輸出個性化的學習方案,分析對象為學生,所需的數據為學習者的學習風格、學習策略以及學習成果。學習風格是指不同學習者在學習過程中因每個個體差異化的個性特點、學習偏好,思維模式,知識接受能力,分析能力等因素表現出的帶有個體特征的學習方式。從不同維度出發,所得到的學習風格的類型也是截然不同的。目前已有70多種學習風格被研究出來[1]。本文將采用由Richard M. Felder和Barbara A. Soloman設計的Felder-Silverman學習風格問卷[2](所羅門學習風格量表)來收集學習風格數據。該問卷從信息加工、信息感知、信息輸入以及信息理解4個維度測量學生的學習風格。每個維度設計了11個問題,共計44個問題;每個問題有2個選項,分別考查每個維度的2種類型,共計8種類型16種風格。將每個問題的答案以1和0表示,即選擇此項記為1,否則為0。
學習策略定義是學習者在學習活動中有效學習的程序規則、方法技巧及調控方式。學習成果則是學習者通過學習活動所得到的知識及感悟。本模型選取了復述策略、組織策略、元認知策略、監視策略、調節策略、資源管理策略、學習環境管理、努力管理、多向互動八個學習策略作為觀察對象,針對每個策略設計了8個問題,每個問題都有很不符合、較不符合、不確定、較符合、很符合5個選項,分別對應1~5分,統計每個策略下8個問題的總分作為該策略得分。
學習成果的最直觀的表現為學習成績,因此將學習成績作為評估學習成果的標準。本模型將以學習者在班級內的排名為標準計算其學習成果。問卷上將班級排名這一問題分為了5個選項,A: top 5%,在模型計算中假設成績為95分; B:top 20%,在模型計算中對應成績為85分;C: top 50%,對應成績為75;D: top 70%,模對應成績為65分;E:其他,對應成績為55分。
根據Felder-Silverman學習風格問卷評定規則,計算每種風格總分,并將同一維度下的系數較大的風格作為測試者在本維度下的學習風格,并將2項之差作為風格系數,系數越高,風格越強烈。評定所以答卷者的學習風格,整理學習策略調查問卷,將同一策略下的問題得分相加,計算出每個策略的得分情況。對學習策略統計表進行Z-score標準化處理,以消除量綱單位的影響,解決數據指標之間的可比性[3]。
將學習策略設為解釋變量Xi,學習成績設為因變量Y,變量說明如下表:

表1 變量說明
構建多元線性回歸模型:
Y=b0+b1X1+b2X2+b3X3+…+b9X9+ε
(1)
式中:b1,b2,…,b9分別為X1,X2,…,X9對成績Y的回歸系數;b0為常數項,表示為不可預測的隨機誤差。
根據問卷結果,將學習策略得分及對應的學習成績輸入SAS做回歸分析,結果如表2~4所示。

表2 回歸統計
由表2~4可得出如下多元線性回歸方程:
Y=46.04+3.03X1+3.19X2+3.47X3+2.65X4+2.01X5-1.56X6+2.88X7+3.27X8+2.61X9
對各變量回歸系數可得知,學習策略對學習成績的提升程度排序為:元認知策略> 努力管理> 組織策略> 復述策略> 學習環境管理> 監視策略> 多向互動> 調節策略> 資源管理策略。
由表2可知,該模型判定系數為RSquare=89.67%,即學習成績變動的原因有89.67%可以由學習策略來因素來解釋,只有10.33%的因素屬于隨機變動誤差,因此認為該模型擬合優度較高。且由表3知,棄真概率P=3.23E-035<0.01,故置信度達99%以上。

表3 方差分析
根據表4可知,除了調節策略X5和資源管理策略X6,復述策略、組織策略、元認知策略、監視策略、學習環境管理、努力管理和多向互動的檢驗統計量都大于t,均對學習成績有顯著影響。

表4 回歸系數及回歸系數顯著性檢驗
將在數據表中隨機抽取的未參與模型建立的數據代入線性回歸方程中計算結果,并將預測結果與實際結果相對比,以測試模型準確性。
由表5可知,應用模型輸出的結果與實際成績之間的誤差較小,擬合度較高,認為該模型較為可靠,可以應用于實際預測中。

表5 學習策略模型檢驗結果
樣本中成功學習者(學習成績在85分及以上)共計46個,統計不同風格的成功學習者對學習策略的偏好。根據學習者學習策略測量問卷,將每個學習者的各項策略得分以各項得分占其總分比例的形式表示,以使數據具有更強的可比性及關聯性。將學習風格表示為其維度系數,該維度下學習風格越強烈,維度系數就越高。每個維度下的A型用正數表示,B型用負數表示。計算學習風格與學習類型間的相關系數,相關系數越接近于0,說明相關性越??;相關系數為正,則說明該學習策略與該維度學習風格的A型相關,反之則與B型相關。

表6 相關系數

圖2 學習風格與策略匹配方案
根據回歸模型得出的學習策略對成績提升程度排名,剔除掉對成績影響較不顯著的調節策略與資源管理策略,結合不同類型學習者偏好的學習風格,可為16種不同類型的學習者16種設計如下學習策略匹配方案[5-11]。
本文從人工智能自適應教育的實用性角度出發,基于數據挖掘方法為信息感知、輸入、接受、理解4個維度下的16種學習風格匹配了最優學習策略作為參考,在一定程度上可以滿足學習者的個性化學習需求。同時,學習風格與學習策略作為學習者的個體差異,人們從不同的研究角度、使用不同的研究方法提出了不同的劃分方式,本文僅采取了應用較廣的2種理論,但該研究方法或許同樣適用于匹配其他理論的學習風格與策略。
展望未來,我們期望可以將人工智能、數據挖掘以及虛擬現實等技術相結合,搭建一套智能教育驅動系統以輔助教學,實現個性化課程、自適應教學、學習習慣及方法養成、智能監督等功能,將現代化技術應用到教育工作中的方方面面,使得教育更加智能化; AI與教育的結合教育成為必然趨勢,智慧教育驅動未來。希望本文關于人工智能自適應教育的基礎研究和理論部分能夠延伸到教育工作中,使得理論和應用能夠更好結合。