歐頔 曾晟

摘要:為了促進貝葉斯網絡在教育領域的應用,加快實現利用貝葉斯網絡為教育教學賦能的目的,文章采用文獻分析法,針對貝葉斯網絡在教育中的應用開展研究,通過對國內外文獻的檢索以及研究,篩選合適的設計實例,分析貝葉斯網絡在教育中應用方向以及存在的問題,對未來的發展方向提出展望。
關鍵詞:貝葉斯網絡;人工智能;學生模型
中圖分類號:TP391? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2023)13-0032-03
開放科學(資源服務)標識碼(OSID)
1 基本概念
1.1 貝葉斯定理
貝葉斯網絡也叫作信念網絡,它是利用有向無環圖和條件概率表來描述屬性與屬性間的依賴關系和聯合概率分布。
聯合概率分布公式如公式(1) :
[P(x1,x2,...,xd)=i=1dP(xi∣πi)=i=1dθxi∣πi]? ? (1)
貝葉斯網絡的訓練往往以評分搜索法為基礎,具體是使用評分函數(Score Function) 估測模型準確率。對于名為D的數據集合,貝葉斯網絡B=
[sB|D=fθ∣B∣-LLB|D]? ?(2)
[LL(B∣D)=i=1mlog PB(xi)] (3)
其中,[∣B∣]表示參數對象數目,[fθ]表示每個參數[θ]需要的字節,則[fθ][∣B∣]表示模型參數需要的字節數,[LL(B∣D)]表示貝葉斯網絡B的對數似然,這可以體現出概率分布是比較好地描述了數據。因此,貝葉斯網絡的訓練等價于評分函數最小化。如果網絡結構固定(名為G) ,[fθ∣B∣]為常數c。因此,將公式(4) 轉換如下:
[s(B|D)=c-LL(B|D)]? ? (4)
如上所示,最小化評分函數轉換為對參數的極大似然估計。SPSS Modeler 封裝的貝葉斯網絡算法可以將最大似然作為選擇參數的方法[1]。
1.2 貝葉斯網絡特點
貝葉斯方法可以用來計算專家系統中的不確定知識。最近幾年數據庫內的海量數據持續擴充,同時有研究發現,貝葉斯網絡也可以用在知識發現,尤其是對于大規模數據庫,貝葉斯網絡更加適配,體現在:
1) 對于數據不完備的數據集,貝葉斯網絡也能夠處理。以往的指導性學習方法掌握一切可能的數據輸入,如果某一輸入的數據缺失,那么建立的模型就會有偏差,貝葉斯方法可以解決這個傳統的指導性學習方法的缺點,由于貝葉斯網絡反映出來的概率關系是針對整體數據域中的數據,所以在某一變量缺失的情況下,它建立的模型依然是精確的。
2) 貝葉斯網絡可以根據因果關系進行學習。如果缺少了插入值,貝葉斯網絡仍然能夠進行決策,獲得變量域的理解是數據分析的重中之重。
3) 貝葉斯網絡能夠促進知識和數據域的關聯,因為貝葉斯統計和貝葉斯網絡緊密相關。以往只有先獲得處理數據域的先驗知識才能建立精確預測模型,而貝葉斯網絡具有因果關系,可直接進行因果先驗知識的分析,通過貝葉斯網絡能夠獲得較為全面的先驗知識。
4) 貝葉斯網絡能夠避免數據溢出[2]。
2 貝葉斯網絡概述
2.1 貝葉斯網絡發展歷史
貝葉斯統計的前身是英國學者貝葉斯(Bayes)在1763年發表的哲學性論文:關于概率問題求解的評論“An Essay Towards solving aproblem in the Doctrine of chances”,后來發展形成貝葉斯學派。在1921年,遺傳學家SewallWright提出了一個概率模型,把有向無環圖作為模型基礎,認知科學和人工智能領域將其稱為貝葉斯網絡(Bayesain Networks,BNS)。貝葉斯網絡于20世紀70年代后期取得了初步的進展。
20世紀90年代,學者們開展了進一步研究,在數據挖掘以及機器學習領域對其進行應用。最近幾年,與貝葉斯學習理論相關的文章內容涉及的人工智能部分有:模式識別、聚類分析、因果推理和不確定性知識表達等。同時,ISBA作為專業研究貝葉斯理論的學術刊物網組織出現[3]。
2.2 國內外研究現狀
Pearly在20 世紀 80 年代末,創造性地提出了貝葉斯網絡理論[4],并成功將其應用于專家系統。在此之后,學者們開始廣泛關注貝葉斯網絡,認為它是有效表示與推理不確定知識信息的工具。在理論研究和實際應用上,貝葉斯網絡理論取得了很大的進展。推理、實際應用和網絡學習是當前對貝葉斯網絡的主要研究方向。貝葉斯網絡中的學習分為兩種,參數學習用于確定各個網絡結點的條件概率分布。結構學習算法分為基于得分的結構學習算法與基于約束的結構學習算法。前者先以評分標準評估數據集與網絡結構擬合的程度,再選取分數最高的網絡結構。后者認為,貝葉斯網絡可以體現隨機變量之間的獨立性關系。基于約束的結構學習算法首先檢驗訓練數據集的獨立性,確定各結點集之間獨立性的統一條件。然后在盡可能多地覆蓋這些條件的情況下,建構獨立性的網絡結構。Cheng[5]用互信息代替條件獨立檢驗,把信息論應用于統計測試,提出三階段算法等。參數學習一般通過統計樣本來實現,先確定網絡結構后計算其中結點的條件概率分布。常用貝葉斯參數估計、EM(期望最大化)算法、最大似然估計法和Gibbs 抽樣算法。
網絡推理指的是后驗概率,即在給出部分證據的情況下,確定其中某些結點的取值概率。根據所要求精度的不同,將推理算法分成了近似推理算法和精確推理算法。精確推理算法常用的有連接樹算法和消息傳播算法。近似推理算法常用基于搜索的方法和基于 Monte Carlo 思想的采樣方法。由于貝葉斯網絡能夠表示和推理因果關系,因此被廣泛應用在包括教育領域在內的各個領域。Millan[6]用離散貝葉斯網絡對學生進行測評并構建學生模型,首先,依靠貝葉斯網絡預測學生回答正確的概率,據此得出一種自適應的診斷算法。Zapata[7]用貝葉斯網絡建立分布式多代理教學系統,構建了學生模型,利用其推理能力建立自適用于學生的學習應用。Martin 用離散貝葉斯網絡評估學生知識掌握情況,利用貝葉斯網絡的推理能力預測學生掌握某一知識點的概率,并分析學習行為 [8]。王璋[9]應用離散貝葉斯網絡于評估導學,預測學生掌握某一知識點的程度,說明了在評估學生方面貝葉斯網絡推理機制是有效的。黃建明等人[10]把離散貝葉斯網絡用于預測學生成績的高低。學生群體掌握知識的程度是連續的,以上學者離散化連續變量的取值,將掌握程度的取值區間分割成離散值。雖然計算得到簡化,但是也會損失變量特征,而且在實際情況中,區間內所有的連續值不可能都是同一種情況,這會降低預測的精度。
3 貝葉斯網絡的應用
3.1 應用現狀
貝葉斯網絡目前主要用在以下幾個方面:
1) 專家系統
貝葉斯網絡的推理能力可達到專家水平,它能夠模仿人的智能,解決專業領域的實際問題。如在醫學上,遠程醫療系統CPCSBN優于世界上常用的遠程醫療診斷方法;Pathfinder用于輔助“淋巴節點”的診斷。
2) 數據挖掘
貝葉斯網絡可用于輔助聚類分析。因果關系是普遍存在于客觀世界的一種關系,學者們發現在數據挖掘中,貝葉斯網絡能夠挖掘多層、多點的因果概念關系。貝葉斯統計學作為其起源,使得含有統計性質的數據挖掘與貝葉斯網絡順理成章地結合起來。
3) 故障診斷
貝葉斯網絡可用于分析故障特征,尋找故障原因;依據常見故障或當前系統狀態,進行故障監控和故障預防。比如微軟為幫助用戶解決使用過程中可能發生的問題,在視窗軟件中加入了疑難解答。
4) 學習幫助
通過引導學習者掌握事件發生的規律和事件二者的因果關系,貝葉斯推理原理可以對學習者進行學習幫助。對考試結果的研究和分析,有助于教師的思考、觀點和建議。領導決策時也可以依據分析,作為自己制定工作策略的參考,指導學校的教學工作[11]。
3.2 建立學生模型
國內和國外的學者已經對學生模型做出了許多研究。一些學者從構成學生模型的內部要素角度分析建模。首都師范大學的王陸、楊卉等人[12]提出了兩層動態學生模型,用廣義模糊綜合評判方法來評價學生的二級特征。國外部分學者[13]認為從知識水平的角度來說,對學生知識狀態的主要有鉛版模型、基于約束的模型、覆蓋模型等。有研究者[14]總結了不同模型的特點,提出了基于覆蓋模型和認知偏差或者是對其他模型的整合;還有學者[15]以學習者個性特征為關鍵構建學生模型,如像認知風格和認知偏好等個人特征。近年來適應性技術和情感計算不斷發展,人們也開始關注基于情緒感知的學生模型。
用于自適應學習系統時,學生對節點知識的掌握程度表現為貝葉斯網絡中某一節點概率[16]。節點知識分為兩大類,一類為定性知識,一類為定量知識,此種圖論模型就是對節點知識的結構化描述[17]。劉艷等[18]學者提出了新方法評估學生的學習情況,基于貝葉斯網絡的學習評估方法可以精確地測算出學生對某塊知識的掌握程度,得到學生的差異性結果,就可以開展個性化的學習策略。
建立學生模型,從信息處理的角度看就是分析處理學生學習的各種信息,包含著認知診斷和知識表示兩個方面。建立模型的理論和方法有許許多多,目前常見的包括認知型、偏差型和覆蓋型。覆蓋型的學生模型,描述的是學習者哪些內容知道,哪些內容不知道,把學生的知識作為領域中專業知識的某個子集來描述。對于有著大量知識點的課程測試,覆蓋模型能清晰地表示出先驗知識。
馬文龍[19]建立的適應性教學系統采用粗蓋型學生模型,用一種自動和人工相結合的方法構造模型。課程的領域專家(即授課老師)先根據個人的教學經驗,給出該課程某些知識點的先驗概率,再由系統建立領域知識模型、構建貝葉斯網絡結構、選擇條件概率分布函數。系統投入使用一段時間后,已收集到足量的學生數據,可以開展推理和優化。馬文龍的學習者模型模擬了知識在大腦中存儲的過程。課程知識按照領域里面內在的邏輯關系被模型連接為語義網絡。學習者也是以這樣的邏輯順序來學習課程知識的。所以,首先需要做的是,建立領域知識模型,即將知識點間的邏輯關系整理清楚。
對于眼下流行的教育超媒體系統,貝葉斯網絡推理機制也可以有效地為其服務,如何針對其特點構造有效而準確的網絡是難點重點。閆志勇[20]著眼于構造網絡的過程,抓住教育超媒體系統中課程知識點與知識點關系緊密的特點,利用層次劃分減少聚簇數量,在通過聚簇消除無向環方法的基礎上,使得貝葉斯推理減少了計算量。
馬愛利[21]設計了一個模擬系統以模擬數學的教學,以貝葉斯網為學生模型,用于遠程教學,功能結構圖如圖1所示:
學科知識點儲存在學科知識庫,用于學習本科知識的所有規則儲存在學科規則庫。題庫內是每一章節的測試題、練習題與下一章節的預習。將學科規則庫、學科知識庫和學生學習記錄相結合,通過推理機制能夠整合成教學資源,通過決策控制模型和信息控制模型能夠轉換為長期學生模型。學生行動解釋器主要負責處理信息并針對答題情況提供反饋。教師行動解釋器主要負責在學生需要幫助時給予合適的幫助,不同情況的學生會得到個性化的教學決策。學生學習記錄中保存著該生題目作答情況,便于學生及教師掌握自己的學習變化[21]。
4 問題和展望
1) 在選取用于建立學生模型的學生特征時,除知識水平相關因素外,也應考慮個性特征。如學習風格、學習興趣、認知偏好等。未來的研究中,可以對學生特征的建模進行補充,擴充學生模型。
2) 領域專家提供的知識點關系較為主觀,貝葉斯網絡具備學習能力,如若提供足夠的實驗數據,貝葉斯網絡完全可以自動構建網絡結構,模型的完備性和準確性會大幅提升。未來的研究中,可以利用貝葉斯網絡的學習算法進行知識地圖的分析和構建。
3) 當前在設計個性化學習路徑時,更為關注的是對學習者知識掌握程度的預測,未來的研究應更多地結合學生的學習風格、認知偏好等因素,以推薦更加個性化的學習路徑。
參考文獻:
[1] 毛瑤瑤.數據挖掘模型在智慧教育中的應用研究[D].西安:西安電子科技大學,2021.
[2] 王瑋,陳恩紅,王煦法.基于貝葉斯方法的知識發現[J].小型微型計算機系統,2000,21(7):703-705.
[3] 慕春棣,戴劍彬,葉俊,等.用于數據挖掘的貝葉斯網絡[J].軟件學報,2000,11(5):660-666.
[4] A Bayesian Diagnostic Algorithm for Student [M]. San Francisco: Morgan Kaufmann, 1988:51-53.
[5] Cheng J, Grainer? J. Kelly. How To Build an Effective Knowledge Map [J]. Artificial Intelligence,2002(137):43-90.
[6] Learning Bayesian Networks The Combination of [J]. User Modeling and User-Adapted Interaction, 2002,12(2-3):281-330 .
[7] Zapata-Rivera J D,Greer J.Inspectable Bayesian student modelling servers in multi-agent tutoring systems[J].International Journal of Human-Computer Studies,2004,61(4):535-563.
[8] Cristina Conati,Abigail Gertner,Kurt Vanlehn.Using bayesian networks to manage uncertainty in student modeling[J]. International Journal of? Human-Computer Studies,1995,42(6):575-591.
[9] 王璋.基于貝葉斯網絡的評估導學方法研究[D].杭州:浙江工業大學,2006.
[10] 黃建明.貝葉斯網絡在學生成績預測中的應用[J].計算機科學,2012,39(S3):280-282.
[11] 沈海峰.基于貝葉斯網絡數據挖掘技術理論及算法的研究[D].合肥:合肥工業大學,2002.
[12] 楊卉,王陸,馮紅.在智能教學系統中兩層動態學生模型的研究[J].電化教育研究,2005(1):72-75.
[13] 陳仕品,張劍平.適應性學習支持系統的學生模型研究[J].中國電化教育,2010(5):112-117.
[14] 孫中紅.個性化智能網絡教學系統中學生模型的研究[J].中國電化教育,2009(10):107-110.
[15] 劉小丹,胡小紅.自適應學習系統中基于情緒感知的學生模型設計[J].中國教育信息化·高教職教,2015(10):85-88.
[16] 董曉輝,楊曉宏,張學軍.自適應學習技術研究現狀與展望[J].電化教育研究,2017,38(2):91-97,121.
[17] 陳麗花.貝葉斯網絡在學生模型建模中的應用分析[J].微型機與應用,2010,29(8):80-82.
[18] 劉艷,張銳.基于貝葉斯網絡的學習評估模型及其在E-learning系統的應用[J].滁州學院學報,2009,11(4):49-52,55.
[19] 馬文龍,瞿有甜,張金偉.貝葉斯網絡在適應性教學系統中的應用研究[J].計算機系統應用,2008,17(1):68-71.
[20] 閆志勇,李明,倪勁峰,等.貝葉斯網絡在自適應教育超媒體中的應用[J].計算機工程與應用,2002,38(8):217-219.
[21] 馬愛利,張卓奎.貝葉斯網絡在遠程教學中的應用[J].現代電子技術,2008,31(2):129-133.
【通聯編輯:唐一東】