□黃海
基于本體的CSCL學習行為模式研究
□黃海
本文將本體思想引入CSCL系統,分析了基于本體的計算機支持的協同學習環境下各種角色的行為模式。通過對協同學習模式進行分析,提出了基于本體的計算機支持的概念,建立了相應的模型。該模型描述了基于本體的協作過程,對系統的實現具有指導意義。
本體;計算機支持的協同學習
計算機支持的協同學習(Computer Support for Collaborative Learning,CSCL) 是探討如何利用計算機實現對協作學習過程的支持,已成為當前學習科學、教育技術學的一個熱點研究領域。Koschmann指出CSCL與其前身CAI、ITS和Logo—as—Latin相比,在學習、教育、研究方法和研究問題等方面有非常大的不同[1]。Lipponen提出“CSCL所關注的是如何通過技術促進協作學習。以增強伙伴之間的交互和小組工作,促進知識和專門技能在社區成員間的共享及分布”。[2]
目前對協同學習的相關技術研究,如:Web技術、協同技術、人工智能、知識庫和數據庫技術等,已經取得了一定的成果。但也還存在著一些不足和缺陷,其中以下幾個問題比較突出:
(1)無法描述和處理跨學科知識問題。
(2)知識獲取與共享問題。在協同學習系統中,其知識庫中所包含的知識點數量巨大,知識源可以是Web、其他知識庫和數據庫。 Ashok Patel[3]、Yujian Zhou[4]等人設計的系統在知識庫的構造中采用人工輸入知識的方法,耗費的工作量非常大。當前,如何從上述知識源中自動或半自動地協同獲取知識以構建CSCL系統,并解決知識共享問題,已成為研究的熱點。
(3)協同對象互操作語義視圖。在協同學習環境里,用戶在合作期間經常要訪問多個信息源(站點)獲得所需信息。由于這些信息源是異構的,分布在不同地方甚至是不同國家,因此這些不同信息源之間就存在著語義差別,使得不同信息源之間的互操作更加困難。目前的研究大都是對多信息源采用統一的對象描述[5]及視圖來處理互操作的問題,但卻沒有解決協同互操作的語義問題。
上述問題存在的原因,主要是對知識、方法和信息源的描述缺乏有效的手段。本文引入本體(ontology)思想,為解決這些問題提供了一個思路:
(1)本體作為知識和概念描述[6]的重要工具,具有領域對象描述手段和描述方法,因此可以解決跨學科的知識描述問題;
(2)語義網絡中本體構造和描述機制,為用戶多信息源之間資源對象基于語義的知識獲取奠定了基礎。
本體描述為網絡學習相關部門提供了一個統一的語義框架或規范模型,使來自不同背景、不同觀點、不同目的組織部門之間的理解和信息交流成為可能,并保持語義上的一致性。本體表示的是由關系和概念組成的語義網絡。在網絡學習行為信息處理中引入本體的主要目的是從信息處理的角度,建立網絡學習行為術語集及其關系,建立多角度的本體體系,和用于表示網絡學習行為的基本理論體系。這樣我們可以將該體系用于網絡學習行為信息的共享交換、知識的映射以及分析不同國家的網絡學習行為經驗與學術思想的異同。網絡學習行為本體是指應用本體論的基本方法,通過基于網絡學習行為數據元來進行領域概念提取、關系分析,以減少概念和術語上的歧義,把網絡學習行為知識體系中的名詞術語抽象為一組概念與概念之間關系的理論和方法。網絡學習行為本體已經成為網絡學習行為信息處理的重要基礎,在網絡學習行為智能系統以及網絡學習行為知識共享等多個方面得到廣泛的應用。
目前,一般把本體劃分為通用本體、常識本體、領域本體、語言學本體、任務本體等不同類型。其中,領域本體(Domain Ontology)是對具體領域中概念和關系的抽象描述,其功用和關系模式相似,是相關領域信息資源的組織框架[7]。
領域本體給出了領域實體概念及相互關系、領域活動以及該領域所具有的特性和規律的一種形式化描述。CSCL行為的領域本體是專業性的本體,由屬性、對象、關系和子領域本體組成,這類本體中被表示的知識是針對CSCL行為領域的。它們提供了CSCL領域的重要理論和基本原理。
基于本體的協作交流模型:
定義1:(基本成員)假設在交流過程中有一個老師(teacher)和若干學生(student)
定義2:(基本角色)在基于本體的協作交流中,存在三種角色,知識點觸發者、知識解釋者和知識接受者。
知識點觸發者(interpellator) 是在協作學習中對當前共同關注的某段文字中的某些詞匯或句子提出疑問的人,可能是學生不理解、也可能是教師故意提出。知識點觸發者必須對提出疑問的部分作標記。
知識解釋者(interpretor)對知識觸發者標記的部分進行基于本體的解釋,建立標記部分和對應的本體之間的關聯。
知識接收者(embracer)通過知識解釋者提供的關聯,在本體庫中執行知識導航,掌握知識和能力。
知識的交流分為三個步驟:即知識點觸發者標記問題、知識解釋者建立標記部分和對應的本體之間的關聯、知識接收者在本體庫中執行知識導航。
在協作知識交流過程中,參加討論的成員的角色是動態變化的。例如:教師開始時可能是知識觸發者,然后又變為知識解釋者。在現實世界中,教師可能認為某一部分學生會產生疑惑,所以故意提問,然后自己再向學生提供解釋幫助。成員角色的變化具體有四種情況。如圖1所示。
定義3:本體O是三元組<C,R,S>,其中C表示概念的集合;R表示概念之間的關系;S表示約束其本身是二元組<ConS,RolS>,ConS是對C中概念的約束,RolS是對關系的約束。

本體是領域范圍內的概念及相互之間關系的一種形式化表示,它使人們了對所描述的概念有統一的、一致的理解。
定義4:知識點κ
知識點κ是在當前討論空間V中具有一定含義的一段文字,它具有原子性,不可分割。
定義5:知識點觸發ρ
知識點觸發操作是由當前討論空間V中知識點觸發者執行的,它對知識點作標記。
例如,在某個詞匯或某段文字下加下劃線。
定義6:信息段Si
信息段可用三元組Si=<T,K,E>表示,其中T是當前討論的主題,K是滿足所有知識點觸發者潛在標識意圖的知識點κ的集合,E是K所處的上下文,也就是K的語境。
定義7:知識點解釋μ操作μ(κ):M(κ)→C
其中:
C是知識點對應的本體O中的概念,O是受限于主題T的具體領域本體。
M是知識點κ和本體C之間的關系,也就是κ的概念化
定義8:知識導航操作β:c Х r→2c
其中c,r表示本體中的一概念和關系,c∈C,r∈R,此操作表示從一個概念沿著關聯的關系導航到另一個概念,一個概念可能有多個關系存在,因此導航的結果是多樣的。
基于本體的CSCL行為模式的研究核心是要確定為各CSCL參與者提供哪些具體的應用功能和服務。可劃分為“前/后臺”兩大類。前臺是基于后臺本體庫的應用界面,它可以將本體庫中的各種本體實例化,并以能被用戶所理解的方式推送給用戶。后臺的核心是實現信息資源的共享,即通過對協同學習參與者的行為進行跟蹤采集、統計分析,從中挖掘出該用戶網絡學習特征,并通過將其本體化后存入本體知識庫,同時,對由教師發布的知識點和學習資源進行歸類,提取知識點特征屬性并本體化,保存入知識點屬性本體庫;根據用戶的學習行為特征,應用兩個本體庫定制出適合不同學習者的學習資源清單。后臺部分包括以下幾種單元。
(1)數據源集合——具體包括原始數據、原始知識、數據采集傳遞的通道等。基于本體的CSCL行為建立的基礎是已經出現的并能被采集的各種數據,包括各種WEB日志、原始文檔、表單數據、分組記錄、下載記錄及能被計算機發現的各種隱性數據。這些數據能以數據庫的形式保持到計算機中并能被其他用戶和程序所訪問。原始數據在采集后需要進行預處理,然后被基于本體之上的規則層的各種處理規則所訪問。
(2)本體庫集合——基于本體的CSCL行為中保持各種處理后數據的庫。基于本體的CSCL行為最大特點在于對于各種數據的處理都是基于本體來完成的。利用本體和OWL,基于本體的CSCL行為框架能保存各種不能被其他方法抽象化的各種行為數據、屬性數據及數據之間的關系。在基于本體的CSCL行為中,本體庫集合包括4種本體庫:對現有的實體語言通過抽象化后,產生Wordnet/Hownet知識庫;通過對CSCL用戶的學習行為實行本體化后產生學習行為本體庫;在Wordnet/Hownet知識庫的索引下,利用本體和OWL可以對知識點本體化;由其他隱性知識本體化后產生的本體庫。
(3)規則集合——各種本體庫的產生規則和使用規則。具體包括:數據源數據的預處理規則;本體庫的建模規則;由源數據生成本體的規則;各種實體與本體庫間的映射規則;各種訪問本體庫內本體的應用規則等。
(4)本體應用集合——利用本體實行CSCL需求與個性化服務應用。由上述幾項基于本體的CSCL行為組成單元及它們間的相互關系,共同構成了如圖2所示的基于本體的CSCL行為的層次模型。
在基于本體的CSCL行為層次模型中,各層的主要功能及內容如下:
(1)資源層:提供基于本體的CSCL行為的原始數據封裝,在這一層中,不僅包括各種數據資源,還包括提供數據流動支撐的物理平臺、網絡環境、數據格式等。

(2)本體庫層:基于本體的CSCL行為框架內所訪問的所有本體的集合。在基于本體的CSCL行為框架中,主要的本體庫有4種:領域知識Word-Net/HowNet知識庫、CSCL行為本體庫、知識點屬性本體庫、其他知識本體庫。
(3)規則層:基于本體的CSCL行為本體抽取規則、映射規則和應用規則的集合。在基于本體的CSCL行為框架中,由原始數據(知識點屬性、協作痕跡、網頁、日志等)基于抽取規則產生本體模型,而協作學習行為等物理活動和網頁、相關學習資源等通過本體映射規則構成本體庫,本體庫在應用規則的約束下最終產生以網絡推薦等能被用戶所接受的形式返還回用戶。由這些規則共同構成基于本體的CSCL行為的規則層。
(4)應用層:在應用規則約束下,通過UI界面最終將本體庫中的本體通過某種特定算法返還用戶。
在基于本體的CSCL行為框架內,數據處理流程大致如下,如圖3所示。
(1)教師找出當前信息段里學生可能不太理解的知識點,也就是知識點觸發;
(2)教師通過工具軟件找出對應該主題的本體庫,并在本體庫中找到目前知識點對應的本體,也就是執行μ操作;
(3)學生根據知識點對應的本體庫中的概念,執行操作。
基于本體的CSCL行為系統框架主要包括5個處理過程。

(1)CSCL痕跡抽取——利用知識挖掘方法,分析學習者的學習痕跡,為構造CSCL本體庫提供數據基礎;
(2)CSCL行為本體構建——在挖掘CSCL數據的基礎上,構筑基于本體的CSCL行為本體庫;
(3)CSCL知識屬性本體構建——通過知識標注,將各科知識點本體化;
(4)CSCL行為本體映射——通過知識挖掘擴展到全體CSCL行為;
(5)CSCL行為本體應用——利用已產生的各種CSCL本體,建立應用機制,將知識庫內容推介給用戶。
基于本體的CSCL行為層次模型和過程模型是本體理論在組織行為學領域應用的初步研究成果,可以有效提高CSCL的效率和效益。
在我們開發的計算機支持的協同學習平臺中綜合了WebCT和Learning Space,BSCW等已有系統的優勢,并注重了語義的清晰表示,這是前者所不具備的。系統使用涉及領域專家和學生兩個角色。系統包含兩個本體庫,行為本體庫和知識屬性本體庫。行為本體庫提供精確語義,知識屬性本體庫提供知識導航,其中行為本體庫由領域專家由UI界面通過本體編輯工具Protégé輸入,知識屬性本體庫由本文的概念分類算法對其中的術語分類形成術語網絡并由框架生成模塊形成。UI是用戶使用系統的接口,知識導航界面通過將本體概念以網頁上超鏈接形式呈現。在知識屬性本體庫支持下,學生可以通過知識導航界面的導航條查找在學習過程中有疑問知識點對應的概念以及該概念和其它概念的關系;學習與該概念相關的材料,如該概念的解釋和以該概念為關鍵詞由網上信息抓取模塊從網站上抓來的經過必要信息過濾的網頁快照等;學生還可以通過導航系統在概念之間瀏覽。通過這種方式,學生可以較好地掌握給出的概念及其相互關系,形成比較完整的領域概念體系。知識導航模塊工作的基礎是一個知識屬性本體庫,當學習者對導航到的某個知識點及上下文關系模糊時,可通過系統中的本體解釋工具來將由描述邏輯表示的本體轉換為適合人類理解的表達方式,如自然語言和圖形方式。
本文通過對和協同學習相關的教學理論和模式進行分析,得出了協同學習系統的需求模型。進而討論了在計算機支持下,學生對新知識的獲取方式,認為人與人的交流以及人與資源的交互是 CSCL中兩種主要的知識來源。通過對協同學習模式進行分析,提出了基于本體的計算機支持的概念,建立了相應的模型,該模型描述了基于本體的協作過程,對系統的實現具有指導意義。
[1]Koschmann,T.Paradigm shifts and instructional technology:An instruction [A],T.Koschmann.CSCL:Theory and practice of an emerging paradigm[C].Mahwah,NJ:Lawrence Erlbaum Associates,1996.1-23.
[2] Lipponen,L.Exploring foundations for computer-supposed collaborative learning [A]. Stahl,Computer Supported for Collaborative Learning:Foundations for a CSCL Community,the Proceedings of the Computer-supported Collaborative Learning 2002 Conference[C].Hillsdale,NJ:Eflbamn,2002.72-81.
[3]Ashok Patel,Kinshuk,A Conceptual Framework for Internet based Intelligent Tutoring Systems,Knowledge Transfer(Volume II)(Ed.A.Behrooz),1997,Pace,London,UK,pp117-124.
[4]Yujian Zhou,Martha W.Evens,A Practical Student Model in an Intelligent Tutoring System,Proceedings of the 11th IEEE International Conference on Tools with Artificial Intelligence,1999,pp.13-18.
[5]G.Aslan,D.Mcleod,SemanticHeterogeneity Resolution in Federated DatabasesbyMetadataImplantation and Step_wise Evolution,The VLDB Journal,Vol.8,Issue 2,1999,pp.120-132.
[6]T.R.Gruber,"Toward Principles for the Design of Ontologies Used for Knowledge Sharing".Formal Ontology in Conceptual Analysis and Knowledge Representation,edited by Nicola Guarino and Roberto Poli,Kluwer Academic Publishers,1993.
2010-05-30
黃海,碩士,鹽城衛生職業技術學院信息中心計算機技術教研室主任(221009)。
責任編輯 柯 南
G40-057
B
1009—458x(2010)10—0070—04