吳文濤,張舒予
(1.南京師范大學 教育科學學院,江蘇 南京 210097;2.安徽師范大學 教育科學學院,安徽 蕪湖 241000)
語義慕課:語義網環境下MOOC的發展愿景 *
吳文濤1,2,張舒予1
(1.南京師范大學 教育科學學院,江蘇 南京 210097;2.安徽師范大學 教育科學學院,安徽 蕪湖 241000)
語義慕課又稱作LOOC(Linked Open Online Courses),即“關聯開放在線課程”。近來,國外推崇語義慕課的聲音越來越大,相關的試驗應用也已生根發芽,語義慕課已成為國際在線課程研究的一個重要方向。因此,對語義慕課相關研究進行系統考察能為國內研究者及時跟蹤國外最新動態與開展語義慕課相關研究提供借鑒。語義慕課是語義網技術與MOOC的結合體,是一種基于MOOC平臺的語義應用,具有關聯性、開放性、個性化以及智能化等特征。該文在分析德國達姆施塔特工業大學研究成果的基礎上,詳細介紹了語義慕課涉及的關鍵技術,并嘗試構建了語義慕課的結構體系。語義慕課的關鍵技術主要有:用于描述數據語義的RDF、用于構造和推理的 OWL以及用于查詢關聯數據的 SPARQL。該文構建的語義慕課完整體系主要包括四大模塊:用于搜索“貨源”的數據獲取模塊,用于打造“地基”的數據轉換模塊,用于構建“倉庫”的數據關聯模塊以及用于設計“窗口”的數據應用模塊。未來,我國語義慕課的研究與實踐需從資源建設、局部試驗、技術遷移等路徑協同推進。在推進的過程中,我們應積極面對知識產權、技術開發以及隊伍建設等方面的諸多挑戰。
語義慕課;語義網技術;MOOC;LOOC;在線課程
2008年以來,國內外MOOC的發展大體上歷經興起、繁榮、反思以及轉型四個階段,逐步走向“后MOOC”時代,一批旨在優化當前MOOC的在線課程范式(如SPOC、MOOL、MOOR、PMOOC等)紛紛涌現[1],這些范式不僅試圖從理論上為在線教育重構合用范式,也期待在實踐中給網絡學習用戶提供優質服務,為在線課程的可持續發展注入新鮮血液與創新動力。轉型發展過程中,源自計算機科學領域的語義網技術受到國際在線課程領域學者的關注,語義慕課(Semantic MOOC)應運而生。近年來,部分國際在線課程學者就語義慕課展開研究,取得了一系列頗具開創性的研究成果,在國際上引起較大的關注。初識語義慕課,我們不禁產生以下疑問:語義慕課是什么,它表現出了什么樣的特征;它涉及哪些技術,又呈現怎樣的結構體系。本研究擬就上述問題進行探析,希冀為我國MOOC研究者及時跟蹤國外MOOC研究領域最新動態、探索語義網環境下在線課程的設計思路提供參考。
語義慕課萌生于現實困境,肇始于技術遷移。2010年以來,MOOC的飛速發展使得主流平臺中的學習資源“井噴式”涌現,這一定程度上導致學習者陷入面對海量學習資源卻難以有效利用的尷尬境地。因此,如何使得MOOC平臺中的無數學習資源發揮最具意義的教育效用,成為如今在線教育界關注的重要問題之一。與此同時,計算機領域的語義網技術日趨完善并在部分領域初顯實效。由于語義網技術能夠有效解決當前網絡資源存在的孤立隔離、檢索困難以及共享與交互程度低等問題,因而它被國外學者引入在線教育領域,成為優化MOOC平臺的重要技術之一。2013年,Sergio Miranda等人率先嘗試運用語義網技術準確發現MOOC平臺中用戶的學習數據,以優化其教學評價設計[2]。2014年3月,Nelson Piedra等人指出,基于語義網技術的MOOC能夠提高學習者發現學習資源的可能性,促進開放教育資源的有效利用[3]。同年7月,在IEEE(Institute of Electrical and Electronics Engineers,電氣和電子工程師協會)第14屆高級學習技術國際會議上,來自德國著名理工高校達姆施塔特工業大學計算機系的Kai Michael H?ver與Max Mühlh?user正式提出語義慕課這一概念,視其為語義網環境下MOOC的發展愿景[4]。簡而言之,語義慕課=語義網技術+MOOC,二者的結合賦予了語義慕課全新的內涵與特征。
語義慕課又稱作LOOC(Linked Open Online Courses),英文直譯為“關聯開放在線課程”。與一般的MOOC平臺不同,語義慕課既不制作資源也不發布資源,它實際上是一種以提升現有MOOC平臺中學習資源的應用效率為目的的語義應用。具體而言,語義慕課是在現有MOOC平臺間建立起鏈接,使得他們之間能夠更好地共享與交互,從而為學習者有效應用其中的學習資源提供智能化的服務。其中,語義網技術的關鍵作用在于為MOOC平臺中的學習資源貼上能被計算機識別的標簽,進而使資源自動關聯在一起,并通過計算機的自動推理實現資源的智能化處理,如學習資源的精準檢索、智能推薦等。不難發現,國際在線課程領域推出語義慕課的初衷便是借助語義網技術促進學習資源從孤立隔離走向互聯共享,從而更大程度上發揮當前MOOC平臺的教育效用。
事實上,語義慕課更像是針對MOOC學習資源的智能“淘寶網”。一方面,語義慕課的資源檢索與淘寶網的搜索引擎類似,搜索引擎從無數的商品網頁中抓取信息呈現給用戶,而語義慕課則從大量的MOOC平臺中找到學習資源提供給學習者。不同的是,搜索引擎面對的是數以億計的松散且無序的數據,因而它如今會因檢索效率底下而陷入瓶頸;而語義慕課搜索的是經過改造的具有語義關聯性的數據庫,它能憑借計算機的智能推理實現精準檢索。另一方面,語義慕課的資源推薦類似于淘寶網的貨品推薦,區別在于,貨品推薦是通過對大量的用戶瀏覽記錄進行數據挖掘,根據數據分析結果進行預測,而在語義慕課中,主要依靠計算機對關聯數據的智能推理實現學習資源的智能推薦。
顯然,語義網相關技術是語義慕課的基石。語義網技術是當前人工智能領域研究的熱點,指的是一系列有關語義網的技術標準,大體上可分為三大類:語義理解技術、語義推理技術以及以前兩者為基礎的語義搜索技術。語義表示計算機對某一個概念、術語或者符號可以理解的“含義”[5],語義網技術的關鍵便在于以統一的規范為數據賦予這種“含義”,進而實現一系列智能化的自動操作,為用戶提供個性化與智能化的服務。在語義慕課中,實現這種智能化的功能一般需要完成三個步驟:一是以語義理解技術為規范為學習資源背后的數據賦予語義;二是利用語義推理技術在有含義的數據間建立關聯;三是借助語義搜索技術使這些具有語義關聯的數據發揮效用。譬如,在語義慕課中,當學習者檢索“愛課程平臺中有哪些語義技術課程”,計算機便可理解學習者的意圖是搜索課程,且范圍是愛課程網,要點是語義技術,從而執行的操作是從特定數據源中準確查詢到愛課程網上的語義技術課程資源并呈現給學習者。在這里,特定數據源正是通過語義理解技術與語義推理技術構建的關聯數據庫,計算機的智能檢索則是依賴語義搜索技術來完成。
綜上可知,語義網技術的諸多功能恰能解決當前在線課程領域存在的現實問題,于是,它便自然地被部分學者引入在線課程的設計中,語義慕課由此而生。當前,由于語義網技術整個的技術體系仍有待完善,部分技術難題也有待攻克,因此,國外語義慕課研究也還處在理論構想與局部試驗階段。不過,這并不妨礙我們對這種智能化的課程范式進行解讀與構思,為設計語義網環境下的在線課程模式進行開拓性的探索。
語義慕課是語義網相關技術支持下的智能教育應用,語義網技術與MOOC的深度融合使得語義慕課的特征得以凸顯。雖然語義慕課仍停留于理論探索階段,但從目前國外相關研究進展與試驗應用的情況來看,語義慕課至少已展現出關聯性、開放性、個性化和智能化四大特征。
關聯性不僅是語義網技術的核心,也是語義慕課的關鍵。應該說,語義慕課的關聯性特征與生俱來。在語義慕課的另一名稱LOOC(Linked Open Online Courses)中,“Linked”本意為“鏈接的”,在計算機領域就多譯為“關聯的”。具體而言,語義慕課的關聯性有三個層面的涵義:一是數據間的連接,語義理解技術的重要任務便是在MOOC網站中的數據間建立起語義關聯;二是資源間的共享,關聯數據的重要作用便在于促進學習資源從孤立隔離走向互聯共享;三是平臺間的交互,語義慕課的最終目標是在關聯數據的基礎上打通現有MOOC平臺間的應用壁壘,使得它們為學習者提供更加優質的服務。
語義慕課能夠有效提升開放教育資源的開放性。2012年,聯合國教科文組織將開放教育資源定義為“以數字化或其他格式存在于任何公共領域或者是根據開放許可協議發布,允許他人不受限制或者受到有限限制的免費獲取、使用、改編和再分配的教學、學習和研究資源”[6]。依此考察,現階段的部分MOOC平臺顯然難以稱得上“開放”,因為學習用戶僅能在線學習而無法通過下載對學習資源進行其他方式的利用。相反,語義慕課不但能夠促進對開放教育資源的管理、交換以及整合,而且其技術架構為開放教育資源的交換、分配和重用提供了極大的便利[7]。正因如此,語義慕課被國際在線課程領域視作推動開放教育運動持續發展的重要課程樣式之一。
所謂個性化,是指語義慕課能為每個學習者提供針對性的學習資源和學習服務,使得真正的個性化學習成為可能。首先,語義慕課能夠為學習者提供個性化的學習資源。借助語義技術對學習資源進行多維度聚合,能夠使得海量、分散、無序的學習資源聚合成能滿足個性化學習的資源包[8]。其次,語義慕課能夠實現個性化的學習分析。在當前MOOC平臺中,學習者的學習數據會因為多種原因而處于分散無序的狀態,而語義技術能夠使得計算機自動整理這些分散無序的數據,進而發現數據的所有者,從而完成個性化的學習分析。總之,語義慕課能提供個性化的學習資源,因而,個性化的學習方式才有可能發生;語義慕課能進行個性化的學習分析,由此,個性化的學習評價便有望實現。
語義慕課的智能化特征與個性化特征相伴隨行。換言之,語義慕課為學習者提供的一切個性化服務都是以計算機智能處理為基礎。離開語義慕課的智能化特征,個性化服務便無從談起。首先,了解學習者的個性化需求需要計算機的智能語義識別;其次,為學習者提供個性化服務依賴計算機的智能語義推理。在智能化的語義慕課中,學習者要做的僅是通過一句話或者多回合的對話方式將需求告知計算機,接下來便是等待計算機提供智能化的服務,如個性化學習資源的智能推薦、學習數據的智能分析以及新增數據的智能關聯等。
目前,國際語義慕課研究已取得一定進展,相關經驗值得國內借鑒參考。2014年,達姆施塔特工業大學計算機系的Michael H?ver與Max Mühlh?use在提出語義慕課概念的同時,也構建出“一種基于網絡教育數據的語義慕課結構”(如圖1所示)。他們指出,語義慕課的設計需借助三大語義網技術,即用于描述數據語義的RDF(Resource Description Framework)、用于構造和推理的OWL(Web Ontology Language,簡稱OWL)以及用于查詢關聯數據的SPARQL (Simple Protocol and RDF Query Language,簡稱SPARQL))。如圖1所示,Michael H?ver與Max Mühlh?use搭建的語義慕課的基本結構分為三層,由下至上依次為數據網絡層、數據層以及應用層。數據網絡層展示了語義慕課的數據來源,數據層呈現了數據的存儲方式,應用層則設計了具體的應用服務[9]。

圖1 一種基于網絡教育數據的語義慕課結構
顯然,達姆施塔特工業大學的最新研究成果兼具開創性與指導性。一方面,該研究創新的將語義網技術遷移至MOOC平臺的優化設計中;另一方面,其搭建的語義慕課結構符合當前主流語義應用的基本架構,不僅對今后的語義慕課研究具有極大的指導意義,也為未來語義慕課的發展勾畫出一幅令人憧憬的理想藍圖。
不過,在筆者看來,對于初識語義慕課的國內MOOC研究學者來說,達姆施塔特工業大學的研究仍有兩點稍顯不足:其一,該研究主要側重于描述應用層中具體應用的設計,未就語義慕課的基石——語義網技術的具體功能作詳細闡述;其二,筆者考察諸多語義應用項目后發現,該研究搭建的語義慕課結構僅是一種簡化模式,并未展示出語義慕課體系的全貌。有鑒于此,為使國內學者更為清晰地認知語義慕課的結構與功能,本研究便在以上成果的基礎上做了進一步探索,主要完成了兩方面的工作:一是深入解析語義慕課中三大語義網技術的具體功能;二是在對現階段已有語義應用項目的考察的基礎上,重新構建出語義慕課的完整體系。
如前所述,語義網技術主要分為語義理解技術、語義推理技術和語義搜索技術三類,它們具體的技術標準分別對應圖1中三大關鍵技術,即RDF、OWL與SPARQL。目前,三大技術均由萬維網聯盟(又稱W3C理事會)發布并形成了統一規范,是語義慕課體系中不可或缺的技術基石。
RDF是由萬維網聯盟發布的一種標準化的數據描述語言,它以三元組(Triple,即資源、屬性和取值)作為基本數據單元來描述數據[10]。由于現階段MOOC平臺中的數據分散且無序,要想在這些數據之間建立關聯,首要任務便是以統一的標準語言描述這些數據,RDF便是當前公認的語言標準。語義慕課的設想是將當前MOOC平臺中的數據均描述為RDF形式并進行存儲,為后續的數據應用打下基礎。
OWL是一種被萬維網聯盟發布并認可的構建本體的技術標準[11],其作用是在有語義的數據間建立起關聯。在語義慕課中,只有利用OWL構建領域知識本體庫,才能實現課程知識之間邏輯關系的自動或者半自動化關聯標注[12]。換言之,RDF形式的數據需要一個明確的形式規約,這樣計算機才能理解數據的含義,進而準確地找到數據,發現相關的學習資源。而OWL就是這樣一種通用規約,學習資源的數據依據OWL構建的本體上升為知識,可以更好地被共享和復用,從而發揮萬維網的智能化潛力。
正如關系型數據庫需要標準化的結構化查詢語言來規范數據查詢的表達,RDF數據也需要相應的數據存取規范。SPARQL就是萬維網聯盟專門為查詢RDF數據開發的一種查詢語言和數據獲取協議,可以用于查詢任何用RDF來表示的信息資源[13]。具體到語義慕課中,基于HTTP和簡單對象訪問協議的SPARQL查詢能夠識別被查詢數據的語義及其關聯,繼而準確返回學習資源的數據,并以可視化網頁的形式呈現給學習者。
簡而言之,在語義慕課中,利用RDF可為學習資源背后的數據賦予語義;利用OWL構建本體可在語義數據間建立起關聯;利用SPARQL便可查詢具有語義關聯的數據。三者是語義慕課實現學習資源精準檢索與智能推薦的前提。
如圖2所示,本研究所構建的語義慕課的完整體系包含四個模塊,即數據獲取、數據轉換、數據關聯和數據應用,四者各司其職,形成一種線性的邏輯關系,為語義慕課最終發揮效用提供支撐。

圖2 語義慕課的完整體系
數據獲取模塊的主要作用在于搜集學習資源的原始數據。原始數據的來源有兩大渠道:一類是主流MOOC平臺,如Coursera、edX、可汗學院等,以結構化或半結構化數據為主,也會涉及少量無結構化的數據;另一類是關聯開放數據集,當前,國際語義網領域最大的關聯開放數據集源自著名的關聯開放數據項目(Linked Open Data Project,簡稱LOD)。LOD項目是由Chris Bize與Richard Cyganiak于2008年發起的倡議項目,它號召更多的個人與組織將現有網絡數據發布成關聯數據(Linked Data),為語義網環境下智能應用的構建打下基礎。截止2014年8月30日,已經有來自全世界的570個數據集被發布成鏈接數據且相互間建立起關聯,DBpedia是其中最大也最為著名的數據集[14]。近年來,這些關聯數據集已經為搜索、金融、語音領域的語義應用提供了有力的數據支撐。
需要補充說明的是,從以上兩大渠道獲取數據各有利弊。僅從技術角度看,獲取LOD關聯數據庫的RDF數據顯然更加便捷,數據所涉及的網絡資源也更加豐富,然而,由于LOD關聯數據庫中的數據量過于巨大且涵蓋太多領域,構建知識本體將是一項浩大的工程,難度也無法估計[15]。相比之下,主流MOOC平臺的數據雖然比較有限,但是這些數據涉及的主題更為集中,從其中抽取RDF數據并構建知識本體更有望實現。正因如此,目前國外研究也多基于主流MOOC平臺的數據設計各類語義應用。譬如,加拿大學者Gilbert Paquette與Alexis Miara借助語義網技術設計了一種名為COMETE智能資源管理工具,用于提升MOOC平臺的智能檢索能力[16];美國學者Sebastian Kagemann與Srividya Bansal則搭建了一個被稱作MOOCLink語義網站,實現了對Coursera平臺上學習課件的智能獲取與對比[17]。
數據轉換模塊的主要任務是賦予數據語義。顯然,有含義的數據是語義慕課的基石,缺少它,語義慕課便是無本之木、無源之水。為數據賦予語義需要將從數據網絡中獲取的各類數據轉換成RDF形式,即從原始數據中抽取三元組形式的輕量級的RDF數據并進行存儲。如前所述,原始數據因來源渠道不同大體分為三類:結構化或半結構化的數據、無結構化數據以及已經關聯的RDF數據。結構化或半結構化的數據多源自關系型數據庫,本身已有語義內涵,僅需按照RDF形式進行統一調整;無結構化的數據由于本身缺乏語義信息,需要重新描述;已經關聯的RDF數據則無需轉換可直接調用。
一般認為,三類數據的轉換分別有三種方式。對于結構化或半結構化的數據,可以通過運用相關轉換工具,使用淺表層分析技術抽取語義形成RDF數據。譬如,萬維網聯盟與麻省理工學院共同開發的轉換平臺SIMILE RDFizer就提供多個RDF轉換器,能夠將關系型數據庫中的結構化或半結構化轉換成RDF數據,其中和教育有關的轉換器包括 MARCRDFizer、OAI-PMH RDFizer、OCWRDFizer[18]。對于無結構化的數據一般多采用人工標注的方式抽取語義,操作相對復雜且費時費力。目前,部分轉換平臺(如Drupal、Fedora、Dspace、Eprints等)也能夠通過統計技術和淺自然語言技術為人工標注數據提供一定的幫助。對于已經關聯的RDF數據,數據庫一般都會提供具有開放接口的SPARQL終端,支持其他應用直接查詢與使用其中的數據。
數據管理模塊的關鍵功能是依據OWL構建知識本體,在語義數據間建立起關聯。足夠的知識本體不僅能使得RDF數據得到有效的組織和管理;還能進一步增強RDF數據間的語義與邏輯關系,為計算機的智能推理提供支持。本體是某個領域的概念集合和概念之間的關系,通過形式化的方式表達該領域的知識及其知識結構[19]。一個本體是一個特定領域的模型,為特定的目的而構建[20]。在語義慕課中,由于存在多種特定的需求,往往需要構建不同類型與不同層次的知識本體,如領域本體、學科本體、課程本體等等。
語義網環境下,本體的構建方法一般有三種,即專家手動構建、計算機自動構建以及本體復用。專家手動構建本體耗時費力,已經無法滿足當前的需求;計算機自動構建又存在準確率不夠的弊端;而本體復用則是指充分利用當前網絡中已經存在很多的知識本體以減少工作量。由于當前網絡的公共領域中存在許多現成的本體,因此我們很容易找到一個可用的第三方本體,為我們構建新的知識本體提供一個有用的起點。此外,數據關聯模塊的另一功能是用于數據存儲。前期形成的RDF數據以及后期構建的各類知識本體及其實例均需存儲于其中。
數據應用模塊是語義慕課的頂層,主要任務是查詢數據、存儲數據以及修改數據。在前文案例中,Michael H?ver與Max Mühlh?use也探討了MOOCs平臺中最常涉及的三種應用,即交流論壇(Discussion Form)、文本討論(Paper Discussion)、講座錄像(Lecture Recording)。三種應用均需通過SPARQL端點實現對數據的調用。需要強調的是,面向RDF數據的查詢與當前搜索引擎中的關鍵詞查詢不同,這是一種更加智能化的語義查詢。也就是說,計算機能在識別搜索關鍵詞的語義信息的基礎上自動推理,為用戶呈現具有語義相關性的各類資源,使得資源精準檢索與智能推薦成為可能。
考慮到一般用戶的數據處理能力有限,在語義慕課中,SPARQL查詢工作并不直接面向一般用戶,需要經由語義網瀏覽器將數據連接的學習資源以可視化的方式呈現給用戶。近十年來,語義網領域的多個研究機構先后推出了十幾個有影響力的語義網瀏覽器,如麻省理工學院開發的Piggy Bank、英國開放大學開發的Magpie以及愛爾蘭數字企業研究所開發的VisiNav等。以VisiNav為例,它是一個支持可視化查詢構造的語義網數據訪問系統,能夠實現對RDF數據集的6種基本操作:關鍵詞搜索、對象導航、分面式瀏覽、路徑遍歷、投影和排序[21]。一般而言,基于語義網瀏覽器的語義慕課能夠以共享、導航、搜索、管理等方式促進學習用戶充分利用學習資源。此外,語義慕課也支持學習用戶以某種方式(如上傳、發布、記錄等)為其增加新的學習資源,這些資源也將以三元組的形式為描述關聯數據并存儲下來,在知識本體的組織下供其他用戶重復使用。
除了以上的查詢與存儲功能,數據應用模塊還需為知識工程師提供服務。由于學習資源的動態變化以及不同用戶的各種需求,知識工程師需要不斷構建新的知識本體、及時修正舊的知識本體,并將它們放回到存儲庫中,為語義慕課的持續有效工作提供技術支持。
理解語義慕課的內涵特征與結構體系的重要目的之一便在于促進我國語義慕課研究提上日程。語義慕課是國際在線課程領域一個全新的課題,它的推出使得當前MOOC向智能型課程平臺轉型成為可能。在語義慕課的支持下,學習用戶能夠更加開放、更加智能、更加靈活的利用學習資源,由此,更加個性化學習與智能化學習也有望實現。當前,國外推崇語義慕課的聲音越來越大,相關的試驗應用也已生根發芽,語義慕課已成為國際在線課程發展的一個重要方向。國際語義慕課的理論性構想與試驗性研究為我國推進語義慕課研究的開展提供了寶貴的經驗與啟示。
認清語義慕課的本質便能把握語義慕課的關鍵。套用一句知名廣告語,語義慕課不生產教育資源,它只是教育資源的智能搬運工。如果說MOOC的關鍵作用是將最優質的教育資源無償提供給世界上每個角落的學習者,那么語義慕課的重大意義便是促進所有人更好地發現與使用最優質的教育資源。顯然,離開優質的教育資源,語義慕課便是無本之木、無源之水。從開放課件項目到開放教育資源,再到大規模開放在線課程,優質資源建設不僅一直是開放教育資源運動的題中應有之義,也始終是在線課程領域致力解決的核心課題。只有優質教育資源被建設好,語義慕課才有發揮價值的可能。因此,我國在線課程要想盡快走向更加智能化的語義慕課,在突破相關的技術瓶頸之前,首要任務之一是建設優質的在線教育資源,為語義慕課發展奠定堅實的資源基礎。
國外研究啟示我們,局部試驗性研究是推動語義慕課發展的重要方式之一。如前所述,原始數據是語義慕課的“貨源”。因此,開展語義慕課試驗研究的第一步是獲取足夠數量的原始數據。那么,從哪里獲取合適的原始數據呢?顯然,最佳的方式是從現有在線課程平臺中獲取。然而,由于國內很多的MOOC平臺系企業開發,未能提供開放的API(Application Programming Interface,應用程序編程接口),以致后臺的數據無法直接調用。因此,獲取數據的可行方式之一便是依靠國家教育行政部門開發的公益性在線課程平臺。2003年以來,國家教育行政部門牽頭開發了一大批精品課程資源,建成了多個在線課程平臺,如國家精品課程資源網等。這些平臺中的數據不僅符合語義慕課研究的要求,有些還因存在共享、重用和復用率低等問題[22]而使得開展語義慕課的試驗研究具有更大的價值。因此,相關研究人員可以在征得教育主管部門同意的前提下獲取相關平臺中的部分數據,在此基礎上,以試驗性研究為國內語義慕課的前進開拓道路。
語義網技術源自計算機科學領域的技術革新,其應用目前也多集中于搜索引擎、金融以及語音等領域。正是一批具有超前視野的研究學者將語義網技術引入e-Learning領域,它才引起在線課程研究者們的關注。應當看到,新興技術的遷移應用不僅是在線課程領域突破的“助推器”,也是語義慕課發展的“動力源”。顯然,要想使得語義慕課從愿景走向現實,相關技術瓶頸的突破是必須解決的關鍵問題之一。就目前研究來看,數據的語義轉換技術與本體的構建技術是其中的重點之一。然而,僅憑在線教育領域的研究人員單方面的努力,突破這些技術瓶頸難度太大。因此,必須借力于國內語義網領域的專家,以實現相關技術的順利遷移。只有關鍵技術得以成功遷移,語義慕課才有可能從閉門造車走向集思廣益,從單打獨斗走向協同合作,從靜止式孤立發展走向永動式持續前進。
“開放”一直以來都是開放教育資源運動強調的核心要義,也是語義慕課設計的關鍵理念。然而,隨著社會對知識產權的愈發強調,落后的產權保護政策將會在一定程度上對語義慕課的發展產生阻滯。如前所述,語義慕課的關鍵將現有MOOC平臺中的數據轉換成關聯數據,這是一種對第三方數據的消費和再創造,過程中必然涉及他人的利益,如何明確不同類型和歸屬的數據(或數據集)的所有權、發布權、使用權、收益權等問題都將是語義慕課發展過程繞不開的關口[23]。鑒于我國知識產權保障方面仍舊依靠《中華人民共和國知識產權法》《中華人民共和國著作權法》等法律法規,尚未制定針對網絡資源與開放數據的相關法律法規,部分發達國家現有的網絡許可協議(如英國的開放政府許可協議)值得我國借鑒與參考。此外,由于現有大多數MOOC平臺均需注冊、登錄方可進入,這也給語義慕課的發展帶來麻煩。試想,即便是語義慕課能將各大MOOC平臺學習資源的關聯在一起,但學習者在利用不同平臺的資源時仍需多次涉及注冊、登錄等環節,如此,語義慕課的效果也將大打折扣。顯然,上述問題將成為語義慕課發展過程中必須積極面對與妥善解決的重要課題。
語義網技術的突破是語義慕課發展的基石與前提。盡管在萬維網聯盟的推動下,一系列技術規范得以發布與公認,語義網的理論基礎已經奠定,但語義網數據集成、語義網搜索、基于語義網的智能問答和語義網軟件工具等方面仍舊存在部分技術難題有待攻克。倘若以上技術瓶頸難以突破,那語義慕課便是“空中樓閣”,無法從理想走向現實。不過,當前語義網技術已在部分領域初露鋒芒,語義網技術體系也正日趨完善,局部范圍的有效應用已經讓學界看到希望。相信伴隨著時間的推移,部分技術難題也將在知識工程師們的努力下得到解決,語義慕課便有望從理論構想走向實踐應用,從局部試驗走向全面開展。
語義慕課的發展顯然離不開相關研究人員的推動與參與。由于語義慕課不僅是一個全新的方向,也是一個涉及計算機與在線教育的交叉領域,因而目前國內從事相關研究的人員遠遠不夠,研究隊伍亟待建設。事實上,我國早就非常重視語義網技術的相關研究,國家863計劃從2002年起便將其列為重點支持項目,國內清華大學、南京大學、東南大學等多所高校都設有語義網相關技術的研究機構,也產出了一批高質量的研究成果[24]。問題的關鍵是,這些研究成果并沒有在在線教育領域得到應用,其中的主要原因在于國內的語義網技術研究與在線教育研究各自為政,尚未形成有效的溝通與合作。因此,當前亟待解決問題的是如何促進語義網技術領域與在線教育領域的協同合作。顯然,最好的方式之一是從以上兩個領域中吸引一批研究人員,組建一個或多個研究團隊,從而為推動我國語義慕課向縱深發展提供充分的人員保障。
[1] 祝智庭,劉名卓.“后MOOC”時期的在線學習新樣式[J].中國遠程教育, 2014,(10):36-43.
[2] Miranda S,Mangione GR,Orciuoli F,et al.Automatic Generation of Assessment Objects and Remedial Works for MOOCs[DB/OL].http://ieeexplore.ieee.org/ stamp/stamp.jsp?arnumber=6671018,2016-04-25.
[3] Piedra N,Chicaiza J,Lopez J,et al.Supporting Openness of MOOCs Contents through of an OER and OCW Framework Based on Linked Data Technologies[DB/OL].http://ieeexplore.ieee.org/stamp/stamp.jsp? tp=&arnumber=6826249,2016-03-23.
[4][9] Ho?ver KM,Mühlha?user M.LOOCs:Linked Open Online Courses:A Vision[DB/OL].http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnum ber=6901536,2016-02-26.
[7] Piedra N,Chicaiza J,Lopez J.An Approach for Description of Open Educational Resources Based on Semantic Technologies[DB/OL]. https://www.researchgate.net/publication/224148709,2016-04-13._ An_approach_for_description_of_Open_Educational_Resources_ based_on_semantic_technologies. 2016-04-03.
[5] 王繼新,黃濤等.基于語義網格的教育知識服務體系研究[J].中國電化教育,2006,(5):93-96.
[6] 保羅·川內,肖俊洪,楊偉燕.開放教育資源質量保證準則TIPS框架[J].中國遠程教育,2013,(19):11-21.
[7] Piedra N,Chicaiza J,Lopez J.An Approach for Description of Open Educational Resources Based on Semantic Technologies[DB/OL]. https://www.researchgate.net/publication/224148709,2016-04-13._ An_approach_for_description_of_Open_Educational_Resources_ based_on_semantic_technologies. 2016-04-03.
[8] 吳鵬飛,余勝泉.學習資源語義關聯關系及其可視化研究[J].中國電化教育,2015,(12):97-104.
[10] RDF [EB/OL]. https://www.w3.org/wiki/RDF,2016-03-28.
[11] Patel-Schneider PF, Hayes P, Horrocks I, et al. OWL Web Ontology Language Semantics and Abstract Syntax[J]. Encyclopedia of Information Science & Technology Second Edition, 2004,(1):7-15.
[12] 余勝泉,萬海鵬.支持課程大規模開放的學習技術[J].中國電化教育,2014,(7):7-18.
[13] 百度百科. SparQL[DB/OL]. http://baike.baidu.com/view/661304. htm,2016-04-23
[14] The Linking Open Data cloud diagram [EB/OL]. http://lod-cloud. net/,2016-04-28.
[15] 李曼, 杜小勇等. 語義Web環境中本體庫管理系統體系結構研究[J].計算機研究與發展, 2006, 43(z3):39-45.
[16] Paquette G, Miara A. Managing Open Educational Resources on the Web of Data[J]. International Journal of Advanced Computer Science & Applications,2014, (8):55-63.
[17] Kagemann S,Bansal S.MOOCLink: Building and Utilizing Linked Data from Massive Open Online Courses[DB/OL].http://ieeexplore. ieee.org/stamp/stamp.jsp?tp=&arnumber=7050836,2016-04-13.
[18] 陳大慶,丁培,葉蘭,等.MOOC教育資源語義化關聯研究[J].圖書情報工作,2014,(14):121-126.
[19] 丁國柱,余勝泉.基于本體學習算法的學科本體輔助構建研究——以學習元平臺語文學科知識本體的構建為例[J].中國電化教育,2015,(3):81-89.
[20] Grigoris Antoniou.語義網基礎教程[M].北京:機械工業出版社,2014.
[21] 瞿裕忠,胡偉,程龔語義網技術體系[M].北京:科學出版社,2015.
[22] 王娟,劉名卓,祝智庭.高校精品課程應用調查及其對精品資源共享課建設的啟示[J].中國電化教育,2013,(12):40-46.
[23] 張春景,劉煒,夏翠娟等.關聯數據開放應用協議[J].中國圖書館學報,2012,(1):43-48.
[24] 胡偉,瞿裕忠,黃智生.語義Web課程建設初探[J].計算機教育,2013(12):69-72.
Semantic MOOC: The Development Prospect of MOOC under the Environment of the Semantic Web
Wu Wentao1,2, Zhang Shuyu1
(1. College of Science Education Nanjing Normal University, Nanjing Jiangsu 210097;2. College of Science Education Anhui Normal University, Wuhu Anhui 241000)
Semantic MOOC is also called LOOC, which is an acronym for Linked Open Online Courses. Recently, more and more attention has been drawn to Semantic MOOC, the relevant tests have been started. Semantic MOOC has become an important direction of international online course area. Therefore, in order to enable the domestic scholars to follow the international trends and to carry out related research, it is necessary to make a systematic investigation on Semantic MOOC. Semantic MOOC is the combination of semantic web technology and MOOC, and it is a kind of semantic application for linking MOOC platform. The characteristics of MOOC are related, open, personalized and intelligent. Based on the analysis of the research of Darmstadt Industrial University in German, this paper introduces the key technologies of Semantic MOOC, and tries to construct the complete structure of Semantic MOOC. The key technologies are Resource Description Framework, Web Ontology Language and Simple Protocol and RDF Query Language. The complete structure mainly includes four modules: data acquisition module(for searching data), data conversion module(for transforming data), data correlation module(for linking and storing data) and data utilization module(for using data). In the future, the research and practice of semantic MOOC should be promoted from aspects of resource construction, local experiment and technology transfer. In the process of advancing Semantic MOOC, it should positively cope with the challenges, such as problems of intellectual property rights, problems of technical development and problems of team building.
Semantic MOOC; Semantic Web Technology; MOOC; LOOC; Online Courses
G434
A
吳文濤:在讀博士,講師,研究方向為信息技術與課程整合、媒介素養教育(owen2015@qq.com)。
張舒予:教授,博士生導師,研究方向為視覺文化與媒介素養。
2016年6月14日
責任編輯:李馨 趙云建
1006—9860(2016)09—0051—08
* 本文系2016年江蘇省普通高校學術學位研究生創新計劃項目“語義網環境下MOOC學習資源庫的設計研究”(項目編號:KYLX16_0707)研究成果。