陳華予
淺析XML及元數據在資源共建共享中的應用
陳華予
摘 要:隨著我國遠程教育的不斷發展,構建一個與現代遠程教育發展相適應的資源共建共享體系已經成為一個迫切需要解決的重要課題。要有效實現教學資源的共建共享,就要求教學資源和教學資源庫的開發應滿足一定的標準和規范。通過對系統構建教學資源共建共享體系的研究和實踐,可以提出符合標準的資源庫設計方案,并對如何實現資源的共享提出相應的看法及建議。
關鍵詞:遠程教育;資源庫;XML;元數據;共建共享
陳華予/吉林廣播電視大學實驗師(吉林長春130022)。
教學資源是開放教育學員自主學習的重要媒體,也是遠程教育賴以生存和發展的基石之一,如何有效開發和利用教學資源是需要廣大遠程教育工作者進行研究和探索的主要課題。由于教育水平發展的不均衡和每個人教育觀念的不同,教學資源的開發和建設呈現出鮮明的復雜性和多樣性,這給教學資源的管理和利用帶來許多困難。教學資源利用率低、開放性較差、不利于二次開發和低水平重復建設的問題日漸突出,在一定程度上影響了遠程教育的深入發展和與國際網上教育體系相溝通。
現代遠程教育資源建設包括媒體素材庫、題庫、案例庫、課件庫、實體資源庫和網絡課程建設,以及適合多種教學模式的教學支撐系統和現代遠程教育管理系統,這些內容及其它們之間的關系構成現代遠程教育資源體系結構。
媒體素材庫在整個資源中是最基礎的,課件庫中的課件、案例庫中的案例、網絡課程,甚至題庫都可能要使用媒體素材庫中的媒體數據,多個知識點課件或不同教學環節的課件、自測或考試題庫綜合而成網絡課程。因此在本文中,對應用XML和元數據進行媒體素材庫的設計與管理進行探討。
元數據也被稱為是關于數據的數據,是專門用來描述數據的特征和屬性的,它能用來支持電子資源的定位、發現、評估和選擇等。元數據規范提供了一個定義元素的結構,它可以根據元素的使用和表現要求來對資源提供描述和分類,使得尋找和使用資源的過程更有效。
XML是一種可擴展的標記語言,它具有強大的文檔描述功能,并且形式與內容分離。由于XML本身始終以純文本形式存在,獨立于編程語言,使它能創建不依賴于平臺、語言或限制性約定的開放數據,成為了各個領域數據的首選載體。在遠程教育領域,XML已經成為學習對象元數據標準、內容包裝標準的最好載體語言。
遠程教育技術標準委員會參照IEEE的LOM模型制定了《現代遠程教育資源建設技術規范》,提出了教育資源元數據的描述框架。這是一個較為寬泛的標準,進行如下幾方面的規定:一是從資源的技術開發方面,提出一些最低的技術規范要求;二是從便于用戶使用方面,需要對素材標注屬性,并從可操作性的層面規范了屬性的數據類型,這部分參考了IEEE的LOM模型,從制作素材的簡便性、使用素材的方便性角度上選取了部分最為普通的元素;三是從易于管理方面,提出了管理系統以及教學支持平臺所應具備的一些基本功能。[1]
基于上述標準,我們在開發媒體素材庫時,采用核心元素、可選元素、擴展元素對素材庫內的資源進行描述。
編碼是資源素材庫中用于標識和管理素材的標識,除應具有唯一性、可擴展性、穩定性和易識別性等特點外,還應滿足教學資源共建共享的需要;因為資源庫的建設和應用是一個長期的系統工程,在設計和開發時要充分考慮到將來升級、維護和與國內外合作單位進行資源交換和共享。因此,我們在設計素材資源庫的編碼方案時,采用分級分段編碼的形式來定義素材資源的編碼。
編碼的第一級采用國家標準高等學校專業編碼(98版),碼長6位,從而保證素材資源頂層編碼符合國家標準。
編碼的第二級采用全國電大專業規則課程標準編碼,碼長6位,從而保證編碼有良好的擴展性,并能夠實現與教務系統和電大在線教學平臺的銜接。
編碼的第三級為素材自身的自定義編碼,用以標識素材所屬課程的章、節編碼和素材的序碼,碼長10位,這樣有利于依據課程和教材的差異來組織和管理素材。
這樣實現的分級編碼在進行素材管理和檢索時,前兩級編碼由素材資源庫的管理員根據高等學校專業編碼和電大專業規則編碼在資源庫系統中建立好,操作員可根據素材所屬專業和課程分極進行選擇,而不需要了解上級編碼的具體內容,極大地提高了系統的易操作性。
相應的數據表典型結構如下:

字段含義 字段數據類型 說明id Int 系統自動編號,主鍵本級編碼 Char本級中文名稱 Char上級編碼 Char本級編碼級別 Char 具體素材只能在三級編碼層次上………
《現代遠程教育資源建設技術規范》按媒體素材所采用的媒體技術分為五大類:文本類素材、圖形/圖像類素材、音頻類素材、視頻類素材、動畫類素材等五類[2]。對于要加入媒體素材資源庫進行共享和管理的素材,要進行嚴格的審核,不符合規范要求的素材要按要求進行轉換和加工,使其滿足網絡化傳輸的要求。如:視頻類素材轉換成As f、Rm、flv流媒體格式,音頻類素材轉換為wav、mp3格式,動畫類素材使用s wf格式,圖像類素材使用gif、jpg格式,文本類素材可使用doc、pdf等。
《現代遠程教育資源建設技術規范》為上述五類素材中的每一類素材規定了需要標注的屬性。其中既包含可與LOM中的元素相對應的屬性,也包含LOM模型規定以外的關于各類素材特有的技術屬性。
核心元素是教育資源元數據實現互操作的基礎,是教學資源最基本的描述信息,通過這些基本信息可實現對資源的分類管理和檢索。通過參考LOM規范和分析遠程教育素材管理的實際應用,我們選取的核心元素和對應的素材屬性如下表:

LOM的核心元素 資源素材屬性通用/標題 資源素材ID通用/描述 資源素材描述通用/關鍵字 資源素材的關鍵字技術/格式 資源素材的格式類型分類/目的=“課程” 專業(課程)
可選元素和擴展元素是對核心元素的擴展,主要用來標識素材應標注的屬性、技術屬性和管理屬性,通過參考LOM規范和結合遠程教育素材庫的應用,我們設置了其它屬性,主要包括:入庫日期、作者、存放位置、資源類型、資源類型對應的相關技術屬性(可包含多個條目)、加工人、審核人等,有效增強了資源描述和管理的靈活性。
通過分析各類素材的屬性集,找出素材的相同屬性,從而設計出記錄素材共性的數據表和記錄各類素材個性特征的數據表,確保設計的媒體素材資源庫的數據結構適應共建共享的要求。
提高資源檢索和數據交換的效率是實現教學資源共建共享的有效手段,研究教育資源共享,就是要充分利用現有的資源庫,將不同結構的數據統一為基于XML的數據,并在此基礎上表述、傳輸、轉換和查詢。這也是實現網絡上眾多的教育資源元數據標準化方案之一。
由于XML文檔屬于半結構化的數據,它在對結構化的數據(如SQL SERVER數據庫)或半結構化的數據進行轉換時,關鍵是要建立不同層次結構之間的映射關系[3]。我們在進行資源庫管理平臺和應用平臺的開發和設計時,定義了相應的用于數據管理和交換的XML模板,通過在XML文檔中嵌入可執行指令,系統在執行檢索和轉換過程中,通過自動識別和轉換指令,用執行生成的結果替換指令所在位置的內容,從而生成檢索結果或用于交換的XML文檔,這樣就規范了檢索和交換的接口,從而有效提高了資源共享和交換。
教學資源建設是現代遠程教育的基礎,是需要長期建設與維護的系統工程,而教學資源的共建共享研究也是當前遠程教育的熱點問題之一。研究教學資源建設和管理的標準化設計,探索教學資源共建共享的交換方法,有利于提高資源共建共享水平?,F代遠程教育日新月異,但從發展和建設需求的角度來講,標準化和規范性還有待進一步加強,與其它教育單位的數據交換手段還不夠豐富和完善,這也是遠程教育工作者今后研究和探索的一個主要方向。
:
[1][2]教育部現代遠程教育技術標準化委員會[S].現代遠程教育技術規范,2001
[3]李思莉,李娟.XML文檔到關系數據庫的映射策略[J].計算機工程,2010,36(5):40-45
中圖分類號:G250
B
1671-6531(2012)11-0092-02
:郭一鶴