999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XML的元數據相關應用研究

2009-04-29 00:00:00羅述軍
電腦知識與技術 2009年15期

摘要:元數據作為一種編碼體系,在數據管理中占據著重要的地位。本文從元數據的概念、相關格式、攜帶工具(RDF),以及XML的相關概念入手,探討了元數據的資源描述框架(RDF)及其在數字圖書館和數字博物館中的應用。

關鍵詞:XML;元數據;RDF

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2009)15-3849-03

Base on Metadata Relevant Application Study of XML

LUO Shu-jun

(Lianyuan No.1 middle school,Lianyuan 417100,China)

Abstract: Meta-data as a coding system, data management occupies an important position. In this paper, the concept of meta-data, relevant format, portable tools (RDF), as well as the relevance of the concept of XML, meta-data of the Resource Description Framework (RDF) and its application in digital library and digital museum applications.

Key words: XML; Metadata; RDF

1 引言

互聯網上的電子資源與日俱增,無限膨脹,怎樣讓用戶迅速有效地查找到所需信息,這是目前還沒有很好解決的問題。尤其是在網格技術方興未艾的今天,如何更好的定義和組織數據就是計算機從業人員亟需解決的問題。當今數字圖書館和數字博物館的建設已成為全球信息化過程中不可或缺的重要組成部分。本文首先介紹了XML和元數據等相關技術研究,并從數字圖書館和數字博物館的建設中對元數據的應用做一些探討。

2 元數據

元數據[1],首先是一種編碼體系,特別是指根據某種標準來對文獻中的詞及其他元素進行編碼,從而揭示描述文獻的這些基本元素,元數據提供了一種框架體系和方法來描述,表示數字化信息的基本特征,并通過一整套公用的編碼框架體系管理、交流、傳播和組織數字化信息。元數據用來描述數字化信息資源,特別是網絡信息資源的編碼體系,這導致了元數據和傳統的基于印刷型文獻的編目體系的根本區別,數字化信息具有傳統印刷型信息所不具備的基本特征和屬性,是機讀型信息必須借助計算機及其網絡讀寫和傳播,是分布式的這些信息可能并不存儲在同一個地方,而可能分布在不同的數據服務器上,具有嚴格的格式化特征,元數據不僅要描述數字化信息的內容特征,而且更要描述數字化信息的這些基本屬性,使得數字化信息得以被有效傳播、交流和利用。元數據的最為重要的特征和功能是為數字化信息資源建立一種機器可理解框架,元數據主要是為了幫助計算機系統獲得并理解數字化信息的基本特征,包括系統特征,內容特征,權利特征諸方面,所謂計算機理解就是指利用元數據體系,使得計算機系統可以自動辨析、分解、提取和分析歸納數字化信息資源的基本特征。根據以上討論,我們可以這樣來界定元數據。元數據是一種用來描述數字化信息資源,特別是網絡信息資源的基本特征及其相互關系,從而確保這些數字化信息資源能夠被計算機及其網絡系統自動辨析、分解、提取和分析歸納,即所謂機器可理解性的一整套編碼體系。

3 XML

XML為可擴展標記語言(Extension Markup Language),它是國際互聯網聯盟(W3c)開發的用于網絡環境下網頁設計和數據交換、管理的新技術,并已成為推薦標準,具有很好的應用和發展前景。XML作為一種標記語言,它描述稱為XML文檔的一類數據對象,并部分描述處理這類數據的計算機程序。它適用于多種領域各種電子資源(如全文、多媒體)的處理,并且得到了業界的支持和響應,極具成為信息時代數據交換標準的潛力。XML的用途主要有兩個,一是作為元標記語言,定義各種實例標記語言標準:二是作為標準交換語言,擔負起描述變換數據的作用。文檔類型定義(Document Type Definition,DTD)是一套關于標記符號的語法規則,它定義了文件的整體結構和語法,使用XML進行數據交換的行業或組織可以定義他們自己的DID。

4 基于XML的元數據互操作性問題

由于不同的領域(甚至同一領域)往往存在多個元數據格式,當在用不同元數據格式描述的資源體系之間進行檢索、資源描述和資源利用時,就存在元數據的互操作性問題(Interoperability):多個不同元數據格式的釋讀、轉換和由多個元數據格式描述的數字化信息資源體系之間的透明檢索。

解決元數據互操作性的方法是建立一個標準的資源描述框架(RDF)[2],用這個框架來描述所有元數據格式,那么只要一個系統能夠解析這個標準描述框架,就能解讀相應的Metadata格式. XML通過其標準的DTD定義方式,允許所有能夠解讀XML語句的系統辨識用XML_DTD定義的Metadata格式,從而解決對不同格式的釋讀問題。RDF定義了由Resources、Properties和Statements等三種對象組成的基本模型,其中Resources和Properties關系類似于E-R模型,而Statements則對該關系進行具體描述。RDF通過這個抽象的數據模型為定義和使用元數據建立一個框架,元數據元素可看成其描述的資源的屬性。進一步地,RDF定義了標準Schema,規定了聲明資源類型、聲明相關屬性及其語義的機制,以及定義屬性與其它資源間關系的方法。

5 元數據的重要應用

元數據是非常重要的,因為它不但可以描述數據是什么,而且可以減少數據集的大小。 通過建立元數據,你可以在所有部門內統一數據的命名、定義、編目和操作標準。這依次為彼此間理解、合作和共享資源起到了非常巨大的作用。比如:在GIS系統中,利用元數據,可以使空間數據的訪問和管理變得更容易。元數據提供了對要素以及屬性項一級的元數據管理。這樣,數據更新可以更簡單并且結合進日常的數據使用中。元數據并不是終極,它是一個大大提升應用空間數據的工具。因此,在GIS中元數據能起到很大的作用。 數據倉庫中的元數據服務,對數據倉庫的構造、管理和維護,使各個不同來源的數據可以被集成到一個單一的數據倉庫應用系統之中,軟件人員可以創建出包含各種工具優點的數據倉庫解決方案。從元數據的上述應用不難看出元數據在數字化信息管理中的作用。

5.1 元數據在數字圖書館中的應用

傳統圖書館流程中是將圖書、期刊等紙介質的資料按照一定的格式進行編目,這樣就將散亂的資料組織成有序的集合,便于用戶的查找。數字圖書館[3]中的數字化資料同樣需要標引和著錄,元數據的出現就是為了滿足這種需要。目前網上數字資源比較常用的元數據格式為:MARC格式[4],都柏林核心元數據集(Doubin Core) [5],VRA核心類目(VRA Core Category),藝術作品著錄類目(Categories for the Description of Works of Art),REACH著錄單元集合(REACHelement)等。

5.1.1MARC--數字化資源編目

MARC是用于描述、存儲、交換、控制和檢索機讀書目數據的標準。它起源于20世紀60年代。主要針對印刷型文獻的描述,也適用于縮微、照片、視聽資料的描述。MARC的數據結構嚴密,其著錄格式遵循國際標準,有嚴格的語義規則和完整的信息描述手段,能夠精確完整地記錄文獻資源;在檢索點選擇原則上能夠確保數據元素組成的統一性,有利于數據交換。因此,MARC是一種描述能力很強的元數據格式。為了適應電子文獻的數據著錄和檢索的需要,1992年,美國國會圖書館、美國圖書館協會和0CLC的專家提出了增加MARC的“電子定位與存取”字段——856字段,并于1993年1月由“書目信息和機讀格式委員會”通過,成為記錄電子信息資源的重要字段。運用MARC著錄數字資源的問題解決后,以美國為代表的世界各國相繼圍繞MARC在數字信息整理與應用方面開展了一系列研究,并取得相當成效。0CLC據此相繼推出了因特網信息資源編目的項目InterCAT,建立通過因特網可存取資料的目錄(Building a Catalog of Internet-Accessible Meterials),聯機資源合作目錄(CORC)等研究項目。目前已建立了擁有近百萬條記錄的數字化資源書目記錄數據庫。

5.1.2 都柏林核心元數據集

都柏林核心元數據集是1995年3月由美國0CLC與NCSA(國家超級計算機應用中心)聯合發起,52位來自圖書館界和電腦網絡界的專家共同研究產生的一套描述網絡電子文獻的方法,以實現網上信息的辨識、查詢和檢索。這一方法的核心是如何用一個簡單標準化的元數據記錄來描述種類繁多的電子信息,使非圖書館專業人員也能夠了解和使用這種內容描述方法,達到更有效的描述和檢索網上資源。由于這次研討會是在俄亥俄州哥倫布市的都柏林鎮舉行,所以會議推出的“核心元數據集”被稱為“都柏林核心元數據集”(Dublin Core E1ements)。

都柏林核心元數據集由15個基本元素組成,分為三大部分:一、內容描述部分:題名、主題、說明、來源、語種、關聯和覆蓋范圍;二、知識產權部分:創建者、出版者、其它責任者和權限;三、外形描述部分:日期、類型、形式和標識符。

相比復雜的MARC格式,DC只有15個基本元素,較為簡單。而且根據其可選擇原則,可以簡化著錄項目。對于需要詳細著錄的資料,DC引進了修飾詞(Lang)、架構詞(Scheme)和子元素修飾詞(Subelement),以進一步明確元數據的特性。特別是通過架構修飾詞,把MARC/AACR的優點和各種已有的分類法、主題詞表等吸收進來,極大地豐富和增強了DC的描述性和權威性。同時還允許各應用都柏林核心元素數據的不同國家和地區根據各自的實際,在15個元素的基礎上,按規定的互操作性原則增加新的元素或新的修飾詞。由于其在數字資源整理中的優越性,目前DC被翻譯成近30種語言,其用戶遍及世界各地。

從上面的分析可以看出,數字圖書館的元數據體系就是數字化圖書館中所有信息的描述方法,即各種元數據結構及其實現模塊的總和,是數字圖書館的基礎結構。元數據體系構建了數字圖書館的邏輯框架和基本模式,它決定了數字圖書館的基本功能、運用模式和系統運行的總體性能。數字圖書館的運作,無論是存取過程和檢索過程,都是以元數據為基礎實現的。

5.2 元數據在數字博物館中的應用

博物館是各種各樣的人了解大自然及其文化的地方,由于技術進步,呈現為能夠具有教育與娛樂功能的集合體。它還是歷史、科學、工藝美術以及諸如航空、航天等技術重要的研究中心。傳統觀念下,提到博物館人們立刻聯想到的是處于某個地方的館舍、各種實物的按某種規則的陳列及其介紹等。隨著計算機的普及、網絡通信速度的提高、數據庫及其管理技術水平的提高、多媒體信息技術的迅速發展,博物館正在發生著巨大變化,出現了“電子博物館”、“虛擬博物館”、“數字博物館”的概念。

數字博物館系統的核心是藏品信息,數字博物館的一切功能都是圍繞著藏品信息的收集、組織和利用而展開的。各類博物館、紀念館、文物保護單位因其性質和類型的不同,各館的藏品分類、標引規則、組織結構和管理方法自成體系,由于博物館藏品編目及管理缺乏統一標準,制定規范時要參照有關國家統一標準和國家文物局頒布的《博物館藏品信息指標體系規范》,力求藏品編碼全面、完整、規范,能從多方面對面品進行準確的、深層次的描述,并提供聲音、圖像、視頻等多媒體數據的描述。制定的系統元數據方案應具有可擴展性,能夠方便地增加新的元數據內容,還要能實現不同系統間的數據交互。以下是以文物數字博物館為例編寫的一個dtd。

<?xml version=\"1.0\" encoding=\"GB2312\"?>

<!DOCTYPE simplemode[

<!ELEMENT CulturalRelic (title, dynasty?, material?, acqusitionPlace?, function*, shape, acqusitionMethod?, primitiveCode?, owner*, keyword*, source?, relation?, language? identifier?, description?)>

<!ELEMENT title(#PCDATA)>

<!ELEMENT dynasty(#PCDATA)>

<!ELEMENT material(#PCDATA)>

<!ELEMENT acqusitionPlace(#PCDATA)>

<!ELEMENT function (#PCDATA)>

<!ELEMENT shape(#PCDATA)>

<!ELEMENT acqusitionMethod(#PCDATA)>

<!ELEMENT primitiveCode(#PCDATA)>

<!ELEMENT owner(#PCDATA)>

<!ELEMENT keyword(#PCDATA)>

<!ELEMENT source(#PCDATA)>

<!ELEMENT relation(#PCDATA)>

<!ELEMENT language(#PCDATA)>

<!ELEMENT identifier(#PCDATA)>

<!ELEMENT description(#PCDATA)>]>

6 結論與展望

元數據在資源發現方面是一個非常重要的工具,他們允許數字對象的不同版本,不同格式的文獻處理,元數據不僅能描述這些版本,而且允許對象之間的聯系與連接,在數字圖書館與數字博務館中更具應用價值,所以在以后的工作中要注意跟蹤元數據發展、積極參與制定元數據標準、加快元數據應用,并加快研究有效利用元數據進行檢索(包括異構系統透明檢索)、相關性學習、個性化處理等機制,加快研究元數據與數字對象和數字化資源體系有機整合的途徑與方法,推進研究利用元數據進行基于知識的數據組織和知識發現,以期更好的利用元數據為我們服務。

參考文獻:

[1] 張靖.基于XML/RDF的MARC元數據描述研究[J].微計算機信息,2007,12(36):3-5.

[2] 林麗.XML在圖書館中的應用研究[J].科技信息,2008,4(16):284-294.

[3] 鄭建標.一種基于XML和元數據的工具框架研究[J].微計算機信息,2007,3(9).

[4] 胡敏.網絡信息資源的MARC格式編目[J],情報雜志,2005,11(11):82-84.

[5] 都柏林核心元數據元素集1.1版.http://dc.library.sh.cn/1-1.htm,2009-4-15.

主站蜘蛛池模板: 久久黄色小视频| 国产欧美中文字幕| 欧美成人影院亚洲综合图| 亚洲综合激情另类专区| 2022国产91精品久久久久久| 亚洲精品无码不卡在线播放| 久久青草精品一区二区三区| 夜夜爽免费视频| 欧美精品啪啪| 国产无遮挡裸体免费视频| 亚洲综合18p| 欧美色综合久久| 日韩精品成人网页视频在线| 97视频免费在线观看| 亚洲男人天堂久久| 亚洲精品天堂在线观看| 狠狠五月天中文字幕| 九九九久久国产精品| 国产成人av一区二区三区| 亚洲av片在线免费观看| 全色黄大色大片免费久久老太| 亚洲精选无码久久久| 国产a在视频线精品视频下载| 国产在线视频二区| www精品久久| 亚洲黄色激情网站| 一级看片免费视频| 欧美一区二区三区不卡免费| a网站在线观看| 美女扒开下面流白浆在线试听 | 国产中文一区二区苍井空| 国产免费a级片| 色窝窝免费一区二区三区 | 国产精品精品视频| 91av国产在线| 新SSS无码手机在线观看| 色噜噜综合网| 亚洲成a人片7777| 麻豆精品在线视频| 91精品啪在线观看国产60岁| 在线看片免费人成视久网下载| 中文字幕亚洲另类天堂| 欧美成人区| 狠狠操夜夜爽| 亚洲an第二区国产精品| 欧美精品v欧洲精品| 亚洲无码37.| 国产麻豆福利av在线播放| 亚洲美女一区二区三区| 国产玖玖视频| 久久一日本道色综合久久| 欧美亚洲日韩中文| 人人妻人人澡人人爽欧美一区 | 国产欧美精品专区一区二区| 欧美区在线播放| 伊人中文网| 欧美自慰一级看片免费| 成人国产三级在线播放| 免费无码AV片在线观看国产| 在线精品视频成人网| 欧美日韩第二页| 手机成人午夜在线视频| 亚洲国产精品久久久久秋霞影院| 99在线视频免费观看| 欧美午夜视频在线| 亚洲国产中文精品va在线播放| 久久精品人人做人人爽97| 欧洲在线免费视频| 国产精品19p| 91小视频在线播放| 看国产一级毛片| 亚洲精品日产精品乱码不卡| 婷婷亚洲天堂| 国产美女精品一区二区| 亚洲一区二区约美女探花| 亚洲一区二区三区香蕉| 久久婷婷六月| 日本午夜精品一本在线观看 | 国产毛片高清一级国语| 成年人国产网站| 国产亚洲精品资源在线26u| 欧美日韩精品一区二区在线线|