999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字資源共享平臺框架的設計和實現

2007-01-01 00:00:00朱義華郭昭輝武港山
計算機應用研究 2007年5期

摘要:從數字資源共享平臺的需求入手,分析了目前建設數字資源共享平臺面臨的一些問題,提出了一種數字資源共享平臺的框架設計,并基于CNRI Handle System和OAI-PMH給出了該框架的技術實現方案。最后介紹了一個實現實例——中國大學數字博物館共享平臺。

關鍵詞:資源管理;互操作;共享平臺;句柄系統; 開放文獻預研元數據獲取協議

中圖分類號:TP311文獻標志碼:A

文章編號:1001-3695(2007)05-0214-04

0引言

隨著信息載體數字化和網絡化的迅速發展,越來越多的信息資源成為網絡上可以被描述和訪問的資源,從簡單的文本文件到多媒體聲音、圖像資源,甚至網絡服務(Web Service)等都加入了這一行列。為了高效率、高質量地收集、保存、管理這些資源,數字圖書館、數字博物館等一些新的信息資源組織形式應運而生;同時隨著數字化信息資源的快速增長以及各種管理數字化信息資源系統的建設,為了有效地整合并合理配置分散的數字資源,擴大數字資源的覆蓋范圍和服務范圍,數字資源共享平臺的建設已經成為信息資源數字化建設的重要任務。從功能需求上看,數字化資源的定位以及不同系統、不同數據擁有者之間如何實現資源的共享和互操作已成為數字資源共享平臺建設的重要問題。

目前國外在這方面的工作已有一定的基礎,特別是在數字圖書館領域,通過Z39.50、OAI 等協議集成異構資源系統成為構建數字圖書館資源共享平臺的常用方式[1]。國內在數字圖書館領域一般采用簡單導航整合模式(即在Web頁面上提供按字母或主題分類入口的方式),還有一部分采用構建中間層的模式(如江蘇匯文一站式檢索系統和清華同方的異構數據庫統一檢索平臺),避免了需要逐個登錄數據庫、輸入檢索條件的麻煩。一方面這些技術有著不可避免的缺陷(如中間層技術導致檢索效率低下的問題)需要尋找更好的整合模式;另一方面在非數字圖書館領域,各領域系統的建設仍然比較孤立,共享能力還比較低下。

1共享平臺的需求分析

數字資源共享平臺的基本功能是通過不同系統之間數字資源的互操作,實現數據資源整合、信息發布,并對外提供資源檢索服務。具體系統建設時,根據應用需要,數字資源共享平臺還會包括用戶權限控制、資源版權控制等處理機制。數字資源整合是依據一定的需要,對各個相對獨立的數字資源系統中的數據對象、功能結構及其互動關系進行融合、類聚和重組,重新組合為一個新的有機整體,形成一個效能更好、效率更高的新的資源體系[2];信息發布和檢索服務則是在資源整合的基礎上,向用戶展示資源相關信息,讓用戶比較方便地使用數字資源。

從最終用戶的角度出發,共享平臺必須保證系統的透明性,即用戶可以在一個系統上瀏覽整個平臺中的數字資源;用戶只要一次檢索便可以覆蓋平臺中所有的系統;無須知道資源的位置就能夠獲得需要的數字資源等。從平臺內的系統出發,平臺內部的單個系統內部各組件間以及各系統間必須能夠交互,以實現數字資源元數據的互操作以及檢索服務的互操作。為了便于系統間互操作的實現,資源的發布必須滿足一定的發布標準。這樣各系統才能獲得其他系統發布的資源。同時為了在獲得資源后有效地進行整合,那么就需要知道獲得資源元數據的語義,必須制定統一的元數據描述標準。為了避免平臺內部沖突,保證平臺的透明性,方便用戶的使用,數字資源的定位機制以及共享平臺的服務和管理規范也是必需的。

鑒于上面的需求,筆者認為平臺的建設需要分層次、分模塊來實現不同的機制,從而保證平臺內部各系統既能保持其自主性、獨立性,又能實現系統間的互操作性、共享性。下文提出了一種數字資源共享平臺的建設框架,并主要從資源的發布、定位以及平臺必須提供的服務這三個方面分析其技術特色和實現方案。

2共享平臺框架設計

數字資源共享平臺總體框架由存儲層、描述層、組織層和應用層四個層次組成,如圖1所示。

存儲層中存儲的是關于數字資源的多媒體描述信息,比如文本、圖片、視頻、3D模型等。為了便于保存各個媒體類型之間的關系以及其他諸如用戶對某個資源擁有的權限等關系,可以采用關系數據庫來存儲這些信息。描述層是指按照某特定領域制定的元數據描述標準來描述數字資源;確定的元數據格式是組織層中資源發布系統以及互操作的基礎。組織層中,首先必須有資源發布系統以及數字資源定位機制。其中資源發布系統一方面面向瀏覽用戶,便于用戶查看數字資源;另一方面面向共享平臺中的其他系統,便于系統間的互操作。定位機制則是要防止資源命名沖突,同時提供對名稱快速簡單的解析功能。基于此,還應該提供檢索機制以方便用戶對數字資源的查找(檢索機制必須是多系統之間的協同檢索,這樣才能保證應用層的檢索系統能夠為戶提供透明性),同時還可以提供其他機制,如用戶權限控制、資源版權控制等。應用層則通過友好的用戶接口直接面向用戶提供了一些必要的服務,如資源的展示、檢索服務等,應用層通過組織層來隱藏細節,提供透明性。

共享平臺的分層設計以及各層功能的明確,便于研究者根據自身的建設需求運用相關技術快速地實現系統;各個模塊的相互獨立,也便于研究者根據實際需求進行取舍。目前,在上述層次的幾個方面都分別提出了一些相應的解決標準和方案。數據內部格式方面即元數據描述方面現在有一些比較常用的元數據格式、如US MARC格式、都柏林核心數據(Dublin Core)、VAR核心類目(VAR Core Category)、藝術作品著錄類目(Categories for the Description of Works of Art)、REACH著錄單元集合(REACH Element Set)等[3];唯一標志符方面有目前正在使用的用以標志期刊和期刊所包含內容的標準化可變長標志符SICI(SerialItem and Contribution Identifier)、參照SICI而提出的用以標志圖書及圖書具體內容的可變長標志符BICI(Book Item and Contribution Identifier)、用以標志出版和銷售過程中涉及的各種內容單元的PII(Publisher Item Identifier),還有包括了永久性命名和解析服務系統的PURL(Persistent URL)、Handle、DOI(Handle系統在出版行業的應用)等[4];在資源發布方面,為了實現互操作,OAI和OpenURL逐漸被采納成為協議標準[5]。

下面從上述的幾個方面入手,結合每個方面比較成熟和優秀的技術,提出了上述平臺建設框架的技術實現方案。

3共享平臺框架的技術實現方案

上述共享平臺框架中定位機制不僅需要能夠唯一標志對象,更需要持久、可操作地標志對象以滿足不同系統間的互操作,所以筆者選擇采用了CNRI Handle System[8]。數字資源發布方面,筆者采用了能夠適應元數據的復雜性、多樣性及靈活性,對不同資源和不同組織的元數據進行集成并實現互操作的基于開放文獻預研(Open Archives Initiative)的元數據互操作協議(OAI-PMH)[9]。檢索服務方面,筆者通過OAI-PMH中的服務提供者提供了檢索服務,又應用Web Service技術提供檢索服務接口,從而實現了各個系統間的協同檢索。

3.1數字資源的唯一標志和解析系統——Handle System

Handle System最初是由美國CNRI(The Corporation for National Research Initiatives)提出并實現,建立在Internet架構之上的一個分布式的信息系統,用來提供有效的、可擴展的、可靠的進行名稱解析和管理的全球名字服務[6]。

Handle System包括一套開放的協議、名稱空間和協議的參考實現模型。Handle System允許網絡上不同的計算機存儲數字資源的名稱(或Handle),以及將這些Handle 解析成與數字資源相關的信息片斷,以滿足對該數字資源的訪問、定位和使用。這些信息片斷可以被授權用戶根據實際需要修改和維護,用戶在分布環境下管理信息片斷,從而保證名稱可以持久地標志對應的數字資源。

Handle System由解析系統和管理系統兩大部分組成。解析系統把用戶提供的Handle解析成與該Handle 相關的信息,以便用戶定位、訪問和使用數字對象;管理系統則負責提供Handle 的用戶對Handle 的有關信息進行編輯和修改的功能,以維持名字與實際對象之間的關系。

Handle System的名稱空間由兩個部分組成,即命名機構標志符和本地唯一標志符。其名稱服務是GHR(Global Handle Registry,通用名稱登記系統)和LHS(Local Handle Service ,本地名稱服務系統)的兩層結構。GHR提供命名機構標志符的解析服務,目前是單一的服務,由CNRI 管理;它將所有的用戶解析請求分發到具體負責的LHS。LHS 提供它所管理的名稱空間下的唯一標志符的解析服務。圖2是一個名稱為dmcu.nju/9802600040088的Handle解析過程。

在數字化信息資源共享平臺的建設框架中,客戶端可以通過三種方式解析Handle:代理服務器的方式使用Handle System,此時瀏覽器端不需要使用任何額外軟件;直接解析,此時用戶需要安裝瀏覽器的插件;使用CNRI 提供的類庫,此時用戶可以在專業的客戶端中使用解析服務。

3.2數字資源互操作協議——OAI-PMH

開放文獻預研(OAI)框架是在1999年10月一次學術出版聯合組織的會議上提出的。OAI的制定最初是針對學術性電子化預刊本的互操作及檢索,但這與各類型數字化信息資源管理系統建設中所遇到的元數據互操作問題相類似,所以在2000年上半年,OAI使用范圍迅速擴展到這些領域。2001年1月,OAI發布了名為Open Archives Initiative Protocol for Metadata Harvesting(OAI元數據獲取協議)的網絡通信協議,為網絡上元數據的互操作問題提供了一種可行的解決方案[7]。

OAI-PMH提供了一個基于元數據的獨立于具體應用的互操作框架。在此框架中有兩個級別的參與者,即數據提供者(Data Providers)和服務提供者(Service Providers)。數據提供者主要是存儲和管理數字資源,并遵循OAI-PMH協議發布這些資源的元數據,發布的元數據格式可以多樣化,如DC、MARC等,構成資源發布系統;服務提供者(Service Providers)以OAI-PMH為基礎獲取并整合元數據來建立增值服務,主要是檢索服務。

數據提供者擁有信息倉儲(Repository)。倉儲由多個條目(Item)組成,一個條目是對一個具體資源(Resource)的描述,它具有一個唯一的標志符。一個條目可由多種元數據格式描述,每一種元數據描述為一個記錄(Record),但它們均對應同一個標志符。由于每個數據提供方各自擁有自己的元數據,其元數據的格式也不盡相同,OAI規定數據提供方可發布多種格式的元數據,但一定要有一種是以都柏林核心集元數據格式提供元數據。元數據被封裝為XML格式進行通信,即數據提供者提供給服務提供者的是XML元數據記錄。為了提供選擇性獲取,數據提供者還提供以日期為基礎(Data-based)或特定集合為基礎(Set-based)的元數據獲取方式,使用者可以比較精確地描述欲獲取資料的范圍。

服務提供者通過OAI-PMH協議的核心——六個命令動詞(Verb)向數據提供者獲取資源的元數據。這六個動詞分別是:GetRecord,用于從倉儲中獲取一條元數據記錄;Identify,用于獲取有關倉儲的信息;ListIdentifier,僅返回頭部而不是記錄本身;ListMetadataFormats,用于在倉儲中檢索可以獲得的原數據格式;ListRecords,用于從倉儲中獲取記錄;ListSets,用于返回倉儲的集合結構(Set Structure),有利于選擇性獲取。其詳細應用可參照“The Open Archives Initiative Protocol for Metadata Harvesting”[9]。

數據提供者與服務提供者之間通過OAI Request和OAI Response實現消息的傳遞,Request由HTTP的GET/POST方法實現,每個請求包括一個基本的URL地址以及關鍵字、參數;數據提供方在接收到數據獲取請求后,以XML記錄將元數據返回給請求方。其協議工作模式如圖3所示。

目前OAI-PMH已經有相對成熟的實現,在本文基于此框架實現的中國大學數字博物館共享平臺(見http://dmcu.nju.edu/cn)中,采用了OAI-PMH的一個開源實現OCLC的OAI-Cat[10],并作了一部分修改。

3.3檢索服務

在本文提出的這個數字資源共享平臺框架中兩種檢索服務:①OAI服務提供者提供的檢索服務;②獨立于OAI框架,由元數據擁有者通過Web Service接口提供的元數據檢索服務。這兩種檢索相輔相成,能夠滿足不同的需求,其結構如圖4所示。

OAI服務提供者提供的對元數據的檢索服務體現了互操作的價值。服務提供者在本地建立獲取器程序,執行定期定量的元數據獲取任務,有選擇性地收割數據提供者發布的元數據,經過整合映射之后存放在本地,并對外提供檢索服務。同時,數據提供者由于某種原因不一定把所有的數字資源都通過OAI-PMH發布出來,或者僅僅發布資源的部分元數據,即數據服務者無法獲得某些資源的元數據或者僅僅獲得某些資源的部分元數據而不是其詳細的元數據。但數據提供者又希望提供檢索服務告知檢索用戶是否擁護其關心的數字資源,所以此時可以在數據提供者本地提供檢索服務并以Web Service方式提供接口。這樣既能保護元數據,又能讓用戶獲得某些信息。

4實例

2003年7月由教育部科技司主持,18所高等院校承擔的“現代遠程教育網上公共資源建設—大學數字博物館建設工程”項目通過教育部驗收,初步建成了地球科學、生命科學、人文科學、工程技術四類大學數字博物館。各博物館的建設內容以自有館藏實物為基礎,由相應領域的專家審定或撰寫文字材料,并與大學相關專業的教學科研互為補充,其科學性和權威性都很強。大學數字博物館從建成到現在雖然已經取得了一定的社會效益,但由于時間和其他客觀條件的限制,建成的博物館系統還存在一些問題:缺乏統一技術標準規范、共享服務薄弱等。為了進一步實現資源的優化整合,更大地發揮博物館的作用,以及高校學科、人才、資源的綜合優勢,教育部開展了“中國大學數字博物館共享平臺與規范標準”項目,擬在制定相關建設規范與標準的基礎上,進一步實現資源的優化整合,建設一個統一的數字博物館共享平臺,從而實現資源共享,提供綜合信息服務。

基于上述框架,在制定了人文藝術、生命科學、地球科學、科學技術這四個學科領域的數字資源元數據標準的基礎上,加上相關的學術交流與合作提供了快捷、方便的途徑,更加合理、高效地利用了各藏館資源。數字博物館藏品有以下兩個特點:①藏品名稱需要有穩定性,這樣研究人員不必擔心藏品資源屬性的改變,只需要記住藏品的名稱即可;②每個藏品可以有多種展現方式,研究人員可以按照自己的需求獲得某藏品的某種展現方式。鑒于這樣的特點,筆者按照Handle System的標準建立了中國大學數字博物館共享平臺中數字資源的命名系統,開發了DMOI(Digital Museum Object Identifier)服務,并采用代理服務器的方式解析Handle。

Handle協議定義了Handle的構成規則。Handle通常情況下由命名授權(Naming Authority,NA)和本地名字(Local Name)構成。NA實際上是一個名稱空間,保證了不同組織的Handle的唯一性。一個組織有了NA以后,就可以在這個NA下注冊Handle。DMOI的生成采用了與Handle相同的規則。DMOI也是由兩個部分組成,即NA和本地名字。NA可以具有層次結構,筆者在DMOI系統中規定所有分館的NA都在dmcu命名授權下,如南京大學數字博物館的NA是dmcu.nju,復旦大學數字博物館的NA是dmcu.fudan等;本地名字則采用原系統中的藏品ID,這樣就得到了每個藏品唯一的標志符。當然此平臺還沒有在GHR注冊筆者使用的NA,DMOI系統目前只是本共享平臺內相互協作的一個系統,與外界并沒有關聯。

筆者基于Handle System構建了DMOI服務解決藏品的命名、解析定位問題,同時基于OAI-PMH實現了各個館之間的用戶權限控制和資源的版權保護機制。以及其他的諸如面向藏品的自動回答系統、藏品3D數據獲取動態展示、虛擬現實等機制。筆者實現了中國大學數字博物館共享平臺(http://dmcu.nju.edu/cn)。

數字博物館為很多學科的研究人員提供了豐富且可靠的科研資料,共享平臺的建設更為互操作問題。

OAI協議本身已經有不少的實現。本系統在實現中采用了開源的OAICat[10]包。由于OAICat僅僅支持從一張數據表中獲得不同的元數據格式,而不支持從不同的數據表中獲得不同的元數據格式。筆者在該軟件包的基礎上進行擴展,實現了從多張數據表中獲得不同元數據格式的功能,并將其應用到本平臺中。

中國大學數字博物館共享平臺中存在著兩個不同的角色,即分館和地區中心。各個分館發布的數據遵循核心元數據格式(指定為Dublin Core)和擴展元數據格式。擴展元數據格式滿足該藏品所屬類別(人文藝術、生命科學、地球科學、科學技術)的領域元數據標準。分館和地區中心都是支持了OAI-PMH接口的數據提供者和服務提供者。其中分館服務基于本館數據提供,而地區中心服務基于的數據來自所有分管數據提供者提供的數據。

基于這樣的共享平臺框架,筆者滿足了大學數字博物館共享平臺基本服務建設的要求并達到預期的目標,實現了相關資源的共享,提供了相應的服務。

5結束語

基于筆者提出的這樣一個構建數字資源共享平臺框架可以較容易地構建數字資源共享平臺的應用,既滿足了各個系統的共享與互操作,又建立了一種地址解析系統,將服務門戶和數字資源提供者無縫連接起來。當然同時還有一些問題有待完善。比如:①建立元數據提供者的目錄,實現數據提供者基地址注冊和更新維護的機制,即由于數據提供者的數量較多,并且基地址有變化的情況下,手工維護就不能保證元數據的正常更新,需要建立一種數據提供者基地址注冊和更新維護的機制;②低成本的系統轉換支持,即作為元數據的擁有者,如果為元數據的發布而單獨建立數據發布系統,將增加其系統運行的成本,對數據維護和更新是不利的,需要為內容擁有者提供內容管理與發布為一體的元數據發布模塊,使其很容易嵌入到內容發布系統中去,以便降低系統轉換的成本。

參考文獻:

[1]MARTHA L,BROGAN A. Survey of digital library aggregation ser-vices[M]. Washington, D. C.:Digital Library Federation, 2003.

[2]馬文峰. 數字資源整合研究[J]. 中國圖書館學報,2002,28(4):64-67.

[3]肖瓏. 元數據格式在數字圖書館中的應用[J]. 大學圖書館學報,1999,17(4):23-25.

[4]張曉林. 數字對象的唯一標識符技術[J]. 現代圖書情報技術,2001(3):8-11,14.

[5]林綺屏. 數字資源互操作協議OAI與OpenURL之比較研究[J]. 情報雜志,2004,23(7):12-13,16.

[6]毛軍. 我國數字圖書館標準規范建設:數字資源唯一標識符的現狀與發展[EB/OL].(2004-05).http://cdls.nstl.gov.cn.

[7]牛振東,朱先忠.我國數字圖書館標準規范建設:OAI-PMH協議應用指南[EB/OL].(2004-05).http://cdls.nstl.gov.cn.

[8]CNRI[EB/OL].http://www.cnri.reston.va.us/.

[9]OAI-PMH[EB/OL].http://www.openarchives.org/.

[10]OAICat[EB/OL].http:www.oclc.org/research/software/oai/cat.htm.

注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”

主站蜘蛛池模板: 国产区成人精品视频| 波多野结衣一级毛片| 青青青视频91在线 | 国产jizz| 免费AV在线播放观看18禁强制| 白丝美女办公室高潮喷水视频| 国产在线观看成人91| 亚洲国产精品VA在线看黑人| 亚洲无码电影| 久久国产精品电影| 亚洲欧美自拍中文| 久久精品中文字幕免费| 中文字幕中文字字幕码一二区| 伊人久久综在合线亚洲91| 日韩精品中文字幕一区三区| 2022精品国偷自产免费观看| 久久国产乱子伦视频无卡顿| 国产精品网址你懂的| 国产精品人莉莉成在线播放| 久久久国产精品无码专区| 免费无码又爽又刺激高| 免费国产高清精品一区在线| 不卡无码h在线观看| 国产综合无码一区二区色蜜蜜| 亚洲三级影院| 五月天久久综合国产一区二区| 少妇精品网站| 精品亚洲麻豆1区2区3区| 亚洲日本韩在线观看| 国产主播在线一区| 福利小视频在线播放| a级毛片在线免费观看| 国产日韩av在线播放| 亚洲欧美一区二区三区蜜芽| 国产精品夜夜嗨视频免费视频| 国产视频一二三区| 5555国产在线观看| 97久久精品人人| 亚洲制服丝袜第一页| 中文字幕无码制服中字| 亚洲va在线∨a天堂va欧美va| 亚洲国产日韩一区| 亚洲天堂在线免费| 精品国产电影久久九九| 亚洲无限乱码| 亚洲美女AV免费一区| 国产高清色视频免费看的网址| 国产精品福利社| 国产麻豆永久视频| 欧美一级高清免费a| 精品国产福利在线| 国产www网站| 久久青草免费91线频观看不卡| 国产欧美精品一区二区| 九色国产在线| 国内精品伊人久久久久7777人| 啊嗯不日本网站| 欧美中文字幕在线播放| 97国产成人无码精品久久久| 色哟哟精品无码网站在线播放视频| 香蕉久久永久视频| 免费国产一级 片内射老| 亚洲天堂首页| 色成人亚洲| 国产丝袜啪啪| 国产女同自拍视频| 在线观看无码av五月花| 亚洲国产中文欧美在线人成大黄瓜| 欧美日本在线| 国产熟女一级毛片| 亚欧成人无码AV在线播放| 中文字幕亚洲电影| 精品久久久久无码| 国产香蕉一区二区在线网站| 制服丝袜 91视频| 999精品视频在线| 99久久精品免费看国产电影| 亚洲女同一区二区| 亚洲无码免费黄色网址| 999国内精品视频免费| 亚洲国产成人综合精品2020 | 超碰aⅴ人人做人人爽欧美|