999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

支持元數據和服務共享的三類互操作協議比較*

2017-01-24 10:56:38包海峰徐濼燚
檔案與建設 2016年12期
關鍵詞:服務信息

彭 楨 包海峰 徐濼燚

(南京大學檔案館,江蘇南京,210046)

支持元數據和服務共享的三類互操作協議比較*

彭 楨 包海峰 徐濼燚

(南京大學檔案館,江蘇南京,210046)

在信息技術進步的浪潮中,出現了各類廣泛分布、異構、自治的檢索系統和發布系統。隨著用戶數量和所要求的服務質量的提升,對使用統一檢索接口而覆蓋諸多信息發布系統的呼聲日益高漲,互操作協議在此種背景下應運而生。根據作用機制的不同,互操作協議可以分為聯邦、元數據收割、信息搜集三種類型。文章從互操作系統的實現到效果,包括聯合服務能力、存儲和維護開銷、數據安全性和保密性幾個方面,結合實際案例對互操作協議的實施和變更進行比較和評估,從而明確各類協議的優缺點及適用性,依據“適度代價獲取充分功能”的原則,為廣大服務提供商和用戶提供參考。

互操作協議 元數據標準 數字檔案館 OAIster歐洲數字圖書館PERSIVAL

1 互操作協議及其應用

不同的領域中,“互操作性”(Interoperability)有著不同的定義。美國電氣和電子工程師協會(Institute of Electrical and Electronics Engineers,US IEEE)將其定義為“兩個或多個系統相互使用已被交換的信息的能力”。而在歐洲面向公眾管理部門、企業及市民互操作性 電 子 服務 項 目(IDABC,Interoperable Delivery of European eGovernment Services to Public Administrations,Businesses and Citizens)中,互操作性是指信息和通信技術(Information and Communication Technology,ICT)系統的能力,以及系統對于所支持的業務流程中不同實體間交換數據,共享信息和知識的能力。就其本質而言,互操作性是在異質實體(包括異種體系結構、異種操作系統、異種網絡和異種語言等)中獲得資源透明調用的能力。延伸至數字檔案館領域,互操作性表現為在滿足檔案的保密性、安全性需求的基礎上,實現數字檔案館間交換檔案元數據、查詢數字檔案和提供增值服務的能力。它要求技術(軟件體系結構和通信協議等)、內容(元數據及其語義等)和組織(數字檔案館性質所要求的認證和訪問原則等)三方面的合作。

根據作用機制的不同,互操作協議可以分為以下三種類型:

1.1 元數據收割(Harvesting)

各系統之間建立松散聯盟,從而實現一些基本功能的共享。在應用層面上,采用一致的公共互操作協議從各自館藏中收割出元數據使其可以被服務提供方獲取,并用來提供諸如數據挖掘及參考鏈接等增值服務。著名的OAI-PMH協議即屬于此種類型,采用該協議及其變種的項目有NDLTD、OAIster及CALIS等,相關軟件有Greenstone、ARC等。

1.2 聯邦(Federated)

各系統之間建立緊密聯盟,并采用統一的通信協議或軟件系統。這是最早出現的解決不同數字檔案館間互操作需求的模式。服務器負責更新和處理查詢,客戶端則與最終用戶連接,負責從中獲取查詢,發送至各個服務器,而后接收查詢結果并將其整合,或者利用中間層,由中間層與各個服務器相聯系,客戶端只需要與中間層聯系。屬于這種模式的互操作協議有Z39.50、SRW/SRU等。采用這類模式實施的項目有NCSTRL、PERSIVAL及MOBIUS等,相關的軟件有INNOPAC、YAZ等。

1.3 信息搜集(Gathering)

各系統利用各自公開訪問途徑搜集信息,通過一定的互操作手段進行整合,整合手段因實際情況各異。通常情況下,此種互操作模式會降低檢索成果的查準率和查全率,低于直接通過查詢各成員館得到的結果。由于這項短板,該模式常見于商業引擎中。以谷歌學術為例,目前谷歌學術能作為字段進行差別檢索的只有三個,分別為作者、出版物和出版時間,遠低于專業的學術檢索系統。

2 比較互操作協議的意義

在檔案界,互操作協議被廣泛使用,已涌現出一大批有參考價值的案例,如英國的檔案利用項目(A2A,Acess to Archives)、澳大利亞的澳大利亞科學家歷史資源集(Bright Sparcs,Scientist Present in Australia's History Resource Collection Strategy)、蘇州工業園區檔案館項目,以及接下來本文詳細介紹的OAIster、歐洲知識門戶和PERSIVAL。William Arms根據互操作協議所提供的功能和實施代價這兩個主要指標,給出了一種評價數字圖書館互操作的“功能—代價”曲線模型,而俞力則根據信息系統互操作的LISI評價模型對各項互操作策略進行了評估。本文在前人研究的基礎上,對檔案界的互操作系統,從實現到效果,包括聯合服務和用戶體驗、存儲和維護開銷、數據安全性和保密性幾個方面,結合實際案例對互操作協議的實施和變更進行比較和評估,從而明確各類協議的優缺點及適用性,依據“適度代價獲取充分功能”的原則,為廣大服務提供商和用戶提供參考。

3 協議及代表項目簡介

3.1 OAI及OAIster

OAI-PMH協議是OAI協議的一 部 分 。 OAI(Open Archives Initiative,開放文檔先導元數據收割協議)是一項簡單、靈活的元數據互操作協議,其目標是通過元數據收割模式實現在Web上發布信息的不同組織之間的互操作,形成一個與應用無關的互操作框架,同時支持選擇性收割以完成系統間元數據的循環交換。

OAIster是密歇根大學2002年發起的聯合目錄項目,其整合對象為從開放存取數字資源集合所獲取的數字資源。該項目以OAIPMH協議為藍本,截止至2014年12月17日,覆蓋了超過1500個成員館 。2009年 OCLC(Online Computer Library Center,聯機計算機圖書館中心)參與到這個項目的建設和維護中,目標是將OAIster建設成一個所有開放存取數字資源庫的自助服務貢獻模型,以確保其對豐富開放資源的存取能力具有可持續性。它目前是全球最大的開放檔案資料數據庫。

3.2 SRW/U及歐洲圖書館

SRW/U (the Search and RetrieveWeb Service/theSearch and Retrieve via URL)則是為了解決Z39.50基于OSI模型建立而無法直接與WEB連接及Z39.50協議過于復雜等問題而提出的Z39.50 ZING協議的一個組成部分。該協議的目標是在通用的框架結構下實現對各種網絡資源的整合。

SRW/U由美國國會圖書館(LC,the Library of Congress)負責維護管理,2004年2月發布了SRU 1.1版本,目前已更新至2.0版本,是OASIS (Organization for the Advancement of Structured Information Standards,結構化信息標準促進組織)認可的標準之一。根據通信協議不同,SRW/U分為按參數傳遞的形式分為兩類:基于SOAP協議的SRW與基于HTTP協議的SRU。

LC、OCLC、牛津大學等信息服務機構均發布了自己的SRU服務接口平臺。歐洲圖書館:歐洲知識的門戶(The European Library: Gateway to Europe's Knowledge)項目由芬蘭、德國等多個國家參與,涉及不同的語種,而這些圖書館在本地查詢中多數都利用了Z39.50,因此項目采用了SRU和CQL來實現互操作。

3.3 SDARTS及PERSIVAL計劃

STARTS/SDLIP/SDARTS協議是由美國斯坦福大學、哥倫比亞大學等機構完成的一組搜索協議,各個協議功能如下:STARTS協議定義對數據源的查詢請求、查詢格式以及數據源提供的關于回復內容和格式;SDLIP協議定義兩種信息資源之間的互操作行為,以及不同公共接口類型與相應的中間件LSP;SDARTS協議為針對常見數據集類型的封裝器參考執行程序工具包。

PERSIVAL(Personalized Retrieval and Summarization of Image, Video,and Language Resources,個人圖像視頻及語言資源檢索及概要計劃)是由哥倫比亞大學計算機系發起的項目,旨在為分散的醫療檔案提供統一的檢索入口。

4 三種類型協議比較

Rong Shi在 設 計 LFDL(Lightweight Federated Digital Library,輕量級聯合數字圖書館)互操作實現機制時,提出了優秀的互操作協議應該滿足不需要改變原有數據體系結構、聯合服務能力強、維護簡單、安全性高等要求。本文根據檔案的特點及檔案管理的長期保存、定密分級的需求,覆蓋互操作協議的實現及效果的整個運作周期,將比較的標準歸結為三個方面,分別是聯合服務能力、存儲和維護開銷、數據安全性和保密性。

4.1 聯合服務能力

聯合服務能力,即整合檢索結果并在此基礎上提供服務的能力。聯合服務要求準確而且全面地整合數據以提供優化的檢索,同時也要求在此基礎上發展出更多樣完備的增值服務。

表1 三個典型案例的檢索服務及個性化設置

OAI-PMH協議的優勢在于,每一個信息資源條目都有全球獨一無二的OAI ID,理論上所有的OAI資源庫可以整合到一起。但這也帶來了問題,通用性要求數據提供方所提供的數據必須是DC標準,而DC標準的針對性較弱,對部分存在特殊專業要求信息資源的揭示不夠深入、全面。該協議以元數據收割實現互操作,只有在服務提供者第一次為數據提供者收割時,會完整地收割整個資源庫的歷史數據,之后為定期收割新增或變動數據,導致收割到的數據和數據提供方的實時數據存在著時間差,因此這種實現方式能提供的檢索服務并不是完全同步的。且該協議規定的數據提供方只向服務提供方提供元數據資源,無法為增值服務提供支持。

相應的,SRW/U可以根據需要使用任何元數據格式,預設的元數據標準有DC、Onix、MODS等。處于同一聯邦內的數字檔案館必須采用同一種元數據格式。除元數據外,也能共享其他增值服務類型。歐洲數字圖書館中,還包括其他機構提供的開放關聯數據,不僅包括傳統的書目記錄,還有用戶標簽與評論、社會網絡活動及用戶照片與視頻等。以檢索“Renaissance”為例,反饋的結果不但有與之相關的信息資源條目,還有對于這些條目按照時間、國家、格式等的分布統計及相關鏈接,支持進一步檢索。

SDARTS協議并不支持某一種現有的元數據標準,而是在STARTS中規定了必須和可供選擇的元數據屬性。必須提供的元數據屬性有數據源支持的字段(Fields Supported)、支持的修飾語(Modifiers Supported)、分值分布區間(Score Range)、排序算法ID(Ranking-algorithm Id)、樣本檢索結 果 地 址(Sample Data Base Results)、數據源鏈接(Linkage)等。

SRW/U和SDARTS協議都是分布式檢索模式,分布式數據庫能夠在各自的存儲位置上得到及時和專業的維護、更新,用戶可即時查詢最新數據。表1為三種案例個性化設置及檢索功能的簡要對比。

4.2 存儲及維護開銷

在數字檔案館領域,周麗霞將檔案元數據概念分為檔案信息內容元數據、檔案對象元數據、資源集合元數據、管理與服務機制元數據、管理過程與系統元數據、檔案元數據這六個層次。檔案自其產日起,其第一及第二層元數據相對穩定、保持不變。第三及第四層元數據則會根據檔案的組織、管理情況產生變化,變化產生的時間沒有規律性,需要及時維護和更新。下文將從存儲維護和處理查詢兩個方面進行論述。

OAI-PMH協議要求將元數據收割到服務提供方進行集中式目錄存儲,因此服務提供方必須及時對這部分數據進行再組織和更新。在更新過程中,數據提供方需要保證所提供元數據的質量以及運行的穩定性。按照更新條件的不同,具體的收割機制可以分為歷史數據收割、新增或變動數據收割兩類。收割協議通過收割規范化、結構化的元數據,得到完備且精確的結果集。綜上所述,OAI-PMH協議將計算、存儲的開銷根據數據提供方和服務提供方的不同角色進行分配。因此可以根據相應的硬件條件和數據要求作出調整策略。檢索方面,查詢壓力主要由服務提供方承擔,并且隨著記錄的增多,開銷會不斷增長。

SRW/U使用模塊化的整合方式,即將信息檢索視為各個不同模塊檢索服務的集合。以歐洲數字圖書館為例,服務器響應檢索要求的具體過程為:將用戶提交的請求中所包含的URL參數轉換為封裝的SOAP包,再由后臺的各個檢索模塊接收SOAP包后提交查詢請求,獲取初步檢索結果;隨后確認用戶的身份權限,根據用戶個人信息、上下文信息以及用戶請求資源情況,將初步檢索結果生成統一的XML文檔提供給應用層。在整個過程中,查詢經由網站統一入口被分散到各個單獨的檢索系統中,再進行綜合,不產生額外的存儲開銷,查詢壓力由各個組成部分共同承擔。

PERSIVAL項目中,利用了自然語言處理(NLP,Natural Language Processing)的研究成果。在身份及背景數據確定后,系統在數據庫檢索相關結果的同時,根據該用戶的歷史記錄(如醫療記錄)以及權限等信息,按檢索者的適合程度,重新組織、整合、顯現檢索結果。通過自然語言處理,PERSIVAL為現有分散的多媒體信息提供了一個包含檢索結果摘要、相關文件與影像全文、檢索結果的解釋說明、建議檢索詞匯以及檢索歷史記錄的用戶接口。相關信息的搜集、篩選、鑒別在完全通過客戶端軟件的自然語言處理機制來實現,因此PERSIVAL不產生額外的存儲開銷,需要安裝客戶端程序和配置相應的檢索環境,檢索過程也更為復雜。

4.3 數據安全性和保密性

下文從機制和具體實現方式兩個方面論述數據的安全性和保密性。

對于OAI-PMH協議,內部運用的元數據標準DC的“dc rights”屬性用以攜帶權限信息的以及服務提供方元數據等級映射機制,在此基礎上可建構基于OAI的等級安全權限機制。在具體實現過程中,數據提供者元數據收割請求的發送和返回都是通過HTTP協議來完成的,協議中規定傳遞參數方式為GET或POST。如果采用前者則會帶來安全問題,因為用戶名和密碼會出現在訪問的URL上,如果頁面被緩存或者其他人可以訪問客戶這臺機器,就可以從歷史記錄獲得該用戶的賬號和密碼。相應的,此種方式的傳輸及計算成本較小,可根據實際情況選取參數傳遞方式。

SRU基于HTTP協議,也是通過GET和POST方式獲取數據,其具體實現與上述OAI-PMH的描述相同。而SRW遵循SOAP通信協議,根據Web Service規范把查詢請求封裝成SOAP包,使用POST發送。從使用者的角度,Web Service是部署在web上的對象,具有對象的良好封裝性和安全性。綜上所述,SRU/SRW的安全性不同。由于這兩種協議均不存在集中的元數據存儲,因此保密性相對較高。

PERSIVAL出于數據版權以及醫療記錄隱私權的考慮,必須對使用者權限有所控制,對數據隱秘性有所保護。在用戶界面上,系統開始處理檢索者輸入的檢索策略之前,首先要確定的是檢索者的身份,包括其形態類別、醫療行為的提供者或是接受者、對于醫療信息的掌握程度、是否為預定醫療行為的接受者等信息。此外,由于數據通過客戶端封裝,本地也不保存相關信息,該系統的安全性也相對較高。

5 發展趨勢

電子文件長期保存和利用已成為當代數字檔案館建設的重要課題。根據《文獻管理長期保存的電子文檔文件格式》(GB/T 23286.1-2009),“長期”被定義為“足夠長的時間段,信息在該時間段內被存儲,期間可能會發生一系列技術變遷,包括新的媒體和數據格式支持、用戶群體的變更”。不同于傳統檔案,電子文件對軟件和硬件有較強的依賴性,國內外均有管理不善導致大量電子檔案記錄無法被讀取的教訓。而在技術改革過程中,產生了各類廣泛分布、異構、自治的檢索系統和發布系統。這些分散的數據和分離的系統正面臨著“比特腐化”的威脅。而統一的、支持多種文件類型和增值服務、覆蓋諸多信息發布系統的檢索接口是解決技術退化、讀取依賴的方法之一,統一的入口能強化電子文件資源的利用和控制。

在以上案例中可以看出,現有的互操作協議及實現方式中并沒有絕對的優勢方。為了滿足不同的用戶需求,OAIster資源庫建立了SRU模式的檢索入口;除此之外,通過OAI-PMH所收割的元數據也可提供至SRW/U系統作為架構的基礎,如Andy Powell所描述的JISC信息環境。而OCLC OAIcat通過對數據庫引擎、數據存儲格式映射機制進行抽象,可以為任意數據庫系統建立OAI元數據接口,包括SRW/U。同時Thomas Habing也致力于研究OAI-PMH和Z39.50之間的互操作網關機制。揚長補短、彼此兼容是現有互操作實現方案的發展趨勢。根據電子文件長期保存成熟度模型(Digital Preservation Capability Maturity Model,DPCMM),成熟的長期保存機制也包括了電子文件生命周期管理,上文所論述的互操作協議目前在統一管理電子文件本體方面能力較弱。此外,深化結合對特定領域的研究也是互操作協議的發展方向,主要體現在元數據標準的制定和發展。元數據標準應實現多層次和多功能的結合,這樣元數據的選擇和組合可以根據實際的需要細化到不同的層次,以滿足實際應用需求。

*本文系國家社科基金項目“基于互操作協議的檔案信息資源整合模式研究”(批準號:11CTQ030)的階段性成果。

[1]What is interoperability for European eGovernment Services[EB/OL].

[2016-06-10]http://ec.europa.eu/idabc/en/document/5313/5883.html.

[2]吳育芳.數字圖書館互操作協議比較研究[J].圖書館界,2011(1):38-41.

[3]Mehdi Alipour Hafezi.Interoperability models in digital libraries:an overview[EB/OL].[2016-06-10].http://www.emeraldinsight.com/0264-0473.htm.

[4]OpenArchives Initiative Protocol for Metadata Harvesting[EB/OL].

[2016-06-10]http://www.openarchives.org/pmh/tools/tools.php.

[5]Gateway to Library Catalogs Z39.50.[EB/OL].[2016-06-10].http://www.loc. gov/z3950/.

[6]徐濼燚.互操作協議在檔案信息資源整合中的應用探討[J].檔案與建設,2016(5):32-35.

[7]William Y.Arms Diane Hillmann.A Spectrum of Interoperability The Site for Science Prototype for the NSDL[EB/OL].[2016-06-10].http://www.dlib.org/dlib/january02/arms/01arms.html.

[8]俞力.數字圖書館互操作策略研究[J].圖書館學研究,2011(3):41-44.

[9]The OAIster database at a glance[EB/OL].2016[2016-06-10].http://www.oclc. org/oaister/about.en.html

[10]Projects-PERSIVAL[EB/OL].[2016-06-10].http://www.cs.columbia.edu/nlp/ projects.cgi#persival

[11]Rong Shi.LIGHTWEIGHT FEDERATION OF NON-COOPERATINGDIGITAL LIBRARIES[D].Norfolk:Old Dominion University,2004.

[12]周麗霞,朱德紅.數字檔案館數字資源長期保存涉及的元數據內容[J].黑龍江檔案,2013(3):13.

[13]包海峰、陳剛.基于OAI互操作協議的檔案信息資源整合模式研究[J].檔案與建設,2012(12):13-16.

[14]GB/T 23286.1-2009,文獻管理長期保存的電子文檔文件格式[S].北京:中國標準出版社,2009.

[15]錢毅.數字檔案文件長久保存策略芻議[J].檔案學通訊,2007(3):81-85.

[16]包海峰,彭楨,徐濼燚,陳剛.檔案元數據標準比較研究[J].檔案與建設,2014(2):19-23.

彭 楨,南京大學檔案館助理館員,研究方向為數字化檔案館。

包海峰,南京大學檔案館副館長,中國檔案學會自動化委員會委員,研究方向為數字化檔案館。徐濼燚,南京大學檔案館助理館員,研究方向為數字化檔案館。

Comparison of Metadata-sharing and Service-supported Interoperability Protocols

Peng Zhen,Bao Haifeng,Xu Luoyi
(Nanjing University Archives,Nanjing,Jiangsu,210046)

In the process of information technology development,there are all kinds of retrieval and distribution systems which are heterogeneous,autonomous and quite different from each other. The number of users has increased as well as the service required by them which covers a lot of information system only through a unified search interface.In this situation the interoperability protocol came into being.Due to different mechanisms,interoperability protocols can be divided into federal,metadata harvesting and collecting models.This article compare the realization and maintenance expense of all aspects concerned by the three models and give some suggestions on the principle of"moderate expense to derive full function".

Interoperability Protocol;Metadata Standards;Digital Archives;OAIster;The Euro?pean Digital Library;PERSIVAL

G270.7

猜你喜歡
服務信息
服務在身邊 健康每一天
今日農業(2019年14期)2019-09-18 01:21:54
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年15期)2019-01-03 12:11:33
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 国产精品部在线观看| 亚洲成综合人影院在院播放| 婷婷中文在线| 欧美日韩一区二区在线播放| 国产成人亚洲精品蜜芽影院| 在线国产综合一区二区三区| 免费网站成人亚洲| 国产女人18毛片水真多1| 欧美人人干| 毛片一级在线| 久久精品丝袜| 精品99在线观看| 一级毛片免费播放视频| 国产欧美日韩资源在线观看| 国产免费久久精品99re不卡| 亚洲天堂首页| 四虎AV麻豆| 午夜无码一区二区三区| www.99精品视频在线播放| 国产大片喷水在线在线视频| 91在线播放国产| 手机看片1024久久精品你懂的| 99ri精品视频在线观看播放| 二级特黄绝大片免费视频大片| 国产精品综合色区在线观看| 日韩精品成人网页视频在线| 日韩中文字幕亚洲无线码| 一级不卡毛片| 亚洲日韩AV无码精品| 国产清纯在线一区二区WWW| 午夜三级在线| 国产精品私拍在线爆乳| 无码人中文字幕| 国禁国产you女视频网站| 99在线观看国产| 久热精品免费| lhav亚洲精品| 凹凸国产分类在线观看| 欧美精品v日韩精品v国产精品| 国产成人精品优优av| h网站在线播放| 久久视精品| 国产乱人视频免费观看| 国产女同自拍视频| 人妻精品全国免费视频| 午夜久久影院| 制服丝袜在线视频香蕉| 国产精品久久久久鬼色| 国产精品午夜福利麻豆| 露脸一二三区国语对白| 又爽又大又光又色的午夜视频| 欧美自慰一级看片免费| 国产亚洲精| 久久黄色毛片| 亚洲91精品视频| 日本不卡在线| 亚洲成人动漫在线| 国产精品美女网站| 在线看AV天堂| 亚洲第一区欧美国产综合| 福利视频一区| 国产精品私拍99pans大尺度| 国产精品无码作爱| 伊人国产无码高清视频| 男人天堂亚洲天堂| 欧美成人h精品网站| 日本色综合网| 国产一级视频久久| 国产亚洲一区二区三区在线| 伊人激情综合| 色首页AV在线| 亚洲综合久久成人AV| 国产真实乱了在线播放| 最新国产精品第1页| 国产精品美乳| 久久先锋资源| 国产欧美亚洲精品第3页在线| 久久久91人妻无码精品蜜桃HD| 性欧美在线| 亚洲欧洲日韩综合色天使| 国产h视频免费观看| 99re在线视频观看|