(國家圖書館 北京 100081)
在數(shù)字圖書館發(fā)展新時期和“大數(shù)據(jù)”時代背景下,需要將分散游離于各數(shù)字圖書館之間的資源及服務進行有效集成并協(xié)同,以提高數(shù)字圖書館海量文獻數(shù)據(jù)的處理能力和服務能力。唯一標識符作為數(shù)字資源的條形碼,〔1〕它采用機器可以識別的一串數(shù)字描述資源,對數(shù)字資源進行統(tǒng)一標識,貫穿于數(shù)字資源采集與加工、服務與保存等環(huán)節(jié),將數(shù)字資源的生命周期的管理進一步簡單化、標準化、規(guī)范化。
國外唯一標識符技術經過近二十年的發(fā)展,陸續(xù)出現(xiàn)了標識互聯(lián)網資源的URI/URN/URL,〔2〕標識連續(xù)出版物、圖書等文獻的 SICI〔3〕/BICI〔4〕/PII〔5〕,標識數(shù)字對象的 DOI〔6〕等多種形式的標識不同載體的唯一標識符規(guī)范和應用。由于大多標識符方案和技術僅僅定義了標識符名稱空間及標識符構成機制,尚未形成包含規(guī)范、應用、管理等完整的唯一標識符服務體系?;贖andleSystem技術〔7〕的DOI唯一標識符服務體系,在DOI國際標準〔8〕支撐下,形成了以命名、申請、授權、注冊、解析、變更為功能核心,以全球注冊中心、本地服務為主體框架的名稱服務體系,目前在全球已有10個注冊代理機構,在數(shù)字出版行業(yè)得到了廣泛的應用。〔9〕
在國內,有些機構直接納入到國外唯一標識符服務體系,開展中文數(shù)字資源的唯一標識符服務;〔10〕也有一些單位自主研發(fā)了唯一標識符的應用功能和命名規(guī)則?!?1〕唯一標識符技術在公共圖書館領域的應用與研究尚處起步階段,隨著圖書館數(shù)字資源種類和數(shù)量的不斷增多,數(shù)字資源的網絡服務愈發(fā)重要,正逐漸成為公共圖書館的主要服務內容,而數(shù)字資源在管理及服務上的問題也日益凸顯。
唯一標識符規(guī)范、系統(tǒng)的建設是國家數(shù)字圖書館工程的重要內容,國家圖書館以推廣工程為平臺,利用已有的建設成果,聯(lián)合全國各級公共圖書館共同探索和創(chuàng)新,構建涵蓋唯一標識符的標準、應用和管理機制等環(huán)節(jié)的完整的唯一標識符體系,以實現(xiàn)對全國公共圖書館數(shù)字資源的統(tǒng)一標識和規(guī)范管理,促進跨區(qū)域跨平臺的資源調用和系統(tǒng)集成。
( 1 )實用性
唯一標識符體系應選用高可靠性的存儲、設計高效的查找策略、使用合理的通訊協(xié)議、設計滿足用戶需求的服務模型、采用高效靈活的分布式架構進行體系的規(guī)劃和研究。確保各省、市圖書館可獨立完成本地數(shù)字資源唯一標識符的注冊和管理,可及時對數(shù)字對象的URL地址進行更新,避免資源鏈接的“死鏈”現(xiàn)象。
( 2 )穩(wěn)定性
唯一標識符體系應面向互聯(lián)網用戶采用多鏈路方式提供高效、穩(wěn)定的唯一標識符解析服務,服務終端與服務提供者之間通過建立簡單、快捷的鏈接通道,保證服務的穩(wěn)定性。在單個節(jié)點出現(xiàn)故障時,可以通過中心節(jié)點作為橋梁建立鏈接,不會影響整個體系,確保資源的及時、準確定位。
( 3 )擴展性
唯一標識符體系應具備軟硬件層面的擴展能力,能夠通過增加硬件設備和優(yōu)化軟件策略的方式來提高處理能力。在業(yè)務層面,應立足公共圖書館,具備向出版單位、研究機構、博物館等全國其它有需要的單位提供公益性的唯一標識符注冊和解析服務能力,促進跨系統(tǒng)、跨機構的資源鏈接和共享利用。
( 4 )兼容性
唯一標識符體系應能夠實現(xiàn)圖書館多版本、多復本數(shù)字資源的注冊和解析,只要提供與數(shù)字對象相關的元數(shù)據(jù),各圖書館的應用系統(tǒng)就可以定位相應的資源,能夠有效促進圖書館間的業(yè)務融合。此外,唯一標識符體系還應該兼容唯一標識符的相關國際標準,提供規(guī)范的解析接口,保證在業(yè)界的持續(xù)競爭力。
唯一標識符體系的建設首先要考慮公共圖書館數(shù)字資源的建設情況,制定出科學、規(guī)范、適用的唯一標識符命名規(guī)則、注冊規(guī)則和解析規(guī)則,指導系統(tǒng)平臺的建設。通過系統(tǒng)平臺完成標識全國公共圖書館的所有數(shù)字資源,形成能夠容納國家圖書館、省級館、市級館的總分式唯一標識符體系,實現(xiàn)唯一標識符的統(tǒng)一規(guī)劃和服務。同時,在國家圖書館的協(xié)調組織和各級公共圖書館的積極配合下,建立公共圖書館共同參與的多層管理體系,形成一套完善的運行和管理機制,保證各服務節(jié)點的協(xié)調工作和穩(wěn)定運行。
為保證唯一標識符體系的安全、穩(wěn)定,國家圖書館參照HANDLE系統(tǒng)的體系架構,采用分布式的服務框架,按照“國家-省-市”三層架構進行設計,既能保證每個服務節(jié)點的獨立管理,系統(tǒng)高度自治,還能提高系統(tǒng)的可靠性,不會因為單個節(jié)點的故障導致服務的中斷。如圖1所示,最上層為頂層服務,由中心節(jié)點提供,管理n個分支服務節(jié)點,對各分支服務節(jié)點進行命名授權和管理。在頂層節(jié)點下,具有多個唯一標識符的二級服務節(jié)點,各服務節(jié)點可接收本地范圍內注冊機構的申請和審批,各注冊機構即為實際提供唯一標識符注冊服務的實體服務機構;二級節(jié)點下可繼續(xù)發(fā)展三級服務節(jié)點,滿足市級及以下圖書館的數(shù)字資源注冊需求。頂層服務采用星型結構同步各子層圖書館的系統(tǒng)配置信息,通過分層模式逐層同步各省、市唯一標識符信息,保存各子層提交的注冊數(shù)據(jù),提供唯一標識符的查詢功能,在其他節(jié)點出現(xiàn)故障時,直接提供解析服務,保證系統(tǒng)的穩(wěn)定性。

圖1 唯一標識符體系框架
唯一標識符體系以分級注冊和統(tǒng)一解析的模式對外提供服務。各服務節(jié)點不僅負責本地區(qū)有唯一標識符注冊需求的機構申請和管理,還要負責本地唯一標識符的解析服務。各注冊機構為直接進行唯一標識符注冊和管理的單位。
唯一標識符體系的構建應該以標準化和開放性為原則,從標準規(guī)范、技術平臺、服務體系和管理體系四個方面進行建設。
公共圖書館數(shù)字資源唯一標識符標準規(guī)范的建設包括數(shù)據(jù)格式的標準化、資源種類的標準化、命名規(guī)則的標準化、注冊數(shù)據(jù)的標準化等等。
根據(jù)文化部統(tǒng)計數(shù)據(jù),2012年全國共有縣級以上獨立建制的公共圖書館3076個?!?2〕唯一標識符體系需要能夠覆蓋和服務所有的公共圖書館,還要保持不同圖書館數(shù)字資源之間的通用性、交互性以及不同應用系統(tǒng)之間的互操作,因此,研制唯一標識符標準規(guī)范是建設唯一標識符體系的重要前提。國家圖書館自2002年以來,一直跟蹤國內外唯一標識符相關標準規(guī)范的前沿動態(tài),并于2010年正式發(fā)布了《國家圖書館數(shù)字資源唯一標識符規(guī)范和應用指南》?!?3〕2012年參與了文化部行業(yè)標準“數(shù)字對象唯一標識符”規(guī)范的研制工作,同年國家圖書館也開展了公共圖書館唯一標識符命名規(guī)則的制定工作,采用“前綴/后綴”的方式進行命名,前綴和后綴各段采用英文半角“.”分隔,如“108.ndlc.2.1100009031010001/T1F24.003171449”。前綴包括四段,分別為國家區(qū)域代碼、國家數(shù)字圖書館代碼、服務節(jié)點代碼以及注冊機構代碼;后綴為綜合信息編號和系統(tǒng)內部標識號,主要體現(xiàn)了該資源的種類、文件格式等基本信息。
唯一標識符系統(tǒng)平臺的建設是建立唯一標識符體系的基礎。根據(jù)《國家圖書館數(shù)字資源唯一標識符規(guī)范和應用指南》,國家圖書館進行了唯一標識符系統(tǒng)的前期需求調研和應用調研,于2011年啟動了“國家圖書館數(shù)字資源唯一標識符系統(tǒng)”項目,〔14〕系統(tǒng)主要用于數(shù)字資源唯一標識符的注冊、管理和服務,它不僅是國家數(shù)字圖書館工程的一個核心配套子系統(tǒng),也是推廣工程軟件平臺建設的一項重要內容。唯一標識符系統(tǒng)按照數(shù)據(jù)層、應用層和服務層三層結構進行設計,如圖2所示,數(shù)據(jù)層依托ORACLE數(shù)據(jù)庫存儲和管理唯一標識符的注冊數(shù)據(jù),并利用ORACLE全文檢索技術提供高效的檢索能力;應用層采用J2EE架構,簡化并規(guī)范了應用系統(tǒng)的開發(fā)與部署,采用標準的WebService接口實現(xiàn)了異構平臺間的互通,有力保證了唯一標識符系統(tǒng)與各省、市圖書館業(yè)務系統(tǒng)的整合;服務層面向用戶提供唯一標識符的注冊、解析、機構管理以及數(shù)據(jù)管理等服務。

圖2 唯一標識符系統(tǒng)結構圖
服務體系建設是唯一標識符體系的核心環(huán)節(jié),主要定義了一套兩層的服務模型,即注冊服務層和解析服務層。
( 1 )注冊服務
國家圖書館為唯一標識符體系的中心節(jié)點,各省、市圖書館原則上都需要搭建系統(tǒng)環(huán)境,省級圖書館為二級服務節(jié)點,市級圖書館為三級服務節(jié)點。各省、市圖書館根據(jù)數(shù)字資源建設情況,可以建立唯一標識符的注冊中心,獨立完成本地唯一標識符的注冊和管理。
公共圖書館之外其它有唯一標識符注冊需要的單位,利用相應服務節(jié)點軟硬件平臺,申請成為注冊機構,各注冊機構獲得命名授權后方可進行授權范圍內唯一標識符的注冊。
( 2 )解析服務
唯一標識符體系面向全球提供中文數(shù)字資源的唯一標識符解析服務。唯一標識符解析包含正向和反向兩種解析模式,正向解析是通過唯一標識符獲取資源的URL地址,該服務面向包括互聯(lián)網用戶在內的所有用戶開放;反向解析是通過查詢注冊數(shù)據(jù)的相應字段獲取資源的URL地址,該服務僅面向注冊機構的用戶開放。
唯一標識符解析體系采用分層解析的策略,系統(tǒng)根據(jù)唯一標識符的命名規(guī)則,首先選擇指定的服務節(jié)點進行解析,如果該服務節(jié)點存在異常,則利用中心節(jié)點進行二次解析。通過唯一標識符的解析體系,可以實現(xiàn)資源的穩(wěn)定定位,一個數(shù)字化對象的標識符一經產生就永久不變,不隨其所標識的數(shù)字化對象的存儲地址等屬性的變更而改變,保證數(shù)據(jù)在互聯(lián)網上的穩(wěn)定性。
管理體系建設是唯一標識符體系運行的重要保障。建立高效、穩(wěn)定的管理體系不僅可以實現(xiàn)各級節(jié)點數(shù)據(jù)和機構的有序運行,還可以保障公共圖書館唯一標識符各服務節(jié)點的安全穩(wěn)定。
國家圖書館作為唯一標識符體系中心節(jié)點的管理者,提供唯一標識符系統(tǒng)的整體運行策略、標準規(guī)范、協(xié)調管理、技術支持等保障服務,作為國內唯一標識符行業(yè)代表與國際相關機構溝通聯(lián)系。管理對象主要為服務節(jié)點,負責服務節(jié)點的申請、審批和考核工作,并對其提供技術和業(yè)務等各方面的指導,保存服務節(jié)點成功注冊的唯一標識符數(shù)據(jù)。
服務節(jié)點是唯一標識符體系的重要實施運作機構。服務節(jié)點對本節(jié)點命名授權下的注冊機構進行管理,負責注冊機構的申請、審核、技術支持和業(yè)務培訓工作,為注冊機構提供賬號維護和唯一標識符的注冊、解析、管理和修改等多種服務。各服務節(jié)點應配合中心節(jié)點完成體系運行的各項輔助工作,協(xié)調并處理與注冊機構之間、注冊機構與注冊機構之間的各類數(shù)據(jù)協(xié)同的問題。
注冊機構作為唯一標識符注冊的實體,向相應的服務節(jié)點申請,待審批通過以后,注冊機構獲得服務節(jié)點分配的操作賬號后,對唯一標識符進行數(shù)據(jù)注冊、修改、刪除等操作,并自動逐級同步至中心節(jié)點備案存檔。
近十年來,國內學者一直在跟蹤和研究唯一標識符技術,已經從理論研究逐漸過渡到應用層面。然而,在圖書館領域,專業(yè)技術人才的缺乏和經費支持力度不夠,唯一標識符技術的前期研究僅在少數(shù)圖書館開展,其推廣和應用緩慢。
國家圖書館依托數(shù)字圖書館推廣工程,聯(lián)合全國各級公共圖書館共同建立起推廣工程唯一標識符體系,形成公共圖書館行業(yè)的唯一標識符標準規(guī)范,以指導行業(yè)唯一標識符數(shù)據(jù)、系統(tǒng)和管理的建設;研制出系統(tǒng)平臺,實現(xiàn)了行業(yè)內唯一標識符申請、注冊、解析等各流程的一整套系統(tǒng)平臺應用,以及通過接口擴展兼容國內外平臺,為公共圖書館數(shù)字資源的集中揭示和統(tǒng)一調度提供相應的應用支撐;制定出數(shù)據(jù)、系統(tǒng)、運行的配套管理機制,為唯一標識符在全國各地順利開展應用服務提供行之有效的保障。唯一標識符體系的建成,將推動各地數(shù)字圖書館建設的進一步完善,促進全國公共圖書館服務水平的提升。同時,建設我國具有自主知識產權的唯一標識符體系,還可以擺脫公共文化服務領域對國外系統(tǒng)和平臺的技術依賴,這對于保證我國公共文化信息安全也具有重要的戰(zhàn)略意義。
2.R.Moats.URNSyntax.May 1997.http://www.ietf.org/rfc/rfc2141.txt
3.ANSI/NISO Z39.56-1996 Serial Item and Contribution Identifier.http://www.niso.org/apps/group_public/download.php/6514/Serial%20 Item%20and%20Contribution%20Identifier%20%28SICI%29.pdf
4.SICI and BICI: Identifiers for Serials and Books.https://www.google.com.hk/#newwindow=1&q=BICI+SICI&safe=strict
5.Publisher Item Identifier. http://www.ch.ic.ac.uk/ectoc/ectoc_pii.html
6.Digital Object Identifier System. http://www.doi.org
7.Handle System. http://www.handle.net/documentation.html
8.ISO 26324:2012.Information and documentation--Digital object identifier system.http://www.doi.org/ISO_Standard/sc9n475.pdf
9, 10.DOI: Registration Agencies. http://www.doi.org/registration_agencies.html
11.CALIS數(shù)字對象唯一標識符命名規(guī)范.〔2007-10-09〕http://lib.njtu.edu.cn/pub/bjtu/xswhjl/gnpx/P020071009509903283516.doc
12.全國第五次公共圖書館評估定級綜述.〔2013-09-13〕 http://ceshi.mcprc.gov.cn/sjzz/shwhs_sjzz/shwhs_gzdt/201309/t20130923_391926.htm
13.孫坦等.國家圖書館數(shù)字資源唯一標識符規(guī)范和應用指南.北京:北京圖書館出版社,2010
14.童忠勇,李志堯,孫秀萍.國家數(shù)字圖書館數(shù)字資源唯一標識符系統(tǒng)的設計與實現(xiàn). 圖書館學研究,2013(21):53-58