劉香蘭(1. 國家圖書館 北京 100081;2. 山東科技大學 山東青島 266590)
?
基于生命周期的跨機構文化資源數字化建設*
劉香蘭1,2
(1. 國家圖書館北京100081;2. 山東科技大學山東青島266590)
〔摘要〕文化資源數字化建設是現代公共文化服務體系建設的重要組成部分,數字化新技術是推動文化資源建設、提高文化資源創新能力和傳播能力的新引擎。基于生命周期理論,運用采集、加工組織、存儲、版權保護、集群高并發檢索與動態調度、智能展示等數字化高新技術,匯集、整合不同文化機構的數字文化資源,實現文化資源的集中管理、統一檢索與聯合展示,可為異構多形態文化資源的數字化建設提供技術手段和參考依據。
〔關鍵詞〕文化資源生命周期數字化建設
〔分類號〕G203;G358
〔引用本文格式〕劉香蘭.基于生命周期的跨機構文化資源數字化建設[J].圖書館,2016(4):62-65, 77
* 本文系國家“十二五”科技支撐計劃項目“文化資源服務平臺解決方案及標準研究”(項目編號:2012BAH01F01)和國家圖書館科研項目“基于關聯規則的圖書館讀者行為數據挖掘方法研究”(項目編號:NLC-KY-2015-08)的研究成果。
文化資源蘊含著民族特有的精神價值、思維方式和想象力,體現著民族的生命力和創造力,是各民族的智慧結晶,也是人類文明的瑰寶,利用先進的數字化信息技術進行記錄、編輯、管理和再現文化資源,是科學保護、傳承、共享文化資源的有效手段。研究文化資源的數字化核心技術,匯集、整合跨行業、跨平臺的多形態文化資源,消除資源分散造成的信息單一孤立、利用困難等問題,促進文化資源的傳播與利用[1],保證文化資源建設與服務的可持續良性發展,已成為構建現代公共文化服務體系的一個熱點問題。
2.1構建現代公共文化服務體系的需要
《關于加快構建現代公共文化服務體系的意見》[1]明確提出,加強公共文化大數據采集、存儲和分析處理,統籌實施全國文化信息資源共享,構建標準統一、互聯互通的公共數字文化服務網絡,加快推進公共文化機構數字化建設。隨著數字化信息技術的日新月異,數字文化資源共建共享已成為惠及千家萬戶的一項重要基礎工程,是政府提供信息共享服務的重要內容之一,打破行業內、區域間信息閉塞的狀況,縮小文化機構間數字鴻溝,提高海量信息資源的標準化匯集與整合,提升文化機構資源服務能力,形成協調推進復合型公共文化服務體系構建的強大合力。
2.2解決文化行業資源建設的條塊分割
分屬于不同文化機構的文化資源,在數字化過程中存在資源分散、數字化建設重復低效、資金及設備重復投入、資源碎片化和條塊分割的諸多問題,文化資源的數字化建設可以將各文化機構物理上被分散在各個網絡節點中、異構數據源系統中孤立的數據進行分布式存儲與異構整合,通過諸如用戶統一認證、統一檢索、動態調度等數據庫整合技術,借助于面向移動網絡、電視網絡的數據分發等運營系統的整合,實現不同來源、不同層次、不同結構、不同內容的文化資源共建共享與有機融合,為用戶提供一個統一的、透明的訪問界面。
2.3創新文化機構服務模式
新媒體,改變了文化資源的傳播渠道與傳播方式,實現了數字文化資源的多渠道傳輸、多功能服務及多智能終端的信息接收方式,培養、改變了與資源全媒體傳播模式相適應的新型受眾,主體參與意識的強化加速了受眾個性化需求的萌發,文化機構的資源服務模式面臨著諸多挑戰。文化資源數字化建設,依托于媒體融合、網絡融合、大數據等現代化信息新技術,集不同文化機構的人力、物力、財力,探索創新數字時代文化資源的服務模式,可增強各文化機構數字資源的提供能力和遠程服務能力,擴大數字文化資源的覆蓋面及提高受眾的服務滿意度。
3.1資源建設內容及展現形式多樣化
隨著數字化、信息化、網絡化技術的發展,可數字化的文化資源內容日益廣泛,不僅傳統的文獻資源如圖書、期刊、報紙,而且文物、藝術創作、民俗風情、非物質文化遺產等這些非文獻文化資源也可進行數字化采集與加工組織,并可通過文字、圖片、音視頻、動畫、網頁、交互體驗等多樣化的資源展現形式呈現給廣大受眾。
3.2資源傳播形式覆蓋全媒體
在新技術的驅動下,新媒體與傳統媒體不斷融合發展,數字文化資源的媒介載體、媒體覆蓋面、受眾傳播面均發生了翻天覆地的變化。依托于互聯網、廣電網、移動通信網、衛星等傳播渠道,借助于電視、音像、電影、出版、報紙、雜志、網站等不同媒介形態,受眾可通過電腦、手機、筆記本、IPad、閱讀器、數字電視等覆蓋全媒體的多智能終端設備,隨時隨地使用數字文化資源。
3.3資源的集約化管理
文化資源的集約化建設與管理,可以集各文化機構的人力、財力、物力,通過業務整合重組,優化資源配置及建設流程,減少軟硬件設備的重復投入及資源的重復建設,節約人力及資金成本,規范文化資源的元數據建設,全方位整合異構、多形態的文化資源,構建惠及更多用戶的超大型數字文化資源應用支撐平臺,實現數字文化資源的共建共享及長期保存。
信息(資源)生命周期指從信息的收集、生產、保護、傳播、檢索存取和利用,到消失或不再有利用價值、不再被傳播的過程,一般經歷生成、交流、整理、存儲、利用、維護、恢復、再利用、再包裝、再交流、降低使用等級、處置或廢棄等階段[2]。文章基于信息生命周期理論,集成資源的數字化采集、加工組織、存儲、版權保護、展示、統一檢索技術,整合多家文化機構的多形態文化資源,并實現跨機構文化資源的數字化建設,為文化資源的集中管理、統一檢索與聯合展示提供技術手段。
資源生命周期建設階段的劃分在文化資源的數字化建設過程中非常重要,文章在借鑒國內外學者劃分標準的基礎上[3-6],將文化資源的數字化建設模型劃分為五個階段:依次是文化資源的數字化采集/加工組織、存儲/長期保存、認證/版權保護、檢索/動態調度、展示/整合更新。文化資源數字化建設的每個生命階段相互依存,互為依托,共同形成一個動態閉環管理體系,但模型的每一階段又都是開放式的[7],管理人員可根據需求隨時修改維護相應的資源數據。
4.1文化資源的數字化采集與加工組織
文化資源的數字化采集技術根據資源類型的特點,分別確定采集目標、采集要素、采集設備、采集流程,經過采集數據的分析與處理后獲取不同類型資源的元數據;加工組織技術在分析資源自身特征與屬性及資源所有者、管理者和使用者各種需求的基礎上,確定選取各資源類型的元數據標準和具體應用規則,形成不同的元數據建設方案,利用統一的元數據結構、配置文件解析器進行元數據的轉換與清洗,通過語義關聯進行元數據的規范化再組織。
4.2文化資源的存儲與長期保存
文化資源具有非直觀性、易逝性、易損性,借助于存儲和長期保存技術可實現資源在長久時間內被定位、讀取、使用和發現。存儲和長期保存技術針對文化資源建設的存儲需求,利用多個存儲設備,將集群功能、分布式文件系統、網格計算等功能聯合起來協同工作,并通過一定的應用軟件或應用接口,對用戶提供一定類型的數據存儲服務和數據訪問服務。多機構數字文化資源的長期保存,既可以保證數字對象在整個建設生命周期內的完整性、真實性和可用性,又可以便捷地共享數據,易于擴充存儲容量,大大降低保存成本。
4.3文化資源的認證和版權保護
在數字時代的大環境下,文化資源數字化后的傳播渠道和傳播方式更加多樣化,但同樣也面臨著侵權問題,資源版權登記、版權存儲標識、傳播使用控制、版權追蹤及侵權監測等資源認證與數字版權保護技術是對數字文化資源進行權益管理與保護的一項有效措施。綜合使用各種技術手段,對采集加工后的原始資源數據進行封包結構化,將傳播資源的版權控制在基于統一資源接口標準與資源安全存儲的結構中,形成統一規范化的資源數據,提供在線、離線、第三方的版權控制與管理服務模式。
4.4數字文化資源的檢索與動態調度
將多機構的文化資源數字化后采用元數據集中、對象數據分散的管理模式,一直以來都是資源整合領域所追求的目標。匯集各類文化機構自建或其它方式獲取的數字文化資源,建立和維護高性能的分布式索引,結合基于互連網的信息收集和數據分析挖掘技術, 利用搜索引擎對各類數字文化資源的元數據進行快速檢索,向用戶提供統一、實時高效的數字文化資源元數據搜索服務,其對應的對象數據可以提交到統一平臺與服務系統上去直接發布,也可以通過各機構自建的發布與服務系統進行發布,實現各機構文化資源的分布式動態調度。
4.5數字文化資源的展示與整合更新
對文化資源進行采集、轉換、清洗、封包、版權控制等系列數字化工作之后,資源便可通過視頻、平面、聲音、VR虛擬現實等多種手段向用戶提供展示服務,資源在展示服務過程中需要不斷根據受眾的需求及交互反饋意見進行整合、更新、替代或剔除,以更好地完善優化資源數據,提升受眾的服務滿意度。

圖1 文化資源的數字化建設技術框架
基于生命周期的文化資源數字化建設,不僅集成了傳統的紙質文獻、圖片、音視頻,還探索性地整合了部分旅游文化、民俗文化、動態藝術等異構文化資源,借助于系列數字化信息技術,實現了文化行業內、文化機構間資源的數字化共建共享與統一揭示,為利用數字化信息技術構建現代公共文化服務體系提供了借鑒。文化資源的數字化建設技術框架設計為五層架構(如圖1所示)。
5.1文化資源層
最底層為文化資源層,涵蓋了來自于不同機構的圖書、期刊、圖片、地圖、字畫、音頻、視頻、活態三維等多種資源,資源類型的劃分跨越了各機構內數據的分類方法,主要根據文化資源數字化采集技術的不同整理劃分為五大類[8]。靜態格式的資源包括圖書、字畫圖片、音視頻、立體文物等,并又細化為靜態二維和靜態三維兩類資源;不斷創新被傳承的資源類型定義為活態資源,如音樂、民間戲曲、民間舞蹈;動態資源指變化發展的或可表現出活動神態的藝術資源[9],如動態圖片、動態網頁;不便于再精細劃分的資源為其它類。
5.2數據采集層
數據采集層依據文化資源層的資源分類方法,制定各類資源的數字化采集與處理標準規范,分別確定資源采集目標、采集要素與采集流程,利用各種傳感器、照相機、圖像捕捉卡、掃描儀、條形碼等現代化采集技術與設備,將文化資源轉換為計算機可識別、處理的數字信號,并借助于M2M網絡、互聯網、移動寬帶網、2G/3G/4G等網絡將采集到的資源數據自動傳輸、暫時保存到計算機系統。
5.3數據處理層

圖2 元數據建設體系
數據處理層主要對資源采集層采集到的元數據進行建設與整合。首先對跨機構資源數據進行綜合分析,根據數據的內容屬性、外在特征、管理屬性、用戶檢索需求確定元數據規范化建設標準與建設體系(如圖2所示)。元數據描述需要制定統一的元數據結構及映射規則,在保留不同資源共性內容的基礎上,凸顯不同資源和服務的個性化內容,以便實現元數據的轉換與映射。基于元數據建設方案及映射規則進行元數據FRBR化再組織,構建文化資源的核心元數據集,利用元數據分析器、過濾器、生成器抽取核心元數據(如圖3所示),采用數字資源唯一標識符技術對各類文化資源進行標識,將資源轉換成可讀、可檢索的標準化關聯數據,以實現數字信息的語義關聯和知識重組[10]。

圖3 核心元數據的抽取
5.4數據存儲保護層
按照傳統的工作模式和技術手段,要實現跨機構數字文化資源的存儲與長期保存,要求每個機構都要建設一套資源存儲系統,勢必造成資源、資金的浪費,且基礎條件欠缺的機構實施難度大等問題。跨機構的文化資源數據存儲保護層旨在集多家機構的存儲設備滿足分布式文化資源的數據存儲能力和存儲性能需求,以實現存儲的靈活擴展并應對更多資源數據的存儲挑戰,并利用災難備份、實名統一認證、資源傳播版權控制等一系列技術手段實現資源的長期保存與版權保護。
分布式存儲技術采用可擴展的Hadoop數據庫架構,通過網絡利用多臺存儲服務器分擔存儲負荷,提高分布式存儲系統的可靠性、可擴展性與存取效率;針對文化資源的非直觀性、易逝性、易損性特點,在分布式存儲基礎上,構建跨機構的云倉儲架構,將存儲服務和存儲資源統一放到云上,形成數字文化資源的聯合保管與服務集成;災難備份采用數據級災難備份技術,通過建設數據校驗模塊,實現數字文化資源的異地數據備份,以備災難發生后,仍然能夠最大程度保持服務的連續性,減少非計劃內的宕機時間。
讀者實名認證技術自動通過全國公民身份證號碼查詢服務中心系統驗證讀者身份信息,通過讀者權限控制實現資源版權保護。資源傳播途徑是最為關鍵的盜版媒介,資源傳播是版權控制的重點。資源傳播控制涉及到資源建設生命周期的各個階段,資源傳播鏈條包括數字版權管理中心、許可證管理中心、盜版追溯中心、內容擁有者、內容分發商、授權用戶以及提供數據支撐的資源數據庫,跨機構文化資源的傳播控制必須建立一個全方位、立體化的體系(如圖4所示)。通過綜合使用各種技術手段,在對文化資源數據庫中的原始資源進行封包結構化、統一資源接口標準與資源安全存儲的基礎上,提供在線、離線、第三方的版權控制和管理。

圖4 資源傳播控制鏈條
5.5數據展示服務層
經過集成、整合并有版權保護的跨機構數字文化資源,借助于集軟件、硬件于一體的集群式檢索系統(如圖5所示),在公共基礎網絡上建立專有數據通道實現信息傳遞與服務的動態調度,通過不同的媒介形態、覆蓋全媒體的多智能終端設備,以圖、文、聲、像等資源傳播方式全方位展示給廣大受眾,并實時搜集受眾的交互反饋信息,動態優化完善數字文化資源的服務。

圖5 集群式檢索系統
基于信息生命周期理論的跨機構文化資源數字化建設,通過數字化采集、加工組織、存儲、長期保存、版權保護、展示等現代化信息技術手段,消除了機構間資源數據分散造成的信息孤立、利用困難等問題,促進了文化資源的傳播與利用,創新了文化資源建設與服務的可持續良性發展模式,為跨平臺、多形態文化資源的數字化建設及共建共享工作提供了參考依據。
(來稿時間:2015年9月)
1.畢強,陳曉美,印均平.數字資源建設與管理[M].北京:科學出版社,2010:37
2.馮明毅.基于信息生命周期理論的圖書館信息資源管理模式構建[J].圖書館建設,2013(7):49-52
3.索傳軍,王濤,付光宇.國內外信息生命周期管理研究綜述[J].圖書館雜志,2007, 27(7):14-20
4.王靜,郭太敏,王敏, 等.基于生命周期理論的區域科技信息服務協同風險管理研究[J].圖書館,2014(4):62-63,82
5.趙伯興.復合圖書館條件下館藏生命周期成本的研究[J].圖書館,2004(5):19-22
6. Protection and Information Lifecycle Management[M]. Prentice Hall Ptr,2005
7.索傳軍.基于信息生命周期的數字館藏管理研究[J].大學圖書館學報,2005(1):26-29
8.中華人民共和國文化部.國家科技支撐計劃項目建議書[R].文化資源數字化關鍵技術及應用示范,2011
9.動態[EB/OL].[2015-01-26]. http://baike.baidu.com
10.國家圖書館.文化資源的數字化關鍵技術研究報告[R],2015
Digital Construction of Cultural Resources for Different Units Based on Life Cycle
Liu Xianglan1,2
( 1.National Library of China; 2.Shandong University of Science and Technology )
〔Abstract〕Digital construction of cultural resources is an important part of the construction of modern public cultural service system, New digital technology is the new engine to promote the construction of cultural resources, to improve innovation ability and communication ability of cultural resources. Based on the life cycle theory, using new digital technology, such as acquisition, processing, storage, organization and copyright protection, clusters of high concurrency retrieval and dynamic scheduling, intelligent digital display , cultural resources of different cultural agency can be collected and integrated, to realize centralized management, unified retrieval and joint exhibition of cultural resources, to provide technical means and reference for the digital construction of heterogeneous forms resources.
〔Keywords〕Cultural resourcesLife cycleDigital construction
〔作者簡介〕劉香蘭(1977-),女,國家圖書館在站博士后,山東科技大學圖書館館員,研究方向:數字圖書館、文化資源數字化技術、數據挖掘。