葉繼元 劉鳳儀
(南京大學信息管理學院,南京 210023)
筆者于2018年撰文討論“如何推動跨系統跨部門的圖書館信息資源共建共享”問題,認為“國家已對信息資源宏觀建設與微觀管理做出部署,目前最重要的是組織落實”[1]。下面筆者就圍繞數字資源,談談保障體系重構的管理體制和機制問題的一些看法。
文獻資源的共建共知共享問題,在業界已經討論多年,并在實踐方面取得了許多進展。對于近20年日益興起的數字資源的共建共知共享(以下簡稱“三共”)問題,目前仍是研究的熱點,相關文獻不少。例如,有的研究通過調研國內外圖書館文獻資源(含數字資源)共建共享現狀,“針對數字資源海量化、多樣化、內容服務智慧化、獲取去中心化、技術智能化、傳播泛在化、保存戰略化等新特征,分析文獻資源實現共建共享在資源數量、規范、存儲和服務等方面的挑戰和機遇,從政策和資金、資源和技術、理念和信任、機制和溝通等方面提出了開展共建共享工作的相關建議”[2]。有的則提出“進入智慧圖書館發展階段,圖書館資源建設將突破行業內集成共享的格局,進一步實現對互聯網環境下網絡原生資源、科學數據、開放存取資源、個人創作資源等多源知識內容的統一加工揭示、自動語義關聯和集成管理服務,形成覆蓋全網的立體化知識資源體系。同時進一步加強面向互聯網陣地的高品質知識資源,特別是中文原生數字學術資源的有效供給,推進知識內容生產、傳播、利用環節的融合創新,加快培育集成化、一站式知識協同共享環境”[3]。有的認為“由于數字版權保護的原因,資源可能會按次付費。但是,如果數字資源的規模太小,資源不易管理、維護,也不便提供服務,因此,數字資源大多以大型數據庫的形式存在,這就需要有新的共享機制來攤薄資源管理、服務、利用的成本。數字資源的共享是傳統圖書館共享機制的延續與發展”[4]。有的認為“面對當前圖書館對其信息服務系統的發展幾乎無話語權、系統與數據開發商對數據庫和系統壟斷,與高校圖書館發展目標和革新信息服務系統的強烈需求嚴重脫節的局面,高校圖書館需要組成更廣泛的、更有效的新型高校圖書館聯盟,探索新形勢下高等教育文獻保障體系建設運營新機制,自主研發信息服務系統,加大自主權和議價權,從根本上改變圖書館,尤其是信息服務系統的發展現狀”[5]。有的則提出了“關于國家采購數字資源并免費開放社會利用的建議”,并建議建立4項機制:國家采購數字資源保障機制;國家采購數字資源遴選機制;國家采購數字資源運行機制;國家采購數字資源長期保存機制[6]。引人注目的是,此文作者陳建華并非圖書情報學專業人士,原為廣州市人大常委會主任,現為全國人大代表。從上可知,數字資源由于其重要性和利用的便捷性,同時其采集、揭示、保存的復雜性、風險性、高費用性,以及網絡資源的易逝性和不可再生性等特點,已引起圖書情報專業人員和政府管理人員的高度重視,同時可看到,從國家層面成立管理部門,跨系統、跨部門、跨學科解決數字資源“三共”問題已刻不容緩。
2019年出版的由全國科學技術名詞審定委員會公布的《圖書館·情報與文獻學名詞》(以下簡稱“《名詞》”)一書中有以下定義:“數字資源是指以數字形式存取、發布和利用的各種文獻、數據等資源的總稱”[7]。數字資源不僅是指數字化的公開正式出版的圖書、報刊,也是指重要機構自己產生出的尚未公開出版的科學數據、方案、報告以及活動、利用這些資源所產生的資源等。各行各業均產生數據或數字資源,包括各種數據庫、機構庫、開放獲取(Open Access,OA)資源等。
電子資源這一術語未被《名詞》收錄,僅出現“電子出版物”。但電子資源一詞被經常使用。實際上,電子資源的內涵更加寬泛,不僅包括數字資源,還包括視聽資料,如早期的電子書和電子刊等。相對來說,數字資源的概念較新,而電子資源(電子出版物)的概念在早期計算機應用時就已存在。數字技術出現后,提及數字資源的比較多。據筆者團隊對公共圖書館、大學圖書館網站中這兩個術語使用情況的統計發現,公共圖書館使用數字資源這一概念較多,而大學圖書館通常使用電子資源。當在同一文本中數字資源和電子資源兩者同時出現時,二者內涵上需要加以辨析;若非同時出現,兩者在界定上不會有太大差別,通常可以互用。
文獻信息資源、文獻信息或文獻資源包含印本資源和數字資源。如《中華人民共和國公共圖書館法》中規定,文獻信息包括圖書報刊、音像制品、縮微制品和數字資源等。又如“中國高等教育文獻(資源)保障系統”,這里的“文獻(資源)”既包含印本資源,也涉及數字資源。
信息與數據是圖書情報學、信息科學、計算機科學等學科的兩個基本術語,是構成學科的核心概念或范疇;信息與數據的本質,近年來除圖書情報學外,法學、信息哲學等學科的一些學者也在積極探討。在近期剛頒布的《數據安全法》中,數據是指任何以電子或者其他方式對信息的記錄。數據是記錄信息的,還有其他非電子等方式記錄信息的。國家頒布的《個人信息保護法》中指出,個人信息是以電子或者其他方式記錄的與已識別或者可識別的自然人有關的各種信息。但近期出臺的《深圳經濟特區數據暫行條例(草案)》,使用“個人數據”,而未用“個人信息”的概念,說明在立法部門,對信息與數據關系的理解尚未取得共識。
筆者于2017年曾發文討論信息與數據的邏輯關系和DIKW概念鏈模式的局限性問題,對概念鏈提出了修正方案[8]。筆者認為,信息是所有事物的存在方式和運動狀態的反映,即本體論信息,它無處不在,無時不在,有的已被人類所認識,有的則尚未認識。已被認識的信息是認識論信息。數據是通過聲音、語言、體態、符號、文字、信號、圖形、視頻反映的認識論信息。它僅是認識論信息中一種類型,包括“有意義、有價值、有關聯”的數據(狹義的信息)和暫時沒有意義、價值、關聯的數據。數據是信息的子集,更準確地說是認識論信息的子集。在DIKW概念鏈中的“信息”卻是數據的子集,實際上,這里的“信息”非廣義的本體論或認識論信息,而是狹義的信息,即有意義、可用的數據。修正的概念鏈可為“本體論信息-認識論信息-數據-狹義信息-知識-智慧”。當文本中出現“信息”一詞時,結合上下文(語境),分析其是廣義還是狹義的含義,對正確理解信息與數據的關系至為重要。
進一步追問,可能還存在一些問題。如信息與數據、信息與文獻一般認為它們都是從屬關系(如信息資源包括文獻資源),但仔細考慮似乎交叉關系更為恰當,因為文獻是載體,數據是記錄在載體上的部分信息。從圖書情報學科來看,文獻是記錄以知識或者準知識的信息為主的一切載體。近年來ISO有關文獻的各種標準中,題名都修改成“信息與文獻”,這里的信息,應理解成非知識或準知識的信息,才說得通。
“保障體系”不僅是儲備體系,而且是開發、利用體系。文獻覆蓋與文獻總量相關,而文獻保障不僅與覆蓋相關,而且與用戶需求相聯系。“重構”指在原有基礎上根據新情況重新設計,不是憑空構建,而是“有中生新”的創新。數字資源的內容無變化,變化的是載體形式和技術手段,從這個意義上說,重構不是顛覆性的,主要是技術層面的應用和改進。如果認為新技術不僅是“工具理性”,而且是“本體理性”“認識理性”,那么將“重構”理解成顛覆性的構建,從這一點上說,也是可以理解的。“管理體制”是指組織構架、組成方式、手段、辦法等,是一個有機系統,其核心是管理機構設置。“機制”則是指體系內各要素間的相互作用、運作方式等。
我國一直以來對數字資源在內的信息資源保障非常重視,陸續組織和建立了“三大系統”的保障體系,如文化部的國家數字圖書館工程、數字圖書館推廣工程,目前又提出了建立“全國智慧圖書館體系”的設想。“2019年4月,國家圖書館啟動了互聯網信息戰略保存項目,在新浪建立了首個試點基地,對新浪全平臺內容進行系統保存”[9]。
科技部聯合財政部等六部門牽頭組建的國家科技圖書文獻中心(National Science and Technology Library,NSTL),21年來,逐步在全國建立了40個服務站,30個面向高校的用戶管理平臺,40個面向集團用戶的嵌入接口。每年訂購印本外文期刊17 000余種,其中國內獨家超過6 000種,訂購外文會議錄等文獻8 000余種。開通各類數據庫127種,涵蓋網絡版外文現刊2萬種以上,回溯期刊3 000余種。每年NSTL訂購的外文電子資源使用量超過6 000萬篇,按我國研發人員350萬人全時當量計算,每年為科研人員提供外文文獻人均17篇。每年基于印本文獻提供原文服務120多萬篇,形成了覆蓋全國的科技文獻服務體系[10]。
教育部的中國高等教育文獻保障系統(China Academic Library & Information System,CALIS)以及下屬的中國高校人文社會科學文獻中心(China Academic Humanities and Social Sciences Library,CASHL)、大學數字圖書館國際合作計劃(China Academic Digital Associative Library,CADAL)、高校圖書館數字資源采購聯盟(Digital Resource Acquisition Alliance of Chinese Academic Libraries,DRAA)等,22年來,這些系統平臺已建立印本資源和數字資源的共建共享系統,1 300多家成員館從中獲益。“CALIS還開創和建立數字資源集團采購模式,并通過年度數據庫培訓周規范和指導高校圖書館的外文數字資源深化利用”[5]。
總體看,各大體系在印本和數字資源建設方面均有十分突出的成績,在各自系統內均取得了重大進展,作出了重要貢獻,在數字資源保障和滿足人們數字資源需求方面正在探索新的發展路徑,推出新的方案,進行積極的改革。
(1)數字資源定價越來越高,種類和數量逐年增加,圖書館采購經費相對不足。2020年《政府工作報告》強調“各級政府必須真正過緊日子”,圖書館需開源節流,貫徹落實“過緊日子”部署,很多圖書館面臨經費縮減的問題。圖書館采購經費的增長趕不上數字資源上漲的幅度。
(2)數字資源的覆蓋面不清,較大規模的全國性用戶需求調查長期未做。數字資源覆蓋面、保障率的頂層設計很薄弱,僅在宏觀層面有所考慮,但跟實際業務相關的還不夠。
(3)數字資源的揭示不深、不準、不快、不統一,各館對數字資源的統計及其數據質量控制這一非常重要的基礎工作做得不夠好。缺乏全國性數字文獻利用統計平臺和動態更新數據庫等。數字資源的利用數據統計不全,直接影響了采購決策的制訂。此外,《國家信息化發展戰略綱要》中提及我國信息資源開發利用不足與無序濫用的現象并存,這在數字資源保障中也是個重要問題。
(4)數字資源合作長期保存盡管已開始布置,與國外出版商也簽訂了一些長期使用協議,但從總體看,還沒有從戰略的高度對數字資源長期保存進行規劃和設計,經費投入不夠,措施不得力,高校數字資源長期保存僅占比60%。全國性數字資源戰略儲備庫尚未建立。
(5)各類公共性、基礎性數字資源開放總目錄尚未編制,存量的開放全國聯合目錄報道不及時。各類型數據庫的總目錄及其子目、數字資源在內的信息資源每年增量的協調目錄、紙電數資源統一目錄、重要數字資源目錄等尚未編制或連續報道,“家底”不清。
(6)組織保障薄弱,缺少一個強有力的全國性跨系統、跨部門、跨學科、跨地區的常設領導班子。以往國家成立過跨部門的圖書情報協調委員會,如全國部際圖書情報工作協調委員會文獻資源專業組,盡管召開過會議對相關議題進行探討,但因成員變動等因素,且近年來似乎沒有活動,效果不大,不了了之。全國性跨系統、跨部門、跨學科、跨地區統一的圖書館數字資源共建共享的協調薄弱,且進展不大。盡管NSTL與CALIS有文獻傳遞協議,二者與國家圖書館、上海圖書館也有一些合作,但開展的實質性協作并不多,成效不明顯。
國家對信息資源建設已有總體設想:“要加強頂層設計和系統規劃,完善制度體系”“加強信息資源規劃、建設和管理。推動重點信息資源國家統籌規劃和分類管理,增強關鍵信息資源掌控能力。完善基礎信息資源動態更新和共享應用機制”“建立公共信息資源開放目錄,構建統一規范、互聯互通、安全可控的國家數據開放體系,積極穩妥推進公共信息資源開放共享”“加強采集管理和標準制定,提高信息資源準確性、可靠性和可用性”[11]。目前亟需貫徹落實國家層面的信息資源建設總體設想,增強各單位的責任感、使命感和緊迫感,加強各區域、各單位、各部門之間的密切聯系和統籌協作,切實解決信息資源建設過程中的“難點”和“痛點”,能拿出應對方案,積極推動各項信息化政策的執行與落實。
早在1957年就有《全國圖書協調方案》,在國務院科學發展委員會下設立“圖書小組”,進行統一管理。北京圖書館(中國國家圖書館前身)和上海圖書館為第一、第二中心圖書館在協調中發揮了很大作用。一些知名的圖書館學專家積極參加。主要負責采集資源分工、資源調撥,如北京圖書館側重外語文獻、一般科技文獻的收集,而中國科學院等則收集專門的科技文獻;北京圖書館負責編制各類型書刊的聯合目錄,制定標準、規范,開展館際互借、培訓干部等,掀起圖書館事業發展的一個高潮[12]。
20世紀90年代,筆者與同行組織全國高校外文期刊訂購協調網,除高校圖書館參加外,北京圖書館、上海圖書館等公共圖書館,中國科學技術情報研究所(中國科學技術信息研究所前身)、中國科學院文獻情報中心等都主動、自愿參加高校的協調會議。相關工作為外刊采購節省了大量經費,經濟效益明顯;同時培養了一批資源共建共享的專業人才,社會效益也非常顯著[13]。這說明各個系統的圖書館對跨系統的協調、協作是非常愿意的。目前新技術的發展為跨系統、跨部門共建共享的管理工作提供了良好的條件,館員素質也有很大提高,理應能做得更好,關鍵是要有精心的組織和管理。
因此,數字資源保障體系重構,目前最重要的是要組織、落實管理體制改革,設立管理機構。建立跨系統、跨部門、跨學科、跨地區的全國統一的“信息資源管理協調機構”(常設機構);或在中央國家安全領導機構下設立專門機構,或在國家網信部門基礎上擴大權限,不論什么名稱,關鍵是要常設機構或建立聯合協調機制。除行政領導外,專家委員會至關重要,要有專家委員會(學者、圖書情報專家、技術專家)和具體辦事機構。學會、大館(中心圖書館)可發揮更大作用;下設各系統的聯盟、地區中心和基層單位,應統一規劃,聯合保障,分工、分類、分級保障。
(1)國家統一摸清數字資源現狀。長期以來,我國信息資源開發利用不足與無序濫用的現象并存。我國幅員遼闊,各區域信息保障體系發展不平衡,資源配置失衡,調查能力參差不齊,不利于資源調查工作的展開。避免因工作能力和特點的差異造成的波動,要求從國家層面出發摸清現有數字資源,并統一規劃開放的各類聯合目錄、分級目錄等的編制等工作,以便后續各個體系聯手展開工作,提高總體效益。
(2)每年定期召開全國數字資源訂購協調會議,擴大資源種類,減少不必要的重復。現存數字資源數量多、種類雜,各領域、各學科對于范圍內資源重要性的判定莫衷一是。各單位應聯合專家,對數字資源進行分類。公共性、綜合性、基礎性數字資源,即三大系統或面向全國的讀者的一些資源,應由國家統一評選、采購,實行“國家許可”制度,以最大限度的節省經費和利用面。而非公共性資源,各系統、各部門、各圖書情報機構所需要的個性資源仍然需要采集。要明確資源建設不僅是本單位的事情,更關乎國家戰略的發展。針對各單位某些特色資源,也要落實分工負責的原則。
(3)加快制定數字資源揭示的各類標準、規范。對于數字資源建設而言,統一標準、規范的缺失是亟需解決的問題。盡管基層單位不斷出臺各類規范文檔,但工作量大,效率、質量得不到保障。我國信息資源建設人才濟濟,關鍵要分工負責、合理規劃、確定目標、選好或制定各類標準,從而讓各館、各體系快速找準自己的位置、規范工作流程、發揮整體優勢。
(4)采集統一的數字資源利用數據。數據不僅關系到第二年的采購決策,也關系到科技文獻、學者、期刊乃至大學的評價等。采集、清洗和規范統一的利用數據,在目前高校已有數據基礎上擴展到科研和文化等系統。
(5)統籌使用數字資源經費。隨著數字資源發展的日益成熟,使用量不斷提高。數字資源建設要求長期可靠的持續服務,網絡使用權模式時刻威脅著數字資源使用的可持續性。因此,國家要統籌劃撥經費,將OA論文發表經費與訂購經費合理預算,統籌使用數字資源經費,統一實施對公共性、綜合性、基礎性數字資源的長期保存和利用。專業性、地區性、特色性的數字資源仍由各單位長期保存。要明確長期保存的責任,促進流程推進和技術完善,提高長期保存率。
(6)建立統一數據安全應急預警、處理機制等。重構數字資源保障系統,必須把數據安全放在突出位置,制定對敏感的數字資源和利用數據的信息的保護辦法,定期發布“掠奪性數字期刊”“偽劣數字期刊”或網站、數據庫的預警目錄,對重大數據安全事件及時調查處理,健全相關法律法規,不斷提升數據安全意識和能力。
后疫情時代、逆全球化情勢、其他信息機構的發展等都對圖書情報機構提出了挑戰,但國家科教興國、建立創新型國家、大力發展數字經濟等戰略,人腦機、萬物互聯等新技術的發展,又給我們帶來了機遇,我們一定要及時緊緊抓住機會,主動迎接,團結一致,群策群力,加快重構我國包括數字資源在內的文獻信息資源保障體系,為我國的偉大復興和人類福祉貢獻圖書情報人的一份力量。