徐 婷
(廣西壯族自治區桂林圖書館,廣西 桂林 541100)
2021年9月,《國家圖書館“十四五”發展規劃》正式發布,明確提出圖書館“智慧轉型”的戰略任務和建設全國智慧圖書館體系的總體構想。智慧圖書館是以現代信息技術驅動,以知識內容生產、組織、傳播和保存為核心,以業務流程與管理智慧化為基礎,以服務空間與服務形式高度知識化、智能化、融合化為特點的新型圖書館發展形態。在國家圖書館提出的“1+3+N”智慧圖書館體系總體框架中,打造知識資源集成倉儲、開發構建智慧圖書館管理系統和多維融合知識服務平臺是智慧圖書館的主體部分。其中,加強知識資源組織加工,提升數字資源管理與服務的信息組織工作將為智慧圖書館建設提供必備的基石。因此,積極探討圖書館信息組織工作如何應對智慧化轉型的挑戰,有助于促進智慧圖書館由概念構建走向實踐探索。
廣義的信息組織指的是人類社會信息活動中產生的信息、信息生產者、信息技術等信息活動要素的集合,狹義的信息組織則是指人類社會經濟活動中經過加工處理有序化并大量積累起來的有用信息集合。戴維民認為“信息組織是為了方便人們檢索、獲取信息而將龐雜無序的信息進行系統化和有序化的過程”。儲節旺等認為“所謂信息組織,就是人們根據信息本身的特點,運用各種工具和方法,依據一定的標準,對其進行加工整理、排列與組合,使之有序化、系統化、規律化、高級化,增強信息對象的表現效能和運用效能,以滿足人們信息需求的過程和活動”。一般來說,圖書館信息組織工作主要是針對已經組織好的信息資源(一次文獻)進行再組織(二次文獻、三次文獻等),包括信息搜集與選擇、信息分析與揭示、信息描述與加工、信息整理與存儲、為用戶提供信息咨詢服務等。
1.2.1 傳統圖書館信息組織模式。早期傳統圖書館的信息資源以紙質印刷體為主,信息組織模式以手工操作為主,根據分類法和主題詞表對文獻信息進行標引、描述和排序,以卡片式形成館藏目錄。信息組織的價值是通過信息的采集、加工、存儲向信息傳播、共享、創新這樣環環相扣的價值鏈(見圖1)來實現的。隨著20世紀60年代計算機技術應用于圖書館,產生了以機讀目錄(MARC)為標志的圖書館信息組織自動化階段,信息環境、信息需求和信息利用模式都發生了改變,圖書館信息組織的對象經歷了從文獻信息向情報信息再向網絡信息的迭代演化,從而引發了信息組織價值鏈各個環節的改變,為信息組織變革做準備。

圖1 信息組織價值鏈
1.2.2 數字圖書館信息組織模式。數字圖書館的誕生從20世紀40年代“Memex”概念雛形,到80年代虛擬圖書館的構想,再到90年代國際圖聯(IFLA)大會提出“數字圖書館”理念,經歷了里程碑式的發展。2000年,中國數字圖書館工程的實施標志著我國正式邁入數字圖書館行列。經過20年的建設和發展,我國已建成以國家數字圖書館為龍頭的數字圖書館體系,截至2017年,數字圖書館推廣工程覆蓋全國41 家省級圖書館、486家地市級圖書館,服務輻射 2 900 多個縣級圖書館,覆蓋全國公共圖書館的數字圖書館網絡體系全面連通。數字圖書館的信息組織范式更為復雜,對紙質書刊、光盤、磁帶、膠片、膠卷等原始文獻進行數字化存儲和網絡化組織,在資源描述方式上利用元數據、XML語言等使之成為數字圖書館可使用的數據。此外,依托公共數字文化工程,近年來全國各省級公共圖書館大力開展資源庫建設,已建成一大批諸如地方特色文化專題資源、地方革命文化專題資源、圖書館公開課、地方文獻數字化、地方特色音視頻資源等數字文化專題資源庫。
1.2.3 智慧圖書館信息組織模式。當網絡信息組織時代蓬勃興盛的同時,大數據分析、云計算、物聯網、區塊鏈、人工智能等新的信息技術不斷融入,推動著新一輪的信息革命縱深發展,這些新技術正在給圖書館賦能,孵化出智慧圖書館的未來圖景。目前已有深圳、佛山、東莞、廣州等地公共圖書館將智慧圖書館納入“十四五”規劃。智慧圖書館信息組織模式不再停留在信息加工和服務層面,而是以知識組織為核心,受“知識組織價值鏈”(見圖2)所驅動,將數字圖書館的服務上升到知識服務和智慧服務層面。知識組織系統在知識的發掘、揭示、關聯,以及價值評估、智能創造等環節發揮著特別作用。總體來說,未來智慧圖書館的信息組織將會更趨向于朝語義化、數據化、一體化、交互性等方面發展,信息知識組織系統的智能化重構將大大增強圖書館的應用功能和服務水平。

圖2 知識組織價值鏈
順應時代的發展,由科技進步和人民群眾日益增長的精神文化需求所推動的圖書館智慧化轉型使圖書館信息組織模式仍在日新月異地演化進行中,而信息組織的核心要素早已發生改變(見表1),主要表現為以下幾個方面。

表1 圖書館信息組織工作的變化對比
傳統圖書館信息組織對象最主要的載體形式是圖書、報紙、期刊以及地方古籍等紙質印刷館藏,隨著信息時代的發展,電子載體越來越多,數字圖書館的信息組織對象是以自建地方特色數字資源庫及外購或獲得許可使用的數據庫等數字館藏信息形式所呈現。未來智慧圖書館的信息組織對象則是以知識資源為核心的數據館藏,包括語義化詞表等基礎知識資源、各類文獻細顆粒度標引的知識元、用戶使用行為數據、用戶知識交互及評價等數據。
過去的數字圖書館是為了便于長期儲存大量文獻的需要,運用數據庫、元數據、搜索引擎等技術手段對文獻資源作數字化和可視化處理,但信息組織方式大多呈現為線性結構,即采用分類法和主題法進行信息內容編排,按照資源類型、數據庫列表等形成數字圖書館目錄,用戶通過查詢檢索仍是源于數字文獻資源獲取信息。智慧圖書館則是對數字化的文獻資源深入做數據化的知識元加工處理,通過對知識元(如地名、人物、事件等細顆粒度標簽標引)的揭示、重組與關聯構建出一個多維互聯的信息系統,從而實現大數據網絡合作下的知識轉化、交換和傳播以及融合效應,用戶可直接源于信息獲取知識,獲得真正的知識智能服務。
傳統圖書館信息組織有相對封閉且獨立的文獻壁壘,館際間的資源共享礙于地域、時間等因素難以實現。而網絡技術的發展促使現代圖書館的改革建設,信息組織由封閉轉變為開放。在數據開放的環境下,通過技術手段為公眾提供一站式“文化信息資源的聚合和展示”,從而實現信息資源的共享。例如,國家公共服務云平臺將各省級公共圖書館和地方數字圖書館的公共文化資源匯聚、整合到全國公共文化數據中心統一的云目錄中,同時,省級圖書館數據管理平臺也可以接收和獲取國家公共服務云平臺的相關資源與服務數據。在這個龐大的信息組織網絡系統中,圖書館的館藏資源及其他信息資源都可以通過關聯數據發布,各館不再是一個個信息孤島,而是成為關聯信息的樞紐,從而實現館際智能聯合檢索和信息組織的互聯互通。
傳統圖書館信息資源獲取渠道單一,且屬于被動服務,用戶獲取信息的時間與成本相對較高。為適應網絡時代公眾獲取資訊方式的變化,目前,我國一些公共圖書館在積極探索“互聯網+公共文化”信息服務模式,如江蘇省建設和完善中的公共圖書館大數據服務平臺,其目標就是對全省公共圖書館及大部分基層點的業務數據、館情數據的采集、加工和整理,并通過大數據分析,為全省用戶提供一站式網絡數字化的資源展示和應用服務。中國國家圖書館在智慧圖書館體系下計劃構建的多維融合知識服務平臺則是將知識生產全產業鏈協同貫通,建立標準統一、多元參與的“知識淘寶”,將信息服務變被動為主動,為用戶提供全渠道、多終端、個性化、智能化、專業化的信息服務,極大提升信息服務效能。
雖然我國在公共數字文化建設方面取得了階段性的進展,全國公共圖書館的數字資源庫群初具規模,數字服務網絡基本成型,但距離“智慧化”尚有較大差距,主要表現在以下幾個方面。
3.1.1 館藏資源數字化不完整,數字資源版權待完善。許多公共圖書館在進行數字資源建設的過程中,外購的數字資源庫、在線數據庫占比較大,自建館藏數字資源較少,容易出現同質化、類型單一、針對性不強、易用性不高等弊端。還有一些已經數字化的自建資源沒有徹底解決好版權許可問題,在服務邊界方面缺乏法律確權和技術保障,尤其是2021年6月1日新修訂的《著作權法》正式實施后擴大了保護作品的范圍,對“合理使用”有了更嚴格的限定,并對著作權人的權利內容與權利歸屬作出進一步的修正,使得圖書館數字資源建設也要隨之完善和改變。
3.1.2 各類數字資源基于知識內容的描述、揭示度不高,缺乏關聯性。數字圖書館信息組織方式正處在以文獻作為基本著錄單元的階段,因此仍然屬于粗粒度的信息表達,而基于元數據的知識表示方式不能完全解決語義異構問題,更不能系統揭示知識之間的語義關系,難以形成具有關聯性的知識圖譜,不利于用戶對知識資源的全面掌握和深度挖掘。
3.1.3 資源利用向服務能力轉化不足。由于公共數字文化服務是新時代的產物,很多公共圖書館存在“重建設、輕服務”的現象,對如何利用本館海量的數字文化資源并進行有效的推廣與傳播缺乏經驗。而且,信息服務平臺采取的是自上而下而不是以用戶需求為導向的資源供給模式,跟不上當前公眾知識需求的變化速度,導致資源訪問和獲取率不高,數字化服務就難以產生大規模的用戶群體。
信息組織數據化就是把信息中包含的有意義的知識元轉化為計算機可識別、計算、分析、重組的結構化數據的過程。它是建設智慧圖書館的核心內容,為圖書館的智慧管理和智慧服務提供堅實的數據基礎。智慧圖書館對數據進行有效的聚合和關聯,是實現圖書館“物物相聯”“人人相聯”“人物相聯”的重要支撐。
3.2.1 在資源管理上形成知識關聯的館藏資源體系。智慧型信息組織可以利用知識內容內在的邏輯機理,依靠大數據技術分析各個知識元之間的相關屬性,深入挖掘知識內涵,建立諸如同義關聯、類目關聯、關鍵詞關聯、檢索關聯等知識關聯方式,將各類知識組織聯通起來,加以整合利用。因此,知識標引建設與數字資源建設必須相輔相成。圖書館應利用語義網、大數據、智能計算等技術,對已數字化的地方特色文獻、古籍、公開課、專題片等館藏資源進行細粒度內容標識、關鍵知識點的標簽標引建設,完成館藏資源的語義標注及聚合,構建內容精細化揭示,多維度、多層次、多粒度的館藏資源體系,實現對資源價值的深度挖掘及智能化,從而為用戶提供信息資源的知識化、專題化服務。
3.2.2 在信息服務上建成一體化的知識圖譜服務體系。如何為用戶提供準確的、個性化的知識服務是未來智慧圖書館信息組織工作的目標。在大數據時代,數據服務模式將因信息顆粒度細化而產生更加智能化的知識圖譜服務。知識圖譜的應用價值不僅局限于由關聯數據模型構建而成的網狀知識庫,還能夠提供與實體交互的智能問答、決策分析、常識推理等智能化應用。通過對館藏數字資源和更多動態性異構網絡數據資源進行面向知識圖譜的深層次標引,實現智能度更高的知識推送和知識應用,能夠有針對性地為用戶提供其所需要的“知識干貨”,最大限度地滿足用戶對知識的全面感知。一體化、智能化的知識圖譜服務體系還將打破單向輸出的知識屏障,體現出用戶參與式架構,進行知識協同共享交互、用戶間的知識分享等,在人機協同的大數據智慧機制中建立人與資源、資源與資源、人與人之間的知識鏈接,實現智慧情境下的知識服務功能。
智慧圖書館信息組織數據化是一項量級龐大的工作(見圖3),必須建立在數字資源的基礎上。圖書館應構建統一規范的數字資源體系,對數字資源內容進行管理,拓寬數字資源的來源渠道,圍繞圖書、期刊、報紙、古籍、音視頻等多種類型數字資源開展知識資源精細化標引、知識組織與新型數字資源建設工作。而“千里之行,始于足下”,地方圖書館首先要有針對性地挖掘地方特色文獻及文化資源,分主題或以專題性數據庫的形式確定數據加工的范圍,并加強版權管理意識,積極解決版權遺留問題,優先選擇已經獲得版權許可的數字資源。

圖3 智慧圖書館信息組織工作流程框架設計
智慧化的信息組織是利用知識關聯方法建立起的知識元集成信息組織系統。由于進行精細化標引的基礎文獻中存在的知識元數量龐雜、分散,且具有跨學科和交叉領域的特點,知識加工整理應遵循以下步驟:1)基于人工智能綜合分析加工對象的文獻形態、內容結構和服務需求,采取科學合理的分類和詳細的標引措施。2)基于深度學習在自然語言處理、文本挖掘領域的定制化需求,確立知識抽取規范和抽取辦法,形成知識抽取模型。3)利用信息語義分析工具、數據模型等知識抽取技術完成集約化的知識元標引,在技術的應用過程中需加強人工干預進行質量審核監控,以保證獲得高質量的知識抽取數據。4)碎片化知識資源體系重組。利用知識內容內在的邏輯機理,依靠大數據技術識別各個知識元之間的相關屬性,解析知識數據的內涵信息,建立諸如同義關聯、類目關聯、關鍵詞關聯、檢索關聯等知識關聯方式,將各類知識數據聯通起來,形成知識圖譜。
智慧圖書館信息組織的數據管理包括數據分類、數據聚類、詞表建模、本體建模、知識建庫、數據封裝、數據存儲等。管理對象則分為元數據庫、全文數據庫、知識資源庫、本體模型庫、詞表庫、電子圖像庫等。其中,元數據作為“描述數據的數據”,在圖書館信息組織中發揮著重要作用。智慧圖書館應支持不同類型資源元數據的一體化、全周期的建設與管理,使元數據具有良好的互操作性及可重用性,滿足“一次生產多次利用”的使用需求。為保證日后數據使用的延續性和知識更新的迭代性,還應采用一定的數據識別機制對不同來源、不同格式的元數據進行去重、補充、整合及語義關聯,帶動深層次的智慧協同開發與利用,實現對數據管理業務流程和系統功能的整合。
智慧圖書館將為用戶提供基于知識圖譜的信息服務,主要包括:實現語義搜索,使Web從網頁鏈接向概念鏈接轉變;支持內容聚合、精確定位與可視化檢索,不同文獻類型實現細分的垂直場景檢索功能;利用分布式全文檢索技術對內容進行高效的全文檢索,確保信息的檢全性與檢準性;支持智能問答系統,以準確的自然語言為用戶提供咨詢解答;支持全終端無障礙閱讀,并在嚴格的權限控制體系下實現數據安全保護;基于文獻數字資源、多源異構數據的融合、業務管理數據、資源利用數據、用戶行為及偏好等海量數據,進行多維化的大數據統計分析與決策,為用戶做出精準的智能推薦,使用戶獲得更有深度與廣度的信息資源等。這些都對圖書館信息服務平臺的智慧化升級提出了更高的技術要求,是我們下一步要努力實現的目標。
在全國大力推動圖書館智慧化轉型的形勢下,圖書館信息組織工作經歷著從數字化向數據化升級的變遷,面臨的既是困難和挑戰,也是巨大的發展契機。盡管“智慧圖書館”目前尚沒有標準的實體對象作為參照,但我們要充分利用大數據時代下的新技術,探索圖書館信息組織工作未來發展路徑,為公眾提供高質量、個性化、實用便捷的知識服務,助推我國智慧圖書館事業不斷向前發展。