曾 潔
(廣州圖書館 廣東廣州 510623)
在大數據時代,圖書館趨向從環境、資源、服務、空間、內容等多個維度尋求新的平衡,在由“數據資源環境”向“知識資源環境”的轉變中建構新的知識組織體系,并在開放式的技術創新環境中開發數字圖書館空間的新功能,發掘內容資源的新價值[1]。利用人工智能技術將圖書館數字資源進行細顆粒度建設,對多元的知識內容進行結構化,讓資源實現充分互聯互通,為讀者提供人性化、專業化、智慧化的知識服務,是圖書館未來發展的趨勢。一直以來,作為圖書館資源的重要組成部分,視聽資源因受技術、存儲、管理等方面的制約,很難充分發揮其知識服務的功能。本文通過分析圖書館媒資管理現狀及存在問題,結合廣州圖書館建設公共圖書館智慧媒資管理平臺實踐,探討智慧媒資管理平臺對智慧圖書館建設的意義,為圖書館從傳統的數字資源建設向知識發現、知識組織、知識管理、知識服務轉型提供思考路徑。
媒資,即媒體資產,主要包括視頻、音頻、圖像、文檔等多種內容資產。這個概念最早出現在廣播電視行業,即電臺、電視臺等媒體機構生產的大量音視頻、圖片、文字等業務數據。媒資管理平臺,即結合計算機、互聯網以及多媒體技術,解決媒體資料的編目檢索、存儲與發布的平臺[2]。筆者在知網上以“圖書館媒資管理”分別為題名、全文、關鍵詞進行檢索,查到的文獻非常有限。最早開始在圖書館領域進行實踐探索和研究媒資管理的是浙江傳媒學院圖書館員阮海紅,其發表的論文《媒資內容管理實驗研究》從視聽資料載體的復雜多樣、介質保養存在的問題等方面對圖書館媒資管理的必要性進行了論證,分析了媒資管理系統的特點和功能,并通過規范元數據描述來創建獨具特色的數據庫,從而提升資源價值[3]。竺亞珍、馬惟哲在《高校圖書館媒體資產管理系統建設》一文中探討了適合高校圖書館的媒體資產管理系統,并從信息處理、內容管理、內容存儲和應用等方面分析了浙江傳媒學院建立的媒體資產管理系統[4]。錢靜在視聽資源儲存介質保存年限短、檢索和共享困難等方面分析了媒資管理的必要性,并結合淮安市楚州區圖書館實際應用,建立包括采集上載、編目檢索、存儲、應用發布等子系統在內的媒資管理系統,并就建設過程中注意的問題提出建議[5]。資料研究發現,圖書館建立媒資管理系統更多是為了解決視聽資源存儲、編目檢索、應用發布,但還未對視聽資源的知識進行精細化揭示和專題聚類,深度挖掘視聽資源的文獻價值。
廣州圖書館廣州紀錄片研究展示中心(以下簡稱“中心”)是中國第一家致力于紀錄片收藏、整理、研究、展示、服務的公共文化平臺,主要通過資源采購、社會捐贈、資源共享等方式建設紀錄片館藏資源。目前,館藏紀錄片資源4 000余部/集,其中音像出版類DVD介質的紀錄片約占90.8%,數碼格式的紀錄片占9.2%;與本地廣播電視臺共建共享的城市數字影像資源近兩千小時。因無專門的系統對紀錄片資源進行統一的數字化管理,導致中心館藏資源在存儲安全、版權管理、應用服務等方面受到很大制約。
(1)資源存儲安全風險。中心大量的音像出版類紀錄片資源仍然是依靠DVD、VCD光盤介質存儲,由于受環境影響和自身老化,有可能導致這部分存儲的影像質量下降,甚至數據丟失;一部分數字資源存儲于移動硬盤和服務器。媒體資源的分散性存儲,對數據庫的安全性和統一管理帶來風險和難度。
(2)資源版權管理風險。中心館藏的紀錄片及城市影像資源的版權在使用范圍、期限、播映次數等方面不盡相同,目前只能依靠人工對版權信息進行統計管理,但隨著館藏量的日益增長以及版權使用的多樣性,存在版權使用和管理的風險。
(3)編目較單一。目前館藏紀錄片資源均按照《中國文獻編目規則》和《中國圖書館分類法》進行編目。但是中心館藏中有一部分是與廣播電視臺共建共享的城市影像資源,這些資源中包括電視節目、新聞等,則按照《廣播電視音像資料編目規范》進行編目。電視資料部分的元數據項從上到下分節目層、片段層、場景層、鏡頭層四個層次,每個層次分別包含相應的元數據項。因此,有效統一、規范中心館藏資源的編目規則,對今后為讀者提供更精準、高效的查詢檢索尤為關鍵。
基于以上問題,在圖書館建立媒資管理平臺是一種行之有效的解決方法。調研發現,數字媒資管理平臺從功能、服務形態和應用方面已難以滿足精細化的知識服務需求。數字圖書館的服務模式要從提供文獻資源的檢索獲取利用向提供深層次多樣化的知識服務轉變,這就離不開各類智能技術的輔助[6]。因此,以人工智能為驅動的智慧媒資管理更符合智慧圖書館的發展趨勢:一方面,可使視音頻資料在從采集上載到發布下載的處理過程和工作流程上實現自動化管理,從而節約管理成本、人力成本和時間成本,讓媒資管理更為科學、高效;另一方面,對媒體資源進行細顆粒度智能標簽標引和專題聚類,可提升檢索效率和檢索結果的準確性,以及媒體素材的應用價值。數字媒資管理和智慧媒資管理的區別如表1所示。

表1 數字媒資管理和智慧媒資管理比較表
通過搭建廣州圖書館智慧媒資管理平臺(見圖1),實現對存儲在不同介質的視音頻等媒體資源的采集,并對編目元數據描述信息、版權信息等進行統一規范和管理。利用人臉識別、語音識別、文字識別、知識圖譜、語義網絡分析等智能計算技術,對媒資內容中的人物、機構、地點等進行識別分析并生成標簽,通過抽取關鍵詞來對標簽進行標引,實現資源的專題化聚類和精細化揭示。

圖1 廣州圖書館智慧媒資平臺建設流程圖
3.2.1 平臺框架
采用云平臺相關技術,構建包含軟件應用層、平臺服務層、基礎資源層在內的智慧媒資管理平臺(見圖2),并通過“平臺+工具+服務”的技術框架,將多元的服務和工具組合滿足不同的業務需求。采用分布式的流程設計,在現有基礎架構上,實現媒體資源、媒體數據、業務數據分級存儲。
智慧媒資管理平臺框架設計分三層:
(1)軟件應用層:媒體資源管理平臺在業務軟件上包括遠程回傳、文件上載、輔助技審、內容編目、檢索瀏覽、出庫下載、版權管理、近線歸檔、數據統計等功能。
(2)平臺服務層:提供媒體資源管理平臺后臺支撐和應用服務,包括分布式框架服務、負載均衡高可用服務、轉碼服務、技審服務、遷移服務、資源導入導出服務、資源歸檔服務、編目標引服務、工作流引擎服務、檢索引擎服務、分級存儲服務、接口服務等媒體專用服務。
(3)基礎資源層:主要包含計算資源、存儲資源及網絡資源。
3.2.2 資源采集
智慧媒資管理平臺通過工作站,對存儲在包括光盤、本地磁盤、網絡磁盤和移動硬盤等不同介質的媒體資源進行采集。收集獲取文件的元數據描述信息,并抽取文件 EXIF 信息等數據進行存儲記錄。采集過程中對視頻質量進行檢測,識別并標識所采集視頻資源中的彩條、黑場、靜幀等文件損壞情況。采集工作站支持VOB、DAT等光盤文件格式,以及MP4、WMV、MPG等常見數碼視頻格式和MXF、AVI、MOV等專業視頻格式,同時支持對4K、8K等超高清視頻的采集。
3.2.3 智能標簽標引
在智慧媒資管理平臺中,標簽是指視頻片段的關鍵詞集合。它通過智能信息提取和融合推理,將人物、地點、機構等類別的關鍵詞進行識別,輸出為對應視頻的標簽。標引是對視頻內容進行的一個賦予檢索標識的過程,點擊標引信息可以自動定位到呈現的具體一幀視頻。
智能標簽的形成經歷了輸入、處理、輸出三個環節。首先對生產過程數據、錄入數據和智能識別數據進行補充、轉換、分解或映射,形成標簽的基本元數據、版權元數據、內容標簽數據。其中,生產過程數據包括入庫時間、入庫者、入庫來源等信息,根據定義好的信息進行自動化編入目錄;錄入數據包括標題、版權、主題詞等,由人工錄入;智能識別數據則是通過語音識別、人臉識別和OCR識別獲得。語音識別是將視頻中的聲音進行連續語音識別并轉文字,進行語義分析,自動生成關鍵詞和入出點、自動摘要、自動分類等信息;人臉識別則是通過自動識別和建立人臉特征模型,標引視頻畫面中特定人物人臉位置,對人臉抽取特征后,用人臉特征模型進行身份確認;OCR識別是對視頻中文字區域進行識別分析,其結果包含視頻中的文字內容和對應的文字坐標信息。最后,經融合推理后的標簽輸出形成為內容結構化數據,包括節目、鏡頭、場景等分層結構化標簽。輸出的結構化數據可通過人工進行修正,修正的結果會作為學習的樣本重新帶回數據處理過程。利用智能計算技術生成精確到視頻內容片段的標引,生成對應的標記點信息,通過點擊標記點可以快速定位到標記點位置,系統還可自動將標引信息與人工智能信息庫比對校驗,確保定位到標記點位置的準確性。
3.2.4 編目元數據
在實踐中發現,傳統的著錄方式對視頻資源的揭示深度越來越有限,因此,廣州圖書館智慧媒資管理平臺的編目元數據在設計之初,從內容描述、技術參數描述和管理描述等方面,在《中國文獻編目規則》和《中國圖書館分類法》的基礎上,融合了《廣播電視音像資料編目規范》的著錄規則,即可對各種視音頻文件進行基于時間線操作方式的多級編目(包括場景層、片段層、鏡頭層),對所選媒體資源內容拆分的結構要求符合《廣播電視音像資料編目規范》。一方面可滿足各類紀錄片編目信息,另一方面可滿足與廣播電視臺共建共享資源的編目。
3.2.5 專題匯聚
平臺可對已進行智能化標簽標引的媒體資源進行重新聚類,形成主題化、專題化的分類揭示,從而實現智能化知識發現。館員可在后臺,按照自定義視頻分類,根據需要的關鍵詞,自動匹配標簽標引信息進行主題化、專題化的匯聚和展示,符合設置條件的片段或者文件自動形成專輯。專題匯聚技術應用是基于智能分析結果內容,分析結果根據大數據的同類匯聚,最終以關鍵詞與標題的提取進行匯聚呈現。例如,要建立一個與“軍事”相關的視頻專題,可以在系統后臺頁面創建專題,通過選擇智能匯聚,將包含有“軍事”標簽的視頻自動匯聚到創建的“軍事”專題中,大幅度提升了資源的專題分類管理和聚類揭示。
3.2.6 版權和內容安全管理
嚴格按照《中華人民共和國著作權法》和《網絡信息傳播權保護條例》,對紀錄片等視頻資源進行統一的版權管理。在平臺版權管理模塊,可自定義填寫資源的版權相關信息,包括版權方、責任人、版權類型、版權期限、版權使用區域等,也可批量對版權信息進行統一錄入,平臺還會根據版權授權期限進行自動到期提醒,確保資源版權管理的規范,避免版權使用風險。為防止涉敏內容出現在應用前端,可對媒資素材進行密級管理,并做公開、非公開、機密等權限的區分,確保資源內容的安全性。
智慧媒資管理平臺建設中需注意以下四個方面的問題:
(1)語音識別。在有限預算內,最好是對視聽資源的語種進行總體評估,從而選擇相應的語音識別功能模塊。比如廣州圖書館有一部分紀實影像資源是粵語,那么最好選擇以普通話、粵語為主的語音識別功能模塊。語音識別的語種模塊越多,所涉及的費用也必然會多,因此在項目開始之初,需將這部分費用納入到統籌規劃中考慮。
(2)存儲方式。如條件允許,最好在媒資管理平臺的建設上采取云存儲與本地存儲相結合的模式。因地方政策原因,廣州圖書館的資源要求存儲在政務云上,所以媒資管理平臺運行會受館內帶寬影響,也將對未來業務擴展帶來一定的限制。
(3)人臉樣本庫。為確保視頻中的敏感人物及相關場景、片段不會出現在讀者應用前端,需在平時視頻入庫時做好人臉樣本采集,不斷豐富人臉樣本庫。一旦發現問題可即時智能匹配搜索相關視頻予以封存。
(4)智能水印。在智慧媒資管理平臺中最好對視音頻數字化內容,尤其是源碼文件、高碼資源加注隱性水印,以保護版權的屬性,便于追溯素材的來源。
智慧圖書館是圖書館在新的技術環境下為滿足用戶新需求而產生的新型形態,是圖書館發展的方向,是智能技術和人文智慧的融合[6]。智慧媒資管理平臺建設,將發揮以點帶面的作用,通過智能手段深度挖掘視聽資源價值,對圖書館從以文獻檢索傳遞為主向以滿足用戶對信息利用多元化需求為主的知識服務轉變,具有探索意義。
圖書館服務就是要將這些大量的數字資源進行知識組織、知識管理和知識服務,而知識發現無疑是其中最重要的亮點[7]。智能標簽與編目元數據結合,讓知識發現更為全面和精準。智能標簽的優勢在于目標單一,對資源內容進行提煉、概括成為詞語,這種形式便于計算機進行統計性規律的挖掘與應用。標簽的劣勢在于僅用詞語描述,信息表達往往不夠精準、全面,細節容易丟失,復雜關系難以體現。編目的優勢在于結構嚴謹,有一套從管理、內容、技術指標等各個層面的完整體系對資源進行描述,但編目的劣勢在于著錄時往往思考維度單一,資源內容信息著錄不足,同時由于編目元數據的復雜結構,也不利于計算機的統計分析。
因此,智能標簽和編目有著很強的互補性,實際應用中二者的結合可為用戶帶來更好的使用體驗。當用戶需要查找某一具體資源,采用純標簽檢索方式查不到時,可以再聯合編目元數據內容進行聯合檢索、擴大范圍,提升信息查詢的全面性和精準度,從而提升圖書館知識發現能力。
在智慧媒資管理平臺中,每個內容標簽都是知識顆粒,都有它的作用域,即標簽標引與視頻畫面有著強相關。在一個內容單元內,精細化標注該標簽所對應事物在畫面上出現的多組入出點信息,即時碼信息。這樣的標簽在數據結構上會對應多組入出點信息,并可以時碼段方式進行展示,方便在找到素材后快速準確定位到檢索用戶最感興趣的鏡頭畫面上,不需對視頻畫面進行逐幀拖移查找,大大提升畫面定位效率。
圖書館除了采購大量的視頻資源,同時還需開展自制視頻的工作,如公開課、口述史拍攝等,如要對大量的視頻素材進行剪輯,智能標引可大幅度提升對素材的精準查找,使后期制作越發便捷。同時,館員在對視頻素材進行匯編時,標簽結合智能標引的應用,有助于館員高效完成匯編工作。智能技術與館員智慧的融合,將為讀者提供嵌入式服務奠定基礎,驅動圖書館的服務升級。
在智慧圖書館發展理念中,知識組織在知識和信息的獲取與交互方面扮演著重要角色。知識組織在前向資源驅動和后向利用導向作用下,通過知識挖掘、知識發現、知識融合、定制推送、智能搜索等多種智能技術,發現隱含在信息中的有用信息單元并組織成知識庫,然后提供給用戶,滿足用戶知識的需求,為用戶提供卓有成效的知識服務[8]。
基于資源內容和知識的智能聚類,就是依靠資源標簽的相似性對知識進行組織、融合。比如,用戶在瀏覽一個視頻中的鏡頭是廣州珠江,系統通過語音和OCR字幕識別出“廣州”和“珠江”兩個高價值標簽,用戶就可以通過這兩個標簽找到一系列包含有“廣州”“珠江”標簽的視頻,也就是在“廣州”和“珠江”間建立了知識體系聯系。未來,如果在不同標簽間建立關聯,基于標簽建立各類知識體系,形成上下位關系、平行關系,還可以形成更有價值的內容推薦。這種智能聚類功能將滿足用戶高層次知識需求,從而提升資源價值,增強用戶黏性。