姜占峰

內容資源數字化是出版業實現數字化轉型升級過程中的基礎性工作。筆者結合人民交通出版社(以下簡稱交通社)5年來內容資源數字化建設的具體實踐,圍繞“選擇哪些資源數字化”“怎么數字化”及“如何做好保障”三個核心問題,對如何有效開展內容資源數字化工作提出思路和解決方案。
一、統籌規劃 確立建設目標
出版企業要從用戶需求出發,結合本單位實際,確立內容資源數字化建設目標。即:用戶導向,統一思路,明確重點,厘清職責,形成資源采集、加工、存儲、管理和發布一體化的數字資源建設業務流程,為產品開發、銷售和用戶服務奠定基礎。
按照這一思路,交通社確立了適應本單位實際的內容資源數字化建設目標,并重點在規范數據加工、制定加工標準、做好資源規劃和嚴格資源管理4個方面做好基礎工作。通過市場比價和競爭性談判,出版社確定了5家定點數據加工廠商,自主研發了元數據標準、存儲標準和結構化標準,制定了排版廠上交電子文檔規范格式和內容資源管理辦法,確定了資源建設的重點、核心和切入點,提高和規范了數字內容資源的質量。
通過近5年的數字化加工,交通社已積累建設8000余種可直接面向用戶提供閱讀服務的高品質電子書、120余萬個交通專業詞條等高質量的數字內容資源,開發推出了數據庫、U閱通等數字產品,上線了悅通網、交通標準服務網等數字出版平臺。
建立內容資源矩陣是比較好的資源建設規劃方式,有利于出版企業梳理資源現狀,明確建設路徑和切入點。
二、量力而行 明晰建設路徑
1.明確資源獲取途徑
在開展資源數字化之前,出版企業應首先對本單位現有數字內容資源的存放環境、數量、質量(完整性、準確性、及時性)、格式及存在的問題等,進行排查、梳理和總結。在此基礎上,通過以下4種途徑來進行內容資源建設:
(1)自主建設:主要通過對存量資源的外包數據加工和增量資源的外包開發制作兩種方式完成。
(2)作者提供:借助協同編輯系統,從選題策劃開始到交稿的全過程,由作者提供相關內容素材,并取得授權。
(3)外部購買:從滿足資源的完整性、權威性需求出發,通過版權交易方式,購買相關內容資源。
(4)交換引進:通過虛擬積分、信用等級等方式授予用戶一定的資源使用權,換取用戶上傳資源,并取得授權。
2.選取適合的切入點
(1)能較快產生效益的資源可優先。具體包括可直接產生經濟效益的資源、間接為紙質圖書做增值服務的資源、可以提升圖書產品競爭力的資源、能滿足用戶一定需求的資源。
(2) 數字化工序容易的資源可優先。包括制作原版原式數字內容資源、收集數字化素材、易于拆分的內容資源。
(3)核心的、重點的資源可優先。包括企業獨有的有充分競爭力的資源、有常銷價值的資源、符合戰略發展方向的資源。
(4)基礎好的資源包可優先。包括電子文檔保存質量高、完整、版本新、版權無爭議且易于維護更新的資源。
交通社在選擇數字內容資源建設的切入點上,以數字出版項目建設為抓手,把重點放在最核心的資源建設上。
3.制作適用的數字內容資源
(1)優先滿足用戶的需求。從用戶需求角度出發,滿足用戶對產品功能的需求。
(2)確定適合的數字化加工顆粒度。針對不同資源類型,結合用戶需求,分別加工成雙層PDF、單層PDF、XML、試題、條目等不同類型的數字內容資源。
(3)根據用戶閱讀需求,確定要加工的數字內容格式,分別加工成PDF、EPUB、MOBI、TXT、video、movie、tif等不同格式的內容資源。
三、規范實施 確保建設質量
1.資源建設,標準先行
資源數字化之前,要注意建立或選擇相應的元數據標準、分類標準、知識體系、加工標準、排版文件與封面文件交付標準、質量標準、存儲標準、結構化標準、數據架構標準(DTD)和資源管理標準等,作為數字化加工的規范要求。
2.分類標引,規范加工
(1)對已制作完畢的數字內容,按專業屬性進行分類和標引工作。
(2)對不同種類數字資源提出對應的技術加工要求。如要把圖書數字化加工成雙層矢量PDF文件,技術要求如下:
像素:彩色圖片不低于600dpi,普通黑白圖片或灰度圖片不低于 300dpi;
糾偏:校正的圖像允許的傾斜度不大于1度;
去污:干凈、整潔和美觀;
識別準確率:差錯率不高于萬分之三;
完整性:源文件統一,避免缺頁少頁多頁現象;
一致性:頁碼順序100%正確,文本和圖像對應一致等。
(3)在數字化加工前,針對不同種類內容資源,應確定不同的元數據規范。主要包括:圖書元數據、目次元數據、作者元數據、文章源數據、單頁元數據、附件元數據、腳注元數據、圖片元數據、視頻元數據、音頻元數據、參考文獻元數據、管理元數據、表格元數據、公式元數據等。
3.細致檢查,嚴格驗收
對存量資源進行數字化,應在規定的抽檢范圍內就文字、圖像、關聯關系、版式文件、流式文件等存在的差錯進行計算,并對交付的以下數據資料的完整性、準確性進行檢查,最后形成質檢驗收報告。包括:原始資料、加工規格、加工質量、加工周期、交付方式、交付日期、存儲介質、命名規則、數據實體、交付報告、交付清單、交付接收單、質檢報告等。
4.人員齊備,制度保障
出版企業在數字化轉型過程中,首先要配備的人員就是資源數字化專職人員,包括資源建設管理人員、質量檢查人員及驗收人員。同時,還應建立相應的管理制度,包括電子文檔管理辦法、內容資源管理辦法、資源建設合同管理辦法、數字加工廠商管理辦法、內容資源管理辦法等。
當然,在內容資源建設過程中,還一定要注意加工的內容資源要求版權有效、內容權威、內容更新及時等。數字化后的內容資源,像食品一樣有保質期。若無法在一定時間內形成服務能力,則投入資源數字化的時間、精力和金錢很可能就付之東流。因此,選擇用戶需要的、有效益的、核心的和易做的資源數字化,應是出版企業在實現數字化轉型升級過程中首要做好的基礎工作。(作者單位系人民交通出版社)