
摘要:在數字出版迅速發(fā)展的形勢下,傳統出版社為了掌握電子書生產和銷售的主動權,應建立起一套完整、高效、低成本、兼容性強、與紙質書同步的電子書生產線,從而能夠在瞬息萬變的數字出版浪潮中占據主動。
關鍵詞:數字出版;電子書;生產線;XML
隨著數字技術的發(fā)展,信息的傳播方式發(fā)生了革命性的變化。作為全媒體時代圖書內容傳播的重要載體,電子書越來越受到傳統出版社的重視和關注,甚至將其提升到了和紙質圖書同樣重要的戰(zhàn)略地位。因此,傳統出版社建立起一套完整、高效、低成本、兼容性強、與紙質書同步的電子書生產線,不僅能夠支持未來跨終端、多層次的規(guī)模化數字產品開發(fā),拓展產品營銷渠道,還可以推動出版社產品結構和經濟結構轉型,在瞬息萬變的數字出版浪潮中占據主動。
一、傳統出版社電子書生產面臨的主要問題
傳統出版社作為內容資源的組織者和加工者,最擅長的是紙質圖書產品的制作和傳播。在面對電子書這種新的產品形式時,往往因為各種因素的限制陷入一籌莫展的“窘境”。目前,傳統出版社生產電子書面臨以下四個主要問題。
1.內容資源儲備難以滿足電子書生產需要
紙質圖書的排版源文件就是生產電子書的“米”,排版文件的質量和數量決定了電子書產品的品質和規(guī)模。傳統出版社收集圖書排版源文件主要有兩個問題:一方面是舊的圖書排版源文件丟失嚴重,資源不全的現象十分嚴重;另一方面是排版源文件格式不一,給電子書生產造成了一定的技術困難。
2.生產環(huán)節(jié)無標準可循,質量難以保證
從圖書排版源文件的收集,到PDF和TXT格式文件的轉換,再到圖書深加工(碎片化)、多格式電子書生成等環(huán)節(jié),目前都沒有詳細的標準可循,難以與國際和國內主流平臺接軌,給電子書的傳播造成了一定的困難。同時,傳統出版社的電子書制作流程都是單線加工,人工干預程度高,生產效率低,電子書質量難以保證,也難以形成規(guī)模化生產。
3. 產品格式單一,未實現內容碎片化
目前主流的電子書有PDF、EPUB、CEBX、OCF、MOBI、TXT等多種格式,但一般傳統出版社電子書技術加工的軟硬件水平,只支持生成PDF和TXT兩種電子書格式,難以滿足多渠道、跨終端的閱讀需求。即使是通過委外加工生產出多種格式的電子書,也未真正實現圖書內容的結構化、碎片化,不能把圖書中的圖片、篇章、條目等資源抽取出來深加工后應用到各個終端的產品中,難以實現資源復用和按需出版。
4.版權保護機制不完善
版權保護是電子書的生命線。目前大多數傳統出版社的電子書產品,主要是由渠道合作方通過其電子書發(fā)布平臺提供的數字版權保護技術(DRM技術)進行保護。這使出版社面臨著兩個問題:一是由于加密技術完全由渠道商掌握,出版社喪失了對電子書銷售的控制權,在發(fā)生分歧時容易被對方挾制;二是各個渠道商的版權保護技術參差不齊,互相之間還存在技術壁壘,不僅很容易被破解,而且不能滿足一次加密多平臺發(fā)布的要求,無形中增加了版權保護的成本。
二、電子書生產線設計原則
探究產生上述問題產生的原因不難發(fā)現,資源、技術和制度是制約傳統出版社開發(fā)電子書產品的三大瓶頸。因此,傳統出版社電子書生產線的設計應遵循以下幾項原則:
1.對源文件格式的高兼容性
靈活運用多種數字加工轉換工具和技術(如針對方正排版文件的方正經典結構化加工工具和方正暢流系統、針對XML文件和TXT文件的XSLT轉換技術及針對紙質書的OCR掃描識別技術),使方正書版、方正飛騰、Adobe InDesign、Adobe Illustrator、PageMaker等軟件格式的源文件均能進行數字化加工,解決圖書排版源文件格式種類繁多、舊的圖書排版文件流失嚴重的問題。
2.數據交換格式標準化
圖書進行數字加工后,其內容和元數據均以XML格式存儲。以XML格式存儲的電子書,可以快速便捷地轉化成任何格式的電子書,也可以通過對XML文件的精確定位,迅速準確地分離出需要的信息碎片,實現真正的圖書內容碎片化和按需出版。XML文件的結構標準,應符合國家提出的“走出去”的戰(zhàn)略,采用國際通用的圖書文檔描述標準(例如DocBook標準),除了支持生成國內的OCF和CEBX等電子書格式,也應支持國際通用的EPUP、MOBI等電子書格式。
3.生產方案差異化
針對不同的圖書類型和市場需求,應采用差異化的生產方案。一方面,圖書類型不同,最終電子書的格式種類和碎片化的“細粒度”均不同,如暢銷書應轉化為多種格式,拆分到章節(jié)即可,而工具書則應拆分到條目;另一方面,出版社應在完成生產線核心環(huán)節(jié)設計、主要平臺搭建和重要標準制定的前提下,根據電子書生產任務的工作量大小、難易程度和時間緊迫性等因素,靈活選擇自主加工或委外加工的生產方式。
4. 安全性與開放性相結合
根據國家提出的“文化安全”的要求,應通過數據庫加密技術和XML、PDF、EPUB等格式文檔的加密技術為電子書的生產和發(fā)布提供全方位的數字版權保護。同時,通過靈活的安全控制技術,適時適度地免費開放部分內容和功能,加強電子書對各平臺的兼容性和操作的便捷性,以改善讀者的閱讀體驗,擴大內容傳播范圍。
5.與紙質圖書高度同步
電子書與紙質圖書分別承擔著滿足讀者不同閱讀體驗需求的任務,不是相互矛盾的兩種產品形態(tài),而是相輔相成的。因此,電子書的生產要與紙質書做到兩個同步:一是圖書元數據和內容同步,電子書加工用的元數據和排版文件要在圖書下廠付印后獲取,這樣就確保了電子書的產品信息和內容與紙質書完全一致;二是時間同步,即電子圖書能和紙質圖書同步出版,互相擴大影響。這就要求從管理手段和技術手段兩方面下功夫,改進電子書生產流程,在各個環(huán)節(jié)上做到精確控制時間,實現批量的流水線生產。
三、搭建電子書生產線的具體方法
傳統出版社搭建電子書生產線,在遵循以上設計原則的同時,還應結合自身情況和產品特點,在具體方法上大體完成以下五個步驟:
第一步,分析圖書資源類型,根據需求在生產流程中制定不同的生產路線。(生產線框架見圖1)
第二步,制定生產流程中重要的規(guī)范標準。電子書生產流程中主要涉及三個重要的規(guī)范和標準:一是XML文件的結構規(guī)范標準,二是電子書相關文件的文件夾結構標準,三是加工質量標準。標準制定得是否嚴謹規(guī)范,直接決定了電子書產品的質量。
第三步,搭建電子書生成和存儲平臺。平臺主要實現以下功能:一是從出版社ERP系統中實時抓取圖書元數據的功能;二是圖書封面、插圖、正文的排版源文件、PDF文件、XML文件、TXT文件等基礎性文件的入庫、管理、檢索、輸出功能;三是在資源庫中整合各種基于XML文件的電子書轉換工具,實現從XML文件到各種電子書格式快速、批量轉換功能;四是各種格式電子書的存儲管理和輸出功能,一次轉換,重復利用。
第四步,制作電子書基礎文件。TXT、PDF、XML等電子書基礎文件是生成各種格式電子書成品及資源深度應用的基礎。制作基礎文件的原始資源分為紙質圖書和排版文件。紙質圖書的加工流程包括紙書驗證、紙書掃描、圖像處理、OCR識別校對、XML標記添加、插圖處理、圖文匹配、質檢等環(huán)節(jié)。排版文件的加工流程主要包括電子文檔驗證、XML標記添加、插圖提取、圖文匹配、質檢等環(huán)節(jié)。
第五步,電子書基礎文件入庫,進行電子書的制作生成。將加工完成后的電子書基礎文件輸入資源庫,用平臺中整合的XSLT轉換工具等對基礎文件進行轉換,生成最終的電子書成品。
四、結語
電子書生產線是數字出版的基礎性平臺,傳統出版社搭建子書生產線,是一個大投入卻未必短期能見到成效的工作,需要長期積累和探索。很多業(yè)內專家將傳統出版社發(fā)展電子書業(yè)務稱作“在刀尖上跳舞”,看上去很美,但風險很大。然而,數字出版代表了出版行業(yè)最先進的生產形式和未來的發(fā)展趨勢。因此,傳統出版社要堅定信心,做好數字出版的基礎工作,為迎接全媒體數字出版時代的機遇和挑戰(zhàn)做好充分的準備。
(劉鯤翔系北京師范大學數字出版中心技術部主任;邱戀系北京師范大學數字出版中心數字編輯;畢海濱系北京師范大學數字出版中心副主任)
參考文獻:
[1] 中國新聞出版研究院.2010~2011年中國數字出版年度報告[R].第四屆數字出版博覽會,2011-07-19.
[2] 萬玉云.淺談傳統出版社的全媒體數字出版[J].中國編輯,2012(2).
[3] 郭亞軍.基于用戶信息需求的數字出版模式[M].北京:世界圖書出版公司,2010.