新聞出版總署署長柳斌杰在2010年初提出,未來10年我國將努力實現從出版大國向出版強國的轉變。這一目標的實現,需要有各種支撐條件,標準體系的建立就是其中的重要基礎條件。
對于數字出版行業而言,數字出版標準化,有利于數字出版鏈條上的參與各方實現利益均衡,分工合作,整體降低成本,用有限的資源實現效益的最大化,實現技術兼容、數字內容的互聯互通和共享。
對于一個市場中的競爭主體而言,構建市場中的標準是體現其地位的標志,也是進一步鞏固其壟斷市場地位的一種重要策略。
對于一個傳統出版機構而言,標準的確立意味著未來可以方便與合作方(移動終端、內容集成商等)的數據交換。傳統出版機構進行數字化時有這樣的困惑,以前排版生成的電子文件不能直接發布出來,也不能直接應用在移動終端瀏覽,要應用的話必須投入資金進行數據化加工,不同的應用需要加工成不同的格式(pdf、html、epub、txt),所以傳統出版機構希望能夠通過數字化的加工,實現多渠道應用。
數字出版標準的困惑
“一次加工、多渠道應用”是數字化的一個目標,但是,很多出版機構都很困惑,要把經過排版的電子文檔加工成什么樣子,才既能在電腦上用又能在手機上用還能在電子書閱讀器等移動終端上用;描述資源的基礎元數據是什么結構,需要哪些元素,這些元素要怎樣定義等。在國內,數字出版屬于剛興起的業務,并沒有成熟的標準,有Ceb、Caj、Cebx、Epub等幾十種格式。傳統出版機構文件資源有:方正書版(7.0、9.0、9.1、10.0、2008)、方正飛騰(4.0、4.1、5.0)、Indesign、Pagemaker、Latex、Quark等排版軟件生成的文件。如此眾多的文件類型怎樣進行標準化,困惑自是當然的。
數字出版標準的現狀
數字出版相關業務的標準,一般分為基礎的技術格式標準及數據結構標準兩個層面。
XML是英文eXtensible Markup Language的簡稱,翻譯過來叫可擴展標記語言,是設計用來傳送及攜帶數據信息的。XML作為W3C的推廣標準,已經成為計算機領域數據描述、數據交換的基本應用格式。在數字出版領域應用也非常廣泛,像國際上的出版商聯合會(歐洲、美國)推廣的ONIX(在線信息交換)的技術格式標準就應用的是XML格式。
圍繞XML還有一系列的XSL、XBRL和XPath等在XML基礎上進行應用的“工具集”,XML作為基礎的文件格式,除了數據存儲、規范、交換方便外,更重要的是在應用端能轉換成網頁、PDF、Epub等格式應用到不同的終端上。
雖然,XML作為基礎的數據格式已經廣泛應用于數字出版領域,但是應用的范圍主要集中在傳統出版機構內容產品的元數據上。對于產品(圖書、期刊等)內容部分,要根據內容本身的特點、應用情況來定,如數據結構程度比較高的內容如詞典、年鑒、部分期刊文章等,需按照詞條檢索,這種情況就可以應用XML描述全文。由于XML及相關技術在展示內容樣式上有一定的局限性(無法表達比較復雜的樣式),大部分的正文內容還是通過專業的排版軟件生成專有的格式,推出紙質產品,或者生成PDF進行數字化的應用,不過XML已經成為事實上的元數據描述、存儲、交換的技術格式標準了。
在各種內容產品應用的專業場景下,數據結構標準不論在國內還是國外都處于一個初級階段,為廣大傳統出版機構的發展帶來了機會。
應用層面上的數據結構標準包含行業內產品元數據的標準,比如電子書發行數據標準ONIX,在圖書館館配圖書時的MARK數據標準等。當然,除了為了存儲、交換方便的特定應用的標準外,在各個應用領域的標準也在不斷地發展形成中,比如某個學科的專項內容面向用戶應用標準(包括分類、數據結構)。這些標準如果建立起來并得到市場認可,就可以成為基礎技術知識產權,為相關產品應用到市場中提供必要的基礎準備。比如一門教育資格考試的試題資源,它的知識點體系、學習水平體系、難度體系等,都是以專家建立為基礎,用戶在實際應用中交互、動態構建起來的。一旦這門考試的平臺成為大部分人使用的平臺,那么平臺后面依托的標準(需要通過時間的積累),就成為真正的準入門檻、核心價值,內容就能依托這些體系標準活起來,滿足不同的應用需求。
數字出版標準需要付諸行動
目前,基礎的技術格式標準主要包括XML、PDF、Epub。數據結構標準在內容的元數據上可以參考ONIX,至于在內容應用方面的標準,一定是在市場中不斷與用戶的交互應用中產生出來的,所以真正有價值的應用標準是做出來的,不是說出來的,更不是提前就預備好的。
在數字出版領域的標準問題上,標準不應該成為眾多傳統出版機構進行數字化轉型的攔路虎,或者不付諸行動的借口,而應該成為傳統出版機構擁抱數字化時代的巨大動力。