999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XML的開放電子文檔標準分析

2011-09-18 02:46:46楊文宏
航空標準化與質量 2011年6期
關鍵詞:標準內容

曹 平 楊文宏 朱 亮

(中航工業綜合技術研究所,北京 100028)

信息載體與傳播手段的不斷翻新,使各種新的出版形態相繼涌現,而新的出版形態都會用數字化技術來實現,因此稱其為數字出版。所謂數字出版就是指出版內容數字化、傳播網絡化、經營集約化和交易電子化[1]。標準作為一種特殊的出版物,傳統的標準形式、流程和模式也受到了全方位的沖擊和挑戰,其數字出版的需求十分迫切。標準數字出版的關鍵技術是對標準的數字化、結構化和規范化表達,而基于XML(eXtensible Markup Language)的開放式電子文檔標準是解決文檔有效表達的必要前提。目前,國外有關的開放式電子文檔標準有很多,如EPub、SCORM、S1000D和NewsML。本文對這些標準進行了詳細介紹和分析。

1 標準介紹

1.1 EPub

EPub(Electronic Publishing)于2007年9月成為國際數字出版論壇(IDPF)的正式標準,以取代舊的開放電子書標準(OEBPS)。2011年,IDPF發布了EPub 3.0版本。EPub是一個自由的開放標準,屬于一種可以“自動重新編排”的內容標準,即文字內容可以根據閱讀設備的特性,以最適于閱讀的方式顯示。EPub文檔內部使用了XHTML(eXtended Hypertext Markup Language)或DTBook(一種由DAISY Consortium提出的XML標準)來展現文字、并以zip壓縮格式來包裹檔案內容[2]。目前,以谷歌、蘋果公司為代表,眾多公司都以Epub作為數字圖書的格式。如圖1所示,EPub包括3項內容。

1.1.1 開放出版結構(OPS)

開放出版結構(Open Publication Structure,OPS)提供一個標準來制作電子書的內容,使得電子書內容提供商(例如出版者或作者)能依據該標準來制作電子書,并使得廠商能遵循該標準來發展電子書閱讀器,進而使得不同廠商的電子書閱讀器都能顯示不同電子書提供商所制作的電子書。

1.1.2 開放包裹格式(OPF)

開放包裹格式(Open Packaging Format,OPF)描述電子書中各單元內容間的關聯性,如何將數個滿足OPS規范的電子書單元內容包裹成一本電子書。

1.1.3 OEBP容器格式(OCF)

OEBP容器格式(OEBP Container Format,OCF)描述如何將電子書內容壓縮成單一的電子檔,以便于電子書的傳播、發送與檔案管理。

1.2 SCORM

圖1 EPub文檔組織結構

ADL(Advanced Distributed Learning)于1997年底啟動開發SCORM(Sharable Content Object Reference Model,共享內容對象參考模型)標準,2000年1月發布SCORM1.0,進行第1次的學習內容對象整合。2001年1月,ADL發布了SCORM1.1,朝正式應用邁進。2001年10月1日,ADL發布了SCORM1.2,該版本引入課程內容封裝的概念,并增添了為課程組件編寫元數據部分。2004年,ADL組織再次修改了SCORM技術標準,命名為SCORM2004(SCORM1.3)。SCORM2004主要由BOOK1概述(The SCORM Overview)、BOOK2內容聚合模型CAM(The SCORM Content Aggregation Model)、BOOK3運行環境RTE(The SCORM Run Time Environment)和BOOK4順序和導航SN(Sequencing and Navigation)構成。BOOK1中介紹了ADL組織與SCORM的概述;BOOK2說明了把學習資產組成具有結構性的學習組件的方法,描述了學習內容對象、內容封裝的相關信息;BOOK3提供了把學習組件傳給學習者以及追蹤學習者進度的方法;BOOK4中通過規范來制定內容的呈現順序以及呈現界面裝置,讓學習者觸發導航事件,以促進學習者的理解。經過10年多的發展,SCORM2004成為集內容聚合模型、運行環境、順序和導航于一體的完整標準體系。其中內容聚合模型包括內容模型、內容封裝、元數據和排序與呈現4個部分。內容模型包括資產(Asset)、共享內容對象(SCO)和內容組織,如圖2所示[3]。資產是學習元件中最小的元件,它可以是文章、圖片、聲音或網頁等。共享內容對象是由多個資產組成的學習元件,也是唯一能夠與學習管理系統通信的元件。共享內容對象與資產的重要區別就是能否進行通訊。

1.3 S1000D

圖2 SCORM文檔組織結構

S1000D是由歐洲宇航與防務工業協會(ASD)、美國航空航天工業協會(AIA)和美國運輸協會(ATA)共同制定的一個采用公共源數據庫(Common Source Data Base,CSDB)創建交互式電子技術出版物(Interactive Eiectronic Technicai Pubhcations,IETP)的國際規范。從上個世紀80年代發布第一個版本以來,S1000D規范先后發布了多個版本,其最新的版本為2011年發布的4.1版本,適用的范圍也從最初的軍用飛機產品擴展到現在的海、陸、空等各種軍用和民用裝備。

按照S1000D生成的SGML(Standard for General Markup Language,通用標記語言標準)或XML中間格式文件,具有模塊化形式,這種模塊化文件稱之為“數據模塊”,它由兩大部分組成[4],如圖3所示。第一部分為標識和狀態,包含技術文檔資料所有的管理信息。在向用戶提供技術信息時,這部分內容并不顯示。第二部分為文檔內容主體,主要包含文字說明和圖例等。S1000D根據文檔中所描述的信息內容又將文檔內容主體主要分為8個大類,分別定義了數據模式。

圖3 S1000D文檔組織結構

1.4 NewsML

2000年10月,國際新聞電信理事會(International Press Teleconununications Council,IPTC)發布了NewsML的l.0版本。2002年10月,IPTC公布了NewsML的1.1版本。2008年1月,IPTC經過了幾年的修改和完善,正式發布了新一代的新聞標識語言NewsML G2。NewsML G2包括NewsML G2、EventsML G2及SportsML G2三個部分[5]。作為NewsML體系結構頂層的抽象類任意項<anyItem>有4個派生類,它們是新聞項<newsItem>、包裹項<packageItem>、概念項<conceptItem>和知識項<knowledgeItem>,如圖4所示。NewsML的核心是newsItem概念,newsItem可包含各種媒體(包括文本、圖片、圖形和視頻)。newsItem由新聞元素<newsItem>、項目元數據<itemMeta、內容元數據

圖4 NewsML文檔組織結構

<contentMeta>和內容集<contentSet>4部分組成。

2 綜合分析

基于上述對EPub、SCORM、S1000D和NewsML等標準的剖析,不難發現:EPub標準主要是應用于一般書籍制作;SCORM標準主要是應用于培訓課件制作;S1000D標準主要是應用于產品手冊出版;NewsML主要是應用于新聞報紙出版。盡管這4個標準是應用于不同的領域,但它們都具有以下幾個共同理念或特點。

2.1 對象元素化

通過總結對象的基本特點,用一組元數據來實現對象(如書籍、課件、手冊、報紙等)的標識和狀態信息描述。如NewsML中,就是通過管理性元數據(Administrative Metadata)、描述性元數據(Descriptive Meatadata)和版權元數據(Copyright Metadata)描述一條新聞的基本情況的。

2.2 內容離散化

通過總結文本內容的編寫規則,將成篇內容分解成有一定主題的內容片段。如S1000D中,就是將數據模塊的文檔內容分成了8個大類,并分別定義了內容離散化的數據模式。

2.3 文本語義化

基于XML制定共同的、智能的、可操作性較強的標記模式。這種標記模式不僅能夠結構化文本內容,同時還能使計算機區分文本內容含義。比如,同樣是“華盛頓”,可以標記為美國第一總統,可以標記為地名,也可以標記書名。

2.4 數據模塊化

將文檔中重復出現的內容,轉換成獨立的數據模塊。通過模塊的重用和組合形成能夠滿足不同需求的數據集合。數據模塊化為用戶信息定制提供了基礎。如EPub中的“單元內容”、SCORM中的“學習元件”、S1000D中的“數據模塊”、NewsML中的“新聞項”都是模塊化的體現。

2.5 呈現樣式化

標記語言從SGML、HTML發展到XML,其技術上一個最大的進步就是內容和形式的分離。也就是說內容制造商完成文本的標記,出版印刷環節中的出版商和閱讀中的作者(在顯示器上)可以控制字形、字體大小、字體顏色、行距和長度、頁邊距和縮進、背景圖像、顏色以及其他元素。這一切的實現主要是通過樣式表來實現的。

2.6 結構開放化

所謂開放化包括兩個層面的含義,一方面是指文檔內容結構是公開的,另一方面是指允許用戶在已定義結構的基礎上自定義或擴展相關元素。目前EPub、SCORM、S1000D和NewsML都已成為公認國際通用標準,并且都提供了可擴展機制。

3 結束語

數字出版和傳統出版的本質區別在于信息組織方式發生了革命性的變革。未來以EPub、SCORM、S1000D和NewsML為代表的開放電子文檔標準是實現數字出版的關鍵所在,我國應加緊對這類標準進行跟蹤、研究和推廣。另外,目前國際上還沒有的關于描述標準自身的標準。作為標準化研究機構不妨考慮在借鑒國際上通用成熟標準的基礎上,結合標準自身特點,制定出基于XML的開放式電子標準格式規范。

[1] 梁上啟.“泛在計算機時代”數字出版盈利模式研究[J].編輯之友,2009.

[2] Epub 3.0[S].http://idpf.org/epub/30.

[3] SCROM 2004[S].http://www.adlnet.gov/capabilities/scorm.

[4] S1000D 4.1[S]. http://www.S1000d.org.

[5] NewsML-G2[S].http://www.iptc.org/NewsMLG2/Speci fi cation.

猜你喜歡
標準內容
2022 年3 月實施的工程建設標準
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
內容回顧 溫故知新
科學大眾(2021年21期)2022-01-18 05:53:48
內容回顧溫故知新
科學大眾(2021年17期)2021-10-14 08:34:02
忠誠的標準
當代陜西(2019年8期)2019-05-09 02:22:48
美還是丑?
你可能還在被不靠譜的對比度標準忽悠
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
一家之言:新標準將解決快遞業“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
2015年9月新到標準清單
主站蜘蛛池模板: 国产精品自在线天天看片| 色综合日本| a毛片在线| 丝袜国产一区| 亚洲男人的天堂久久香蕉| 日韩最新中文字幕| 91成人精品视频| 国产va在线观看| 亚洲欧美综合另类图片小说区| 免费不卡在线观看av| 东京热一区二区三区无码视频| 欧美亚洲欧美区| 欧美国产综合视频| 國產尤物AV尤物在線觀看| 国产精品尤物在线| 特级毛片免费视频| 一本一本大道香蕉久在线播放| 自拍欧美亚洲| 中文字幕一区二区人妻电影| 国产美女自慰在线观看| 久久久精品久久久久三级| 99热这里只有精品5| 亚洲欧美日韩另类在线一| 亚洲国产日韩在线成人蜜芽| 国产精品综合久久久| 欧美无遮挡国产欧美另类| 精品黑人一区二区三区| 久久伊人操| 亚洲日韩欧美在线观看| 国产对白刺激真实精品91| 久久久国产精品免费视频| 亚洲第一区欧美国产综合| 无码精品国产dvd在线观看9久| 强奷白丝美女在线观看 | 亚洲无码视频一区二区三区| www欧美在线观看| 99er这里只有精品| 欧美精品综合视频一区二区| 热久久综合这里只有精品电影| 天堂在线www网亚洲| 国产午夜无码片在线观看网站 | 欧美午夜小视频| 亚洲系列无码专区偷窥无码| 亚洲swag精品自拍一区| 无套av在线| 日本高清免费不卡视频| 欧美综合成人| 亚洲日韩Av中文字幕无码| 欧美成人在线免费| 国产精品永久在线| 日韩在线影院| 亚洲无码91视频| 欧美午夜理伦三级在线观看 | 久久青青草原亚洲av无码| 精品少妇人妻一区二区| 亚洲IV视频免费在线光看| 国产精品无码久久久久久| 久久semm亚洲国产| 精品色综合| 久久永久精品免费视频| 99re这里只有国产中文精品国产精品 | 亚洲综合第一区| 日韩在线播放中文字幕| 国产www网站| 91在线日韩在线播放| 欧美性精品| 国产成人AV综合久久| 精品日韩亚洲欧美高清a| 国产91无码福利在线| 亚洲国产日韩在线观看| 国产欧美一区二区三区视频在线观看| 四虎影视国产精品| 欧美精品啪啪一区二区三区| 99性视频| 免费欧美一级| 国产特级毛片aaaaaa| 亚洲精品爱草草视频在线| 91免费在线看| 99九九成人免费视频精品| 国产在线视频欧美亚综合| 99这里只有精品免费视频| 青草国产在线视频|