胡梁勇
(裝甲兵工程學院,北京 100072)
信息化條件下,傳統的紙型技術手冊已不能滿足大型復雜武器裝備對信息的需求,隨之產生的交互式電子技術手冊(Interactive Electronic Technical Manual,簡稱IETM)代替了紙型手冊,成為信息化戰爭條件下武器裝備的新一代維修輔助工具,是一種數字化信息系統,它在編制、修改、存儲、運輸、使用和管理等方面有紙質技術手冊無可比擬的優點,降低了裝備保障費用,提高了維修效率[1]。
IETM產品的制作離不開標準,IETM創作平臺也需要依據成熟的相關標準來指導自身的開發。實踐證明,IETM至少要在兩個方面制定規范:一是,有關IETM顯示系統方面的規范;二是,創建IETM數據庫方面的規范。本文研究的重點就是與IETM顯示系統方面的有關的通用性要求。
本文以IETM創作平臺研究為背景,建議采用歐洲的S1000D作為開發標準,在開發出的基于S1000D標準的IETM創作平臺的基礎上,詳細探討了基于S1000D的IETM數據要求分析。引入S1000D標準構建數據庫和開發IETM創作平臺,可以實現技術信息模塊化的組織與管理。
MIL–D–87269A《可修改數據庫規范》是美國防部在MIL–D–87269的基礎上修訂而成的,于1995年10月頒布。它是創建IETM數據庫以及使用SGML進行標記信息的標準。它定義了IETM數據庫結構和元素命名規則,以及政府和承包商信息的交換格式。它的目在于提供標準化的技術信息組織方式,并建議使用SGML語言描述數據模型,以便更好地將IETM所要顯示的技術信息遵循一定的規律存儲到數據庫中。
MIL–D–87269A將IETM數據模型劃分為兩個層次(見圖1):通用信息層和特定內容層。通用信息層有文本、表格、圖形、音頻、視頻等通用元素組成,這些通用元素都有其標準的組成方式;特定內容層由描述信息、任務信息、故障信息、零件信息等信息模型組成,特定內容層中的信息模型由通用層中的通用元素以特定方式組合而成,并根據武器裝備的組成結構來組織技術信息。
MIL–D–87269A中的數據模型的優點是層次分明、結構簡單、易于組織技術信息、提高了數據的共享性;其缺點是沒有對技術信息進行專業性的劃分,如可將技術信息劃分為操作信息、故障診斷信息、維修信息等信息。可見信息分類缺乏針對性將導致技術信息分類的不規范,影響數據的共享和互操作。

圖1 MIL-D-87269A數據模型兩層結構
目前比較流行的是S1000D標準,它是由歐洲航空航天和國防工業協會(ASD)和美國航空航天工業協會(AIA)共同制訂的一個采用公共源數據庫來采辦和編著技術出版物的國際標準[3],可用于飛機、輪船、陸地車輛等民品和軍事裝備,規范采用ISO、CALS和W3C標準,信息以中立格式組織,使用模型概念,其通用性很強,被歐美工業界諸多項目采用。
S1000D的一個重要特征是為IETM的制作提供了一個開放系統表述方法,以數據模塊(Data Module,DM)組織技術信息,以公共源數據庫(Common Source Data Base,CSDB)管理信息對象。
數據模塊作為S1000D標準的另一核心概念,邏輯上,一個數據模塊是一個自我包含、包含裝備一部分完整信息的數據單元,不可分割,具有原子性;物理上,它是一個ASCII碼文件,它以SGML或XML格式組織數據,并有相應的文檔類型定義(DTD)來約束和驗證數據文件中的標記。各個數據模塊之間使用數據模塊編號(DMC)相互區分,可以利用此編號管理整個產品的數據模塊。
數據模塊是S1000D標準中核心的信息對象,標準中推薦用中性格式(SGML或XML)描述數據模塊。IETM中以數據模塊來組織信息,以CSDB來管理信息對象。所以,公共源數據庫實現架構的確定要以數據模塊的存儲、管理的便利性決定。
裝備保障IETM與其它電子出版物一樣,在數據格式上也需要實行標準化,以滿足裝備保障領域技術信息的互用性和長期有效性,這就需要采用統一數據描述語言即所說的標記語言。伴隨著信息化社會的飛速發展,SGML、HTML、XML3種標記語言技術先后應運而生,各具特點,對于IETM的信息數據組織、管理有極大的應用前景,由于XML語言的突出特點,下面主要對該語言進行分析。
XML(Extensible Markup Language)是W3C在1996年底提出的國際標準。它也源自SGML,它保留了SGML80%的功能,使復雜程度降低了20%。XML可以看作是SGML的一個子集,它不但保留了SGML的強大功能、降低了SGML的復雜程度,也使XML具有強大伸縮性與靈活性。它作為一種元標記語言,允許用戶在DTD文檔中根據需要定義特定的標記及屬性,從而使XML文件的結構可以復雜到任意程度。目前的XML已經被設計得非常易于使用,并且與SGML和HTML保持了很強的可互操作性。與SGML相比,XML具有更強的靈活性;而與HTML相比,XML能夠支持更多的數據類型。XML有下面幾大要素:Schema(模式)或DTD,XSL(Extensible Stylesheet Language,可擴展樣式語言)和XLL(Extensible Link Language,可擴展鏈接語言)等。所以XML具有良好的數據存儲格式、可擴展性、高度結構化、便于網絡傳輸等優點。其具體優點表現如下。
2.2.1 良好的可擴展性
在具體的實際應用中,不同的行業會有不同的標準、不同的特殊要求,要想定義一套各行各業能夠普遍應用的標記是不現實的。而XML允許各種不同的專業(如化學、音樂、數學等)開發與自己的特定領域相關的標記語言。這就使得該領域中的人們可以交換數據和信息,不用考慮接受端的人是否有特定軟件來創建數據。
2.2.2 可以輕松實現數據在Web上發布
由于XML是一個開放的基于文本的格式,它可以不做任何修改和HTML一樣使用HTTP協議進行傳送,不需要對現在的網絡做任何改變。
2.2.3 有利于信息的集成
由于不同的數據庫間的兼容性問題,要在多種不同的數據庫中搜索信息,就必須了解各種數據庫的數據格式,這無疑是非常困難的。使用XML可以將不同來源的結構化數據很容易地組織到一起。應用軟件可以在中間層服務器上對來自于后端數據庫和其他應用數據進行集成。最后,數據以XML格式發送到客戶端或是在其他服務器做進一步的處理。
2.2.4 內容與形式分離
XML中信息的顯示方式已經從信息本身中抽取出來,放在了樣式表(StyleSheet)中。這樣做便于信息表現方式的修改,便于數據的搜索,也使得XML具有良好的自描述性,能夠描述信息本身的含義甚至它們之間的關系。通過對以上數據描述格式及標記語言的闡述和比較,根據IETM數據模型要求具有層次性、關聯性等特點,采用SGML和XML格式描述技術信息能更好的反映技術數據的樹型層次結構,是比較可行的方案。但XML優點更顯著,它能更容易實現IETM的可互操作性,同時降低開發難度等,可見IETM數據最佳描述語言應為XML。資料表明當前的IETM開發已經開始著手使用XML,在今后發展中XML必將成為IETM中的標準標記語言。這同樣說明S1000D的先進性和對新技術的支持以及我們選擇S1000D標準的正確性。
IETM創作平臺包含創作、管理、發布3個子系統,IETM技術信息包括裝備定義數據和裝備保障數據,存儲在CSDB中,以“數據模塊”形式組織技術信息,用公共源數據庫管理所有信息對象。以S1000D標準指導開發IETM,建議用XML語言來描述IETM數據。
XML是IETM的最佳數據描述語言,它將成為IETM發展的標準標記語言。對XML數據進行有效的存儲與管理,構建其存儲傳遞的技術方案。按照數據存儲系統的不同,XML數據存儲大致可分為3種方案:直接以XML文本文件方式存儲;開發XML原生數據庫;XML在關系型數據庫存儲。
XML文本文件格式存儲XML是最簡單的,但對數據的處理能力非常有限。在文本文件中要進行數據查詢、更新等操作,效率極為低下。所以要實現對XML的數據查詢、更新等數據管理功能,一般不考慮直接以文本文件的方式存儲。
原生XML數據庫是專門為存儲和處理XML文檔而設計的,它內部是以XML文檔的格式存儲數據,即對整個XML文件一起進行物理存儲。這種數據庫以XML文檔為存儲單元,維持原有XML文檔的數據結構和相關的元數據,只能通過XML特有的相關技術對數據進行存儲。
從嚴格的意義上來說,XML本身不是數據庫,XML僅僅意味著XML文檔。因為盡管一個XML文檔包含數據,但是如果不通過其他的軟件來進行數據處理的話,它本身只不過是一個文本文件。所以XML本身不能和數據庫掛上鉤,但是加上一些其他的輔助工具,我們可以把整個XML看成是一個數據庫系統,XML文本本身可以看成是數據庫中的數據,DTD或者Schemas可以看成是數據庫模式,XQuery可以看成是數據庫查詢語言,因此在原生XML數據庫中存取整個XML文檔,只需做物理指針的連接而不是邏輯連接,效率比較高。SAX或DOM可以看成是數據庫處理工具等。但它需要完善數據庫所必須的一些功能,比如有效的存儲組織、索引結構、安全性、事務處理、數據完整性、觸發器、多用戶處理機制等。同時大多數原生XML數據庫只能以XML文檔的形式返回數據,當某些應用需要其它格式數據時,必須先對XML文檔進行解析,增加了很大的開銷。
XML存入關系數據庫,基本數據存儲單位是XML文檔中的數據,主要是通過增加一個映射層來管理XML數據的存儲,它是XML與數據庫之間轉換的橋梁。數據首先要與一個明確的格式相匹配,符合要求的才能根據預先定義好的規則映射到數據庫中,但可能會損失一部分元數據和最初的文檔結構。同時可以從現有的數據庫中動態生成XML頁面,但不能保證與當初存入的原始頁面完全符合。但這種策略可以同時發揮關系數據庫和XML文檔的優越性。
綜上所述,XML文本文件格式存儲雖然簡單,但對數據的處理能力非常有限。原生XML數據庫存儲方法保留了文檔的原始結構和XML原有的優點,存儲簡單,但信息的格式、內容相對繁雜,建立索引龐大復雜,同時缺乏對數據有效的存儲組織、索引結構、安全性、事務處理、數據完整性、觸發器、多用戶處理機制等。而把XML存入關系數據庫方法將XML文檔的數據進行重新組織,存儲相對規范,有利于信息在電子商務等方面的應用,這樣我們可以通過指定的DTD規范化XML文檔,并利用數據庫技術中成熟的統計、并發事務處理等技術,克服了XML文檔直接存儲和原生XML數據庫的缺點。所以建議采用第3種方案,將XML數據存入關系數據庫,充分利用關系數據庫的優越性,同時也發揮XML的優越性。
對于裝備的維修而言,故障是裝備功能喪失的外在表現。要排除故障就需要我們通過更正物理結構來保證功能的恢復。從功能到結構是需要一個轉換。IETM作為技術信息的載體,它要反映這兩個方面的內容:一是裝備的結構信息;二是恢復裝備的功能而采取的活動描述。并且二者有相關關系的相互對應。讓裝備的使用人員或者是保障人員能夠利用技術手冊來知曉裝備的功能與結構的關系。
數據模塊的結構是基于內容組織和劃分的。所以,技術手冊要以某種裝備保障活動的主題進行構建。數據模塊作為IETM中能自我包含的最小信息單元,就要將裝備的結構信息和活動信息一起表達。為了實現這種要求,S1000D對數據模塊進行編碼時,考慮了裝備的硬件標識及裝備保障活動的信息類型。通過對數據模塊編碼的選擇,就可以組成某一類型的技術手冊。數據模塊的編碼結構如圖2所示。
硬件部件的編碼包括3部分:第一部分是裝備的名稱。它需要一個統一的機構進行管理,使用前要經過該機構的惟一性注冊,以保證在整個行業中不發生沖突。第二部分是系統標準編碼。它反映的是裝備的結構。一個裝備中可能有多種實現某一功能的系統。比如在某型飛機上可以有多種類型的導航雷達。為區分這些有相同功能的系統,可以在系統標準編碼前面增加一個系統區分碼,這個編碼存在時要與系統標準編碼一起使用。第三部分零件分解編碼及其變量是對系統標準碼中后一位的說明,也就是零件的裝備保障活動解釋。
編碼的信息類型部分包括兩部分:第一部分是信息類型編碼及其變量,按照裝備保障活動的順序進行排列標記:功能描述、操作要點、保養方法、檢測手段、故障報告、診斷程序、故障定位、部件組裝、修復件存儲、混合主題。這個順序內容是建立在系統標準編碼有效分解的基礎上的,對于不必要的分解,不應該標記信息碼。第二部分是條目定位編碼,說明的是該數據模塊描述的硬件是否與父系統有無物理上的聯接。

圖2 數據模塊的編碼結構示意圖
通過比較MIL–D–87269A和S1000D兩個規范的數據要求,分析出S1000D更適合指導現階段開發IETM的數據標準。在我國還沒有自己的IETM數據標準規范,應該在借鑒國際上通用成熟的標準基礎上,立足本國國情,盡力開發出適合國情和能與國際接軌的IETM數據要求標準,服務于我國的IETM發展和武器裝備信息化建設。
由于復雜裝備技術保障難度增大和信息技術的快速發展,S1000D標準數據要求還要在實踐中結合實際情況,不斷加以調整和完善。
[1] 徐宗昌.保障性工程[M].北京:兵器工業出版社,2002.8.
[2] 杜曉明等.集成化的交互式電子技術手冊[D].“推進高新技術發展與應用,提高裝備與設備維修保障能力”研討會論文,2005.5.
[3] 陳信欽等.交互式電子技術手冊應用與發展展望[J].現代防御技術,2003.3.
[4] Eric L.Jorgensen.DoD Classes of Electronic Technical Manuals,1994.
[5] 顧秀君等.制作交互式電子技術手冊標準化要求[J].江蘇船舶,2004.5.
[6] 章引平.CALS與標準化[J].航空標準化與質量,2001.5.
[7] ASD S1000D International Speci fi cation for Technical Publications Utilizing A Common Source Data Base(V2.1&V2.2&V2.3&3.0)[S].2004.2/2005.1/2007.2/2007.07.