李秀華,曹海靜
(1.中鐵二院工程集團有限責任公司, 四川成都 610031; 2. 中鐵西南科學研究院有限公司, 四川成都 611731)
隨著國家“一帶一路”倡議的推進實施,中國企業承擔了眾多海外項目。根據國際慣例和業主要求,設計成果均采用外文交付。由于國內設計者普遍習慣使用中文完成設計任務,加之目前國內的商業軟件或絕大部分設計院自編的設計輔助軟件,輸出的成果也均為中文表述。在設計過程中及審查流程所用的中間成果均為中文,交付國外業主之前還需要自行翻譯為外文,耗時費力。對于小語種國家,設計者無法自行翻譯,需要委托專業公司來翻譯,成本高昂。因此,為大力拓展我國海外業務,提高設計效率和水平,有必要研發一款適應于能夠滿足任意語言的、跨專業的、支持多種圖文格式的、高效精準的翻譯系統。
隨著中國企業承接越來越多的海外項目設計任務,設計成果最終要以外文交付業主,受審查流程及設計習慣的影響,設計中間過程大量使用中文表達,因此海量的中文設計成果需要在交付前翻譯為外文(圖1)。

圖1 海外項目設計流程現狀
以中鐵二院承擔的孟加拉帕德瑪大橋鐵路連接線項目為例,橋梁專業每座橋每個橋墩都要進行詳細樁基計算,全線就有近千篇計算報告需要翻譯,這還不包括橋墩、梁體等部分的設計成果。與橋梁專業類似,路基專業也面臨同樣的問題,受軟土地質條件影響,每段路基都要出詳細的計算報告,僅路基沉降、穩定計算報告就達近千篇。
國內中文設計習慣嚴重制約了設計生產效率,設計者不僅要設計還要完成大量翻譯工作;不同設計者翻譯,質量、風格不統一,容易錯譯、漏譯;業主收到表達各異的設計成果也影響審查效率和進度;施工單位收到設計圖紙后若出現理解偏差,將嚴重威脅工程質量和安全;若海外項目在小語種地區(如中老磨萬鐵路、中緬木曼鐵路等),交付成果為小語種語言,設計者無法自行完成,海量的設計成果只有交付翻譯公司,巨額費用將是設計企業沉重的負擔。因此,亟需研發海外項目設計成果快速翻譯軟件以解決上述問題。
基于對快速翻譯的需求分析,對于鐵路工程設計,多數設計成果為內容、格式相近,但數據千變萬化的情況。基于此,軟件設計為在任意定制模板格式后,可滿足任意語言的、跨專業的、支持多種圖文格式的、正確批量翻譯軟件。鐵路工程設計成果翻譯軟件系統架構如圖2所示。

圖2 鐵路工程設計成果翻譯軟件應用架構
各設計者根據工作需要結合翻譯系統,批量翻譯設計成果。軟件支持多種專業、多種文件格式,預留豐富的接口便于后續擴展,支持批量圖文翻譯。
根據軟件工作流程,制定功能實現如圖3所示。

圖3 鐵路工程設計成果翻譯軟件原理及工作流程
2.2.1 詞庫定制
軟件目標支持多種專業、任意語言的互譯,因此必須定義開放的詞庫格式,由具體參與項目的設計人員定制。各專業詞庫編制者結合統一內容標準格式圖紙、計算報告的內容,編制相應的詞典,詞典由源語言詞組與目標語言詞組對應詞條組成,詞條組數由需要翻譯成果的內容決定,普通的計算報告或圖紙,一天之內可以定義完畢。源語言和目標語言可以為任何語言,只要保證翻譯正確即可,由此可實現任意語言準確翻譯。詞典編制完成并各級審查通過后,負責人統一分發給各個設計者,設計者自行完成成果翻譯。橋梁、路基專業詞庫示例如圖4所示。
目前Autodesk公司的AutoCAD軟件系統是應用最廣泛的二維繪圖系統,其DWG和DXF文件已經成為事實上的業界標準。DXF和DWG數據格式對不同軟件及行業之間交換數據有著舉足輕重的地位。DWG文件是AutoCAD用來存儲其最終圖形產品的二進制文件,Autodesk公司至今未公開DWG文件的具體格式,程序直接讀寫非常困難[1]。DXF是DWG格式的ASCII格式變體,絕大多數CAD系統都能讀入或輸出DXF文件,但是其具有文件龐大,處理速度慢等缺點。
雖然集成二次開發正成為DWG文件應用軟件開發的主流方向,但本軟件目標為支持多種文件格式的獨立程序,通過調用AutoCADActiveXAutomation對象的的集成二次開發仍然擺脫不了AutoCAD,這樣使得系統比較龐大,應用系統運行效率低。為了脫離CAD運行平臺獨立運行,可使用AutoCAD推出的RealDWG開發工具包,但價格非常昂貴[2]。ODA(OpenDesignAlliance)成立于1998年,是一個致力于促進開放的、工業標準的CAD數據和遺留的CAD數據的格式交換的非盈利國際組織。ODA開發用于技術圖形應用程序的核心平臺Teigha,支持dwg、dgn、stl、pdf等格式,并且支持跨平臺[3]。Teighafor.dwg是Teigha的一個子集,前身為OpenDWG、DWGDirect。可以讀取各版本AutoCAD數據,向下屏蔽DWG內部數據結構和版本差異,向上提供統一的數據結構表達信息模型[4]。本軟件利用Teighafor.dwg組件通過讀寫OdDbDatabase數據庫中的各符號表完成翻譯工作。
DXF文件本質上由組碼(GroupCode)及其關聯值對組成,組碼表明其后的值的類型[5]。DXF文件總體結構分為HEADER、CLASSES、TABLES、BLOCKS、ENTITIES、OBJECTS、THUMBNAILIMAGE共7個段[6],其中ENTITIES是DXF文件的核心部分。本軟件利用DXF文件采用ASCII碼的方式存儲AutoCAD圖形數據的原理,系統將DXF文件中BLOCKS和ENTITIES段中需翻譯的源語言表述翻譯為目標語言,實現圖紙文件的快速翻譯。
目前設計院完成的計算報告有多種格式,以文本文件和Office文件為主。對于文本文件,軟件可直接讀寫,對于Office文件,采用基于COM(ComponentObjectModel)組件技術的MicrosoftOffice組件進行開發[7]。
Office組件對象以樹狀層級結構排列,程序中的任何元素,如文檔、表格及書簽等都是對象。如Word提供了數百個可與之交互的對象,Application對象位于層次結構的頂部,表示Word的當前實例,包含Document、Selection、Bookmark和Range對象[8]。上述每個對象均具有很多方法和屬性,本軟件通過操作對象與Office程序進行交互,完成翻譯任務。
軟件已成功應用于孟加拉帕德瑪大橋鐵路連接線、巴基斯坦ML-1線鐵路等海外項目實踐中,據統計,僅孟加拉項目的橋梁、路基專業,通過軟件目前就已翻譯幾千篇計算報告,得到了業主及監理工程師的一致認可,節省了大量人力和巨額的翻譯費用。本系統是跨專業、跨語言的,因此在制定好標準格式以后,任意專業、語言都可以互譯,可應用于各個海外項目。圖紙、橋梁樁基計算報告、路基穩定性計算報告、路基沉降計算報告的應用實例,如圖5~圖8所示。

(a)橋梁中文圖紙

(b)橋梁英文圖紙

(a)橋梁樁基礎中文報告

(b)橋梁樁基礎英文報告

(a)路基沉降計算中文報告

(b) 路基沉降計算英文報告

(a)路基穩定計算中文報告

(b) 路基穩定計算英文報告
本文通過對海外工程設計現狀和應用需求分析,研究鐵路工程設計成果翻譯軟件的架構及功能。本系統關鍵技術創新內容主要體現在:快速翻譯,每分鐘即可完成上百份圖紙或計算報告的翻譯任務;支持任意語言互譯;可滿足任意專業的翻譯需要;支持多種圖紙、計算書文件格式;翻譯成果準確率高,無需檢查即可直接交付;支持專業人員自定義詞庫,可無限擴展。本軟件已成功應用于多個海外項目,節省了大量人力和巨額的翻譯費用。