付永華 白占俊 張旭陽



摘? 要:將工程電子文件有序有據處理是工程電子文件閱讀設備提供有效閱讀的基礎。論文通過現場調查,充分考慮野外施工現場的工程電子文件的來源、格式與內容,針對工程電子文件多源異構的特點,了解國內外主流技術,結合惡劣施工環境的實際情況,設計并實現一種新的工程電子文件獲取模式和處理技術,獲取模式包括批量導入按需讀取、臨時協作按需共享和實時更新按需收集3種模式,處理技術包括識別技術、兼容技術、轉換技術,從而有效加強工程電子文件的實用性。
關鍵詞:工程電子文件;多源異構;獲取模式;處理技術
Abstract: The orderly handling of engineering electronic documents is the basis for effective reading of engineering electronic document reading devices. The source, format and content of the field construction project of electronic documents is fully considered through field investigation. A new acquisition mode and processing technology of engineering electronic document is designed and implemented according to the characteristics of engineering electronic documents of multi-source heterogeneous, knowledge of domestic and international mainstream technology together with the actual situation of poor construction environment. The acquisition mode includes? batch acquisition mode introduction according to need read, temporary collaboration on-demand storage and real-time updates of on-demand while processing technology contains identification technology, compatible technology and conversion technology, which can effectively strengthen the practical usage of engineering electronic documents.
Keywords: Engineering Electronic Document; Multi-source Heterogeneous; Acquisition Mode; Processing Technology
工程電子文件閱讀設備主要面向惡劣的野外施工環境,比如野外勘探、鐵路公路構建、災害救援等,其直接解決的問題是惡劣環境下的閱讀問題。但是,工程電子文件閱讀設備的內容質量,也就是各種工程電子文件的質量,也直接影響著閱讀的效果,而且,工程電子文件的來源比較多[1],內容和格式也存在很多差異,因此,如何有效地獲取這些多源異構的工程電子文件,并有序有據地對其進行處理加工,使之適合野外施工環境需要,容易閱讀,成為提高閱讀質量的關鍵。
在工程電子文件閱讀設備樣機設計并實現后,通過對中建二局第二建筑工程有限公司負責的惠濟萬達廣場項目、鄭州市農業路快速通道工程京廣高架互通項目實證調研,分析研究面向工程電子文件閱讀設備的工程電子文件的現狀與特點。
1.1工程電子文件多源成因。(1)過程天然多源:經了解,工程電子文件的來源存在多個單位,比如,一般的項目工程包括建設、勘察、設計、施工、監理、檢測、檢驗等流程,在這些不同的流程中,必然存在著多家單位的工作,導致工程電子文件天然產生著多個源頭。
(2)同節協作多源:即使同一個工作環節,或者同一個工作單位,也會有多源的現象,比如施工現場,因為某項需求,有幾個協作部門,對工程資料如施工圖紙等,進行現場調研、臨時變更,導致工程文件實時產生,難以預測。
(3)同文修改多源:在同一份文件上,也有可能是先由設計人員完成,然后其他人員因為需要直接在工程資料上進行修改,甚至更多的是同樣的設計人員自己不斷地修改,導致同文修改多源。
1.2工程電子文件異構成因與構成。導致工程電子文件異構的原因主要是文件的多源,不同的階段采用的工程電子文件描述工具不同;同樣的任務,不同的單位又可能采用不同的軟件;工程電子文件本身的描述需要,比如有的地方需要文字描述,有的可能是圖片,也導致工程電子文件的異構;工程電子文件描述技術的飛速發展,為工程電子文件的描述提供了便利,但是也導致了新的描述格式的出現,比如虛擬技術、3D技術等。
經調研,工程電子文件的構成主要包括各類設計圖紙、施工圖紙,各種文件規定、施工記錄、驗收記錄和報告等,各種原材料、成品、半成品、構配件、設備的描述性文件等,施工過程中的各種描述等。具體構成的格式、來源等信息如表1所示,其中,獲取難度和處理難度采用五分法描述,獲取難度的1代表可以直接獲取,5代表基本不能獲取,或經較為復雜的技術方式才能獲取;處理難度的1代表不需要處理,可以直接使用,5代表需要經過論文設計的所有處理技術才能處理完成。

2.1 研究現狀。關于電子文件格式,向來不是學者們研究的重點,一般側重的是存儲或歸檔方式。比如劉家真教授在2000年根據澳大利亞電子文件管理策略,研究了電子文件的保存、鑒定與存取問題[2]。李澤鋒教授則較為全面地研究電子文件整個生命周期的變化,并在2004年,就較早地關注了檔案數字化的電子格式問題,他認為XML、RTF、TXT等并不完全適用于檔案的數據格式,他討論了文件保存格式的選擇原則,并在對比幾種電子格式的基礎上,提出CEB是一種比較適合數字化檔案的保存、整理、利用與遷移的格式[3]。
各位學者也意識到了,不同的存儲格式對電子檔案使用的影響,也在考慮如何進行融匯和兼容,1998年,劉詩德和郭黎探討了電子出版系統的文件交流,并從質量、靈敏性、效率和支持性等方面,考慮了出版系統不同格式之間的轉換和兼容問題,最后給出了一種支持2種格式轉換的平臺的設計思路[4]。此方面的研究,一直延續到今天,2017年,梁凱研究了檔案部門應用OFD格式的問題,分析了OFD格式的優勢與存在的“短板”,同時也簡單講述了OFD格式與PDF格式的競爭[5]。
關于工程電子檔案或工程電子文件的研究,幾近千篇,但縱觀這些研究,主要還是數字化的技術、數字化的過程方面,或者是以某實際工程為例的數字化,也有少部分的研究考慮了安全問題和如何更好地使用,比如有的研究設計了在線瀏覽的模式等,但是基本沒有考慮多種格式存在的主要原因和一定時間內無法改變這種現狀的事實。
2.2 應用現狀。在國外,美國電子文件檔案館項目系統工程主管Dyung Le就將工作重點放到多種格式文件的存儲和利用上,使其盡量不受電子文件產生的軟件或硬件的影響。李澤鋒教授也提出了一種注冊庫技術,他在理解文件格式與分析格式管理原因的基礎上,對格式管理的功能進行分析,認為應該構建格式注冊庫,存儲格式的表示信息,進一步分析格式注冊庫的構成,從而便于識別和兼容不同的格式[6]。
在具體應用上,很多公司過去采用獨立技術,一方面為了保密,另外也為了彰顯個性獨立,但在兼容和共享的發展方向上,也在慢慢地改變,比如2006年,日本Sony Corporation的數據壓縮技術就與競爭對手的格式兼容,包括Apple Inc.的AAC技術。
在數字存檔方面,也有很多技術在推進,比如2010年提出的XAM(eXtensible Access Method,可擴展訪問方法),這一標準將原始數據和應用分開,從而實現應用時按需的操作。雖然此方面的研究在2012年便不再繼續,但也是一種嘗試。也有的技術考慮到數字化制作者本身的實際情況,研究有限兼容支持的自治信息保存格式,在一種允許的框架范圍內,自由地進行檔案數字化,不用考慮將來使用者的情況。CDMI(Cloud Data Management Interface,云數據管理接口)標準是近些年流行的新技術,提供了訪問云存儲和管理云存儲數據的方式,能夠讓大多數舊的非云存儲產品訪問方式演進成云存儲訪問。
在政策和行業規定方面,2016年10月14日,“電子文件存儲與交換格式版式文檔”標準發布,這是我國自主研發的版式格式標準,是國家電子文件標準體系的重要組成部分,該標準規定國家版式文檔格式規范,簡稱OFD(Open Fixed-Layout Document),在多個行業進行驗證,獲得市場和用戶的廣泛認可[7]。
縱觀上述研究現狀、應用現狀或技術現狀,首先,工程電子文件的復雜程度得到了認可,但在數字化過程中,并沒有考慮工程電子文件的來源和構成,只是按照普通的數字化方法去管理,最多考慮了工程圖紙的大幅面、改動多的特點。其次,認識到了數字存儲格式對閱讀效果的影響,已經采用規范和技術,去盡量地消除格式的不統一帶來的影響,有的從源頭考慮,有的從使用端考慮,但基本沒有意識到,這些規范或技術,在惡劣的施工環境下,能否適用,這個施工環境還包括硬件和操作者,同時,也沒有考慮這種改變,是否對操作者產生了新的影響,增加了原有操作的工作量和復雜度。
3.1 符合工程的實際需要。(1)充分考慮施工環境。工程電子文件和其他的電子文件不同,工程施工現場,有可能盛夏酷暑、烈日炎炎,也可能寒風凜冽、冰天雪地,也可能風雨交加,也可能塵土飛揚,這不管對電子檔案還是紙質檔案,都存在著很大的使用壓力;有的工程現場可能存在著電磁干擾等,這些對工程電子文件的獲取和使用都產生了很大的影響[1]。
(2)充分考慮電子文件的實時性和綜合性。在施工過程中,一直需要工程資料的支持,也很有可能因某項新需求,對工程資料如施工圖紙等,進行現場調研、臨時變更,工程電子文件實時產生,難以預測。而且,有時候需要將整個工程施工前后相關的所有資料綜合在一起,進行比對,工程電子文件需求量比較大。
3.2 符合電子文件的固有規律與未來發展。(1)在保證使用的情況下,盡量少變化:工程電子文件閱讀設備固然要以施工的實際需要為工作核心,但是,在能夠保證文件的讀取速度、清晰度、閱讀效果和使用效果的情況下,盡量不做變動,少做變動,尤其盡量做到只改變工程電子文件的存儲格式,而文件的邏輯結構、內容關系保持不變。
(2)便于移植:一般工程都包括建設、勘察、設計、施工、監理、檢測、檢驗等幾個流程,雖然工程電子文件閱讀設備主要應用于施工階段,但其內容在施工階段也需要不斷地修改和共享,因此,不管是在不同的單位之間流動,還是在同單位的不同部門,抑或是同一個工作點的幾個終端之間,都要充分考慮其移植性。
(3)便于瀏覽器處理:目前,大多數工程檔案管理系統,都支持局域網結構,但是因為內容原因,支持B/S結構的工程檔案管理系統還不多,即使有,對在線瀏覽的內容和格式也有很大的限制,更多的是對內容的文本提取。但隨著硬件和網絡技術的發展,較為復雜的工程電子文件支持瀏覽器閱讀必將是一種趨勢,因此,有必要從現在就考慮對瀏覽器的支持。
(4)便于讀取和識別:通過封裝技術或其他方法,將工程電子文件處理,雖然有利于保密和保證文件的一致性,但卻妨礙了工程電子文件的再處理,而這種再處理,在施工階段是經常的,因此,工程電子文件格式應該支持數據較為容易地被讀取和識別。
3.3 加強協作間的基礎溝通。工程電子文件是很多個環節、很多個單位和很多部門與人員的共同產物,也就是文章第一節里提到的多源,不管是出于工作習慣也好,還是保密也好,都應該在項目開始之前,盡量地規范在同一個工程中的電子文件的格式,探討不同軟件之間的兼容,在保證完成工作的基礎之上,選擇兼容性較強的電子文件格式;對相同的軟件平臺,也通過升級或其他方式,確保版本一致或盡量接近。
4.1 工程電子文件獲取模式。根據工程施工的實際需要,在工程電子文件的獲取方面,設計了三種獲取模式:批量導入按需讀取、臨時協作按需共享和實時更新按需收集,如圖1所示。

(1)批量導入,按需讀取:這種模式主要針對來源于外單位的工程電子文件,比如工程單位的要求、設計單位的圖紙,也包括各種原材料、成品、半成品、構配件、設備的描述性文件等,在具體的某個施工點,不需要上述的全部材料,只需要直接相關的即可,因此,采用存儲在項目的總服務的形式,獲取時,一方面,可以預先導入到工程現場的服務器或者主機上,根據需要,采用無線技術讀取,也可以根據實際需要,向工程現場服務器(主機)提出請求,然后由工程現場服務器(主機)向項目總服務器轉交請求。在處理上,也由項目總服務器根據請求,直接處理完成,便于工程電子文件閱讀設備讀取。
(2)臨時協作,按需共享:臨時協作模式考慮的是同一個工程現場不同施工點的工程電子文件閱讀設備之間的交互,因為同一個工程現場的不同施工點,工作性質大致相同,需要的工程電子文件的內容也基本相同,區別可能是具體施工的細微要求,比如高架橋不同路段高低的區別,這些工程電子文件,要求銜接更兼容,失誤更少,速度更快,因此,采用臨時協作,按需共享模式,這樣工程電子文件同源更新,減少出錯。
(3)實時更新,按需收集:這種模式是最底端的工作現場,也是工程電子文件直接應用的終端,同時也是工程電子文件改動較多的地方,為了符合施工習慣,也可以在工程小幅圖紙上直接修改,然后通過手機更改,在不考慮成本的情況下,也可以由工程電子文件閱讀設備直接拍照收集數據。
4.2 工程電子文件處理技術。論文設計的工程電子文件閱讀設備的處理技術包括兼容技術、識別技術和類型轉換技術、局部成像技術、分層對比技術、圖紙追溯技術和增強現實技術。本文只考慮工程電子文件的獲取需要,因此只給出前三種技術的設計方案。如圖2所示。整個核心部件就是內容處理模塊,內容處理模塊向布局引擎提供獲取工程電子文件內容和屬性統一接口,對具體的每種工程電子文件,只需要注冊一個格式的解析器,注冊標準內容獲取接口即可被解析和顯示。這樣既保證操作接口的統一性,又保證對各種工程電子文件支持的拓展性[8]。

(1)兼容技術:論文設計的工程電子文件閱讀設備,在兼容技術上,主要通過分析現有的工程電子文件的格式,將其納入格式兼容庫中,當有文件讀入時,如果是已經有的格式,則根據原有方案直接處理,如果是新的工程電子文件格式,系統則提醒對新文件進行處理,如果新格式處理難度較大,也可以提交服務器,由服務器進行處理,并更新格式兼容庫。
(2)識別技術:識別技術主要針對的是工程電子文件的內容,其工作有兩方面,一個是識別工程電子文件的各種屬性,比如時間、大小、授權單位、保密級別、是否可修改等,另外一方面是識別里面的內容,比如字符串、圖形,甚至包括內容的顏色,字體大小,格式等。在識別技術方面,主要采用的是施工特征識別,面向的主要是工程圖紙的識別,難度在于工程圖紙的符號識別。不少工程圖紙為更好地顯示,采用了彩色顯示,這也增加了識別的復雜性,論文采取背景顏色自動獲取的同色塊檢測法、顏色自動獲取的游程長度分析法[9],解決此方面的難題。
(3)轉換技術:轉換包括同類型轉換技術和異類型轉換技術。同類型轉換技術指的是同類型的文件的轉換,比如,有的圖片文檔是JPEG格式,有的是BMP格式,通過同類型轉換技術,轉成相同的格式,從而提高閱讀效果,減少因為類型差異導致的偏差,也便于比對。異類型轉換更多時候是為了提高閱讀的效果,比如局部成像技術,將部分圖紙轉化成預測的圖像,從而辨別圖紙設計的效果;另外,平面3D技術可以讓工程電子文件的閱讀效果更好。
隨著“一帶一路”的全球響應,中國基礎建設已經開始走出國門,雅萬高鐵、中老鐵路以及比雷埃夫斯港等一大批互聯互通項目開始啟動,這些項目中的工程電子文件的數量將更大,負責程度將更高。認真分析工程電子文件的來源和特點,融合成熟的計算機技術,研究工程電子文件的獲取模式與處理技術,將促進工程電子文件閱讀設備的實效,提高施工效率,減少失誤。
[1]付永華.基于電子紙的工程電子文件閱讀設備研究與設計[J].檔案管理,2014(05):33-35.
[2]劉家真.電子文件的保存、鑒定與存取——澳大利亞電子文件管理策略[J].浙江檔案,2000(03):28-29.
[3]李澤鋒.檔案數字化的電子格式研究[J].檔案學研究,2004(05):51-55.
[4]劉詩德,郭黎.電子出版系統的文件交流[J].今日印刷,1998(05):121-123.
[5]梁凱.檔案部門應用OFD格式的若干思考[J].浙江檔案,2017(01):64.
[6]李澤鋒.基于OAIS的數字信息格式管理[J].河南科技學院學報,2011(09):13-16.
[7]電子文件存儲與交換格式版式文檔(GB/T33190-2016)[S],http://www.sac.gov.cn/
[8]付永華,江源,胡星波.一種面向數字版權保護的EPD電子教材的設計與實現.[J].江西科學,2013(1):117-122.
[9]李洋,張曉冬,鮑遠律.基于特征模板匹配識別地圖中特殊圖標的方法[J].電子測量與儀器學報,2012(07):605-609.