摘 要:CAD圖紙文本信息對于設計人員高效工作和企業的信息化管理都具有重要作用。本文對國內CAD圖紙文本信息提取的現狀進行了介紹,探討和分析了CAD圖紙文本信息提取和處理的具體過程。
關鍵詞:CAD圖紙;信息提取;處理技術
中圖分類號:TP399 文獻標識碼:A 文章編號:1674-7712 (2014) 12-0000-01
隨著計算機技術的發展,計算機輔助技術(CAD)開始廣泛應用在機械制造設計中,AutoCAD軟件是目前應用比較廣泛的一款繪圖設計軟件。雖然CAD軟件給設計人員帶來了便利,極大的提高了設計效率,但是在目前的信息化管理中遇到了一些難題。設計人員在繪圖之后會得到大量的CAD圖紙文件,當設計人員需要對圖紙相關信息進行查閱時,過多的圖紙文件增加了設計人員的查找困難。此外,產品設計圖紙中除了主要的圖形外,還包括標題欄信息、明細表信息等文本信息。企業的信息化管理中會應用到這些文本信息,然而大多數企業的文檔管理系統不能夠直接對CAD圖紙文本信息進行讀取。因此,在直接讀取無效的情況下只能夠采用傳統的手工輸入,這就大大的降低了工作效率。而且信息收集的差錯率比較高,數據不便于實時更新、查閱和共享,這會制約企業的信息化管理的發展。本文針對這一問題,分析了目前國內一些CAD圖紙文本信息提取的現狀,并著重探討通過AutoCAD二次開發技術,來實現CAD圖紙文本信息的提取和處理
一、CAD圖紙文本信息提取與處理技術現狀概述
目前我國對CAD圖紙信息提取的方式主要有兩種:模塊式和自由表格式。模塊式是針對某種特定的標題欄和明細表進行定義,然后進行針對的匹配識別。模塊式具有提取效率高、提取錯誤率低等優點。但是因為模塊式的設計針對某種特定標題欄和明細表,所以不同的企業以及不同的圖紙類型都不能夠共用同一個模塊設計,具有一定的局限性。自由表格式克服了模塊式的局限性,它在分析標題欄和明細表的結構后,采用虛擬表格法來讀取圖紙的文本信息。這樣就能夠對不同類別的標題欄和明細表進行識別,但是信息提取的算法比較復雜,提取準確度和提取效率都不是很高。
在我國CAD圖紙信息提取技術發展中,許多學者做出了不同的貢獻。1999年,北京科學院的吳賓銳通過對說明文字控制的調整,使文字和圖形分離開來,從而可以對文字進行單獨的處理。2000年,浙江大學的石教英等學者提出了利用表格矩陣法來提取圖紙中的文本信息。通過矩陣方式可以區分各種類型的標題欄和明細表,從而對文本信息進行有效的讀取。2004年,南京工業大學的祁正新等學者對DXF文件進行了研究,在將圖紙文件轉換為DXF文件的基礎上來提取圖紙的文本信息。
二、CAD圖紙文本信息提取與處理
在CAD圖紙文本信息提取技術中,有很多種開發方式,本文將介紹以VB.NET作為支撐平臺,對SQL Server和Excel進行操控,從而獲取圖紙的文本信息的方法。在整個文本信息提取過程中,首先是將每張CAD圖紙的文本信息進行提取,生成Excel報表,然后將這些報表進行匯總,得到總體Excel報表。再在SQL Server數據庫中添加總體Excel報表,整理后就可以得到標準格式的零件明細表,方便工作人員進行查閱。
(一)CAD圖紙文本信息提取
一般在CAD圖紙上的文本信息主要有兩種方式,一種是借助文本字符串來表達信息,另一種是借助屬性塊來表達信息。下面針對不同的方式介紹明細表中信息的提取方法。
提取文本字符串格式中的信息時,需要考慮到單行文本和多行文本的不同,同時還要考慮到多行文本內的格式代碼,單行文本和多行文本字符串的位置都應該設置在左下角。在提取信息時,首先用For Each...In語句來尋找CAD模型空間中的實體對象,借助GetCorner方法在圖形中選定明細表的位置區域。然后用IndexOf方法來獲取文本字符串的格式代碼,用InsertionPoint屬性來獲取文本字符串的坐標,還需要用ObjectID屬性來獲取文本對象的ID號。這些獲取的參數是確定文本字符串身份信息的。其次,借助VB.NET的Array數組,將明細表文本字符串以及坐標值、ID值按照順序進行排列,從而確定文本字符串在明細表中的具體位置。最后,將這些排列后的文本字符串數組寫入到Excel列表中,注意字符串的位置要跟明細表中的位置一致。
提取帶有塊屬性格式的明細表比提取文本字符串格式的簡單一些,它對明細表區域的尋找方法都是一樣的。但是它不需要對信息進行整理排列,可以直接通過塊的GetAttributes來獲取塊的內容數組,然后直接將該數組寫入到Excel列表中。
(二)CAD圖紙文本信息處理
在成功提取CAD圖紙文本信息后,需要對信息進行處理。首先,采用編寫好的代碼將多個Excel列表進行匯總,生產一個Excel總列表,方便后面處理。然后,將Excel總列表導入到SQL Server數據庫中,導入方式主要有向導導入式和程序導入式兩種,向導式導入是數據庫自帶的,程序式導入需要編寫代碼。最后,將數據庫中的數據按照零件類型等進行分類,確定自制件、標準鍵以及外購件等不同類別數據。然后將同類數據進行整理,形成標準格式的零件明細表,以便工作人員的后期查閱。
三、結束語
提取和整理CAD圖紙文本信息,對于企業的信息管理和后期的數據查閱都具有重要作用。本文介紹了國內CAD圖紙文本信息提取的現狀,再在VB.NET平臺的基礎上分析了CAD圖紙文本信息提取和處理的具體過程。隨著企業信息管理要求的提高,如何更有效的提取和處理CAD圖紙文本信息仍然是一個研究重點。
參考文獻:
[1]伊國棟.工程圖紙中標題欄單元信息提取與識別技術研究[J].中國機械工程,2003.
[2]何改云.明細欄信息提取及處理技術的研究[J].組合機床與自動化加工技術,2005.