文/福建省泉州市城鄉規劃信息中心 吳新蓉
城市規劃屬于一項重點工作,而其中的檔案管理與工程質量息息相關。城市規劃檔案屬于各個部門展開規劃管理、規劃審批的主要依據,同時能夠對工程質量進行評估,看其是否符合相關的建設標準。而信息技術的快速發展,讓以往的城市規劃檔案數據處理以及檢索逐漸被淘汰,無法滿足大家的應用需求。而將AI文字識別技術應用到城市規劃檔案工作中,可以彌補傳統工作中的不足,使檔案工作的效率與質量顯著提升,最終讓城市規劃檔案顯現出巨大的價值。
自2015年以來,我國各個地區逐步開啟了城市規劃檔案數字化工作,到2018年,部分重點區域已經形成了規范化的數字檔案,并且能夠實現統一的管理。用戶能夠根據自己的權限,調取系統中的部分內容;而有關的工作人員還能夠達成在線移交、在線調取等,這些工作的實現都為后續的檔案數據挖掘打下良好基礎。
在這一過程中,逐漸顯露出一些問題,雖然檔案數字化投入了大量的人力、物力以及財力,數字化建設團隊越來越多,但是由于城市規劃檔案數據較為繁雜且種類繁多,致使部分歷史檔案有所缺失,無法保障檔案的完整性。
在收集城市規劃檔案時,工作人員在整理、鑒定數據的有效性等方面會耗費大量的時間與精力,同時還要與規劃部門進行協調。前期的數據鑒定工作基本上是人工進行操作,審查時間長、處理效率低?,F階段的城市規劃檔案主要分為三方面,分別為規劃編制類、規劃管理類與規劃監管類,在每一個類型下還會細分出眾多的子項目,檔案數量多,類型雜,并且檔案中還存在著一些敏感信息,在移交檔案時,可能出現數據重復與分類錯誤等問題,這會對后續的工作造成一定的不利影響,同時會對檔案的數字化建設與價值挖掘造成阻礙,進一步增加了檔案處理的復雜度。
在城市規劃檔案數字化中應用AI文字識別技術,可以從根本上降低工作量,并且保障檔案文字錄入失誤大幅度減少,從而使得檔案錄入質量顯著提升。同時,當進行歷史檔案補錄工作時,AI文字識別技術的應用,可以起到技術上的支持,使得檔案數據更加完整、可靠。具體應用優勢如以下:
(一)具有較強的精準性?,F如今,市場上普遍運用的AI文字識別技術一般都基于深度學習能力,能夠為使用群體提供包括圖片在內的多種文字識別檢測服務,在速度上以及操作上具有明顯的優勢。并且,在我國部分地區的城市規劃檔案數字化工作當中,AI文字識別技術的應用,與手寫識別相對比,其準確率可以達到70%,而對于一些印刷的文字,在識別上準確率能夠達到90%。
(二)具有高效率。目前所存在的AI文字識別技術,每一字符識別時間平均為2ms,而且可以在連續的更新與優化中始終保持著穩定。在部分城市規劃檔案處理實例中,每完成一件檔案,時間約為3分鐘,這包括了格式轉換時間、網絡傳輸時間、文字識別時間以及人工校對時間。如果將AI文字識別技術應用到城市規劃檔案工作中,其文檔提取時間相較于傳統的文字識別方法能夠縮短1分鐘。
(三)具有較高的穩定性。AI文字識別技術,可以完成對多種格式的圖像以及文字的編碼轉換,并且在表格處理工作時,還能夠判斷出圖像表格的準確數量,完成動態化的切割操作,讓經過切割之后的圖像仍然可以保存原有的表格塊。除了這些,AI文字識別技術本身具備著文字糾錯功能,具有較高的穩定性能。
(四)具有針對性。在實際的城市規劃檔案數字化工作當中,將AI文字識別技術應用到其中,能夠實現自主模版配置功能,并結合實際的檔案樣式完成相應的配置,讓其可以達成城市規劃檔案提取以及補錄的具體要求。
(五)具有友好性?,F如今,已經存在的AI文字識別技術逐步擁有了文字批量識別、單文件識別、項目識別等功能,使用群體只需要把檔案上傳到系統中,就可以達成全文數字化的檢測,并對檢測完的成果進行驗證,如果驗證通過了,那么會和原有設定模板進行匹配,如果識別失敗,會快速反饋,并提示出錯誤的原因,最終讓所識別的檔案信息完成自動化的分表顯示以及分組顯示。
(一)實現技術上的創新。首先,應完成圖像去噪這一工作。對于城市規劃檔案而言,其中所涉及的大部分文件屬于老舊的紙質文件,而這些文件上多多少少會存在著染色、字跡模糊等情況,這時便要完成圖像去噪,讓文字識別的精準度顯著提升。其次,要進行表格提取這一工作。城市規劃檔案里面的絕大部分內容都會以表格的形式存在,因為表格線的影響,若采取傳統的文字識別技術,會降低識別的效果。而應用AI文字識別技術中的表格提取算法,可以把所有的表格提煉出來,并完成對各個類別數據的整合,確保文字識別的精準度。此外,應優化識別的結果。要結合檔案信息的實際需求,對所得出的識別結果進行轉換,讓其成為預期格式,比如電話格式、時間類型等,不但提升了工作質量,還會提升數據的精準性。最后,要完成項目識別的排序分組。開展大規模的項目識別工作時,許多檔案編號在排列上具有規律性。對此,要按照檔案編號的實際特點,專門打造出一種分組排序算法,讓所有的檔案都能夠精準完成算法排序工作,讓大規模的檔案實現數字化識別。
(二)把控根本質量。AI文字識別技術與傳統的手寫文字識別方式進行對比,在識別的精準性上不是很高。對此,需要對識別結果進行檢查。第一,完整性檢查,按照檔案的著錄字段以及城市規劃數據的根本要求,查看基于AI文字識別之下的結果是否完整,對于一些應該錄入而未錄入的字段進行重點檢測。第二,精準性檢查,根據比例進行抽查工作,看識別結果中是否存在文字上以及內容上的錯誤。第三,有效性檢查,對電話號碼、檢查日期及其編號等內容,查看其格式轉換是否正確,以此保障著錄數據在實際應用時的可行性。質量檢測時,可以采取人工檢測或者是機器檢測的方法,打造AI文字識別系統時,要對嵌入機器的檢測步驟進行綜合考慮,從而使機器檢測結果體現在人工復檢中,讓檢測質量達成雙重的把控。
(三)優化數字化加工流程。在開展城市規劃檔案數字化工作時,應巧妙應用AI文字識別技術,并讓所有的數字化加工流程得以確認。首先,在圖像掃描階段,應提前完成電子文件格式的轉換。其次,原有人工錄入階段,可以用AI自動識別技術進行取代,但是最后還需要采取人工校對的方法,提升檔案數字化工作效率。此外,要完成檔案系統和AI文字識別技術間的有效銜接,利用減少步驟環節、變化時序等形式,讓AI技術可以更好地應用到檔案數字化工作中,使各個操作流程變得簡單,達成降低成本的目標。需要注意一點,優化流程并不是短時間內就可以達成的,而是需要根據時間的推移不斷完善技術。
(四)做到安全管控。首先,應當使用可靠、穩定的AI文字識別技術系統,系統屬于技術應用的主要載體。而在城市規劃檔案數字化工作之中,早期工作一般會應用現有的第三方平臺。在進行平臺選擇時,應先完成多方內容的比對,檢測好主流AI文字識別平臺是否穩定、安全,以此避免由于系統存在漏洞而造成檔案的外泄以及遺失。其次,完善現場安全管理機制。應根據新時期的發展特點,對各項任務進行有效分配,制訂相關的安全管理機制。比如,在設備安全檢查、網絡線路上制訂出應急制度,以此保障問題解決得及時性,讓安全管理的水平顯著提升。最后,強化數據安全管理。根據數據的具體使用方向以及實際工作與使用情境,創設AI文字識別系統與數據庫,城鄉規劃檔案在進行數字化建設之前,首先要對數據檔案的保密性進行分級。在數據安全管理中,對于密級數據檔案與非密級數據檔案,在數字化構建與數字化管理中的方式存在著較大的差異性,其中的各項要求也不同。在完成數字化構建之后,要進行數字化成果核驗,挑選出不適合對外公布的數據信息,并集中進行刪除。在AI文字識別平臺與檔案管理系統中,要針對不同用戶的訪問權限進行分類管理,成果數據只能在指定的操作范圍內進行使用。
總而言之,除了上述內容,若想讓AI文字識別技術的應用更加有效,應加強對于數據的安全管理,根據實際的城市規劃檔案工作情況,構建出高質量的AI文字識別憑條,讓檔案更具安全性。此外,對于一些數字化成果,還要進行保密檢查,將一些不適合對外公開的內容進行剔除,使得城市規劃檔案所公開的內容更加規范、合理,提升檔案管理的有效性,為城市規劃后續工作的實施打下良好基礎。