



【摘 要】 審計作為黨和國家監督體系的重要組成部分,如何有效提升審計治理現代化能力成為影響審計效率的關鍵問題。工程項目審計中存在的數據多源異構且不完整、現場審計任務艱巨、分析取證難等問題與薄弱的審計力量形成了較為尖銳的矛盾。文章以JX電力公司工程招投標單位及人員資質審計為例,分析了信息不對稱條件下的人工作業流程及痛點問題,構建了招投標環節單位和人員資質審計數據治理模型,利用機器人流程自動化(RPA)技術,ETL設計并開發了數據自動化采集、處理和融合工具,實現了對招標資質要求、投標文件、參建單位及人員及外部數據的多源信息自動獲取及核查,有效提高了工程審計效率,為工程審計數據治理提供了具有實踐意義的解決方案。
【關鍵詞】 工程審計; 信息不對稱; 數據治理; 流程自動化
【中圖分類號】 F239" 【文獻標識碼】 A" 【文章編號】 1004-5937(2025)09-0031-07
一、引言
工程審計是以系統方法從行為、信息和制度三個維度對工程類經管責任履行情況實施的獨立鑒證、評價和監督,并將審計結果傳遞給利益相關者的工程治理制度安排[1]。工程項目通常持續時間較長、環節較復雜、涉及的參建方和相關工作人員眾多,工程招投標是違規行為較多的領域[1]。在招投標制下,業主和參建單位之間存在委托代理問題和信息不對稱現象,審計人員面臨的最大問題在于審計數據多源異構[2]、數據處理難、噪聲數據多等問題。而數據作為大數據決策范式下的重要生產要素,其本身的完備與質量關乎后續決策效果[3]。同時,工程審計材料不規范、不完整等問題,也影響工程審計數據獲取的正確性以及合規性[4]。
隨著數字化技術的發展,依托數字賦能,各種數智技術都已相互交織并統一于“收集證據、評價證據”的審計本質中[5]。采用數字化手段改善審計數據的治理方法以提升審計效率和審計質量早已迫在眉睫。電子數據必將成為審計工作的主要取證對象,將大數據技術作為工程審計新模式下的主要工具與內容載體將是大勢所趨[6]。安鑫等[7]認為在工程審計的風險評估階段可以通過自然語言處理(Natural Language Processing,NLP)、光學字符識別(Optical Character Recognition,OCR)、流程自動化(Robotic Process Automation,RPA)等技術,高效地分析和處理工程審計項目涉及的龐大的非結構化數據。郭紅建等[8]結合機器人流程自動化(RPA)技術從數據治理、模型構建、流程挖掘、流程自動化等方面創新內部審計數字化轉型路徑。學者們還提出遺傳算法和模糊神經網絡方法等深度學習算法可以從數據庫中提取知識,解決在海量數據條件下對審計數據的總體分析問題[9-10]。王雪榮等[11]、高觀浩等[12]、汪麗[13]等從工程審計數據平臺設計、非結構化數據處理、工程招投標造價數據庫構建方面提出了一系列解決方案,有助于構建數據互聯互通的工程審計大數據平臺。同時,學者們也發現了要通過數據治理,對數據資源進行有效控制,從而提升數據的價值[14]。在審計實務中,德勤應用數據分析、流程自動化、人工智能等數字化和智能化技術,自動化執行大量審計程序,將審計人員從機械性、重復性審計工作中解放出來。目前,針對行業領域需求的招投標審計數據治理方案尚不完備,存在一定的應用壁壘。
為了解決工程招投標的審計信息不對稱問題,審計人員亟須采用高效的數據治理方案,以問題風險為導向,實現工程招投標審計信息的獲取、分析、比對、審核以快速鎖定審計疑點。本研究以JX電力公司招投標中參建單位及作業人員資質數據為驅動,利用RPA和ETL技術,針對多源異構數據進行獲取、處理和融合,構建工程項目審計數據治理模型,以實現數據獲取、融合、分析的流程優化及自動化過程,解決工程招投標審計信息不對稱問題。
二、JX電力公司工程項目招投標審計現狀及痛點問題
(一)工程項目招投標審計重點
1.信息不對稱問題產生的風險分析
招投標是工程項目開始的首要環節。選擇有能力承擔工程項目的投標方,對于工程項目的質量保證有著重要作用。而在此過程中,信息不完全、信息不對稱現象明顯。基于信息擁有主體和市場競爭方式的視角,投標方擁有更多私有信息[15],在評標時,招標方無法充分了解投標方真實詳細的資質情況、現場作業人員的管理、具體的實施技術和方案以及誠信度等[16]。基于此,投標方對自身提供建筑服務質量相關信息占有絕對優勢。在信息不對稱的情況下,會誘發信息占有優勢方的“道德風險”問題。投標方由于信息占有優勢有可能虛報信息,不僅為工程質量埋下隱患,還可能隱含著投標人以不正當的競爭方式中標。此時,由市場信息不對稱造成的違規行為演化為投標方潛在的其他違紀違法行為,為工程建設帶來重大風險。因此,對參建單位及人員資質真實性、合規性審計是工程招投標審計的關鍵內容。
2.委托代理問題產生的風險分析
工程招投標形成了業主與參建單位之間的委托代理關系,參建單位對業主承擔了基于工程建設、資源托付等的經管責任,按照法律法規對工程項目開展建設和管理活動,是業主對參建單位最基本的要求[1]。根據《中華人民共和國建筑法》(2019)第二十九條規定,總承包單位可以將其承建工程中的部分工程分包給其他單位承建。傳統的委托代理關系中,由于合約條款不完善、信息不對稱、激勵不相容和環境不確定等多種原因,往往存在著參建單位和人員不具備相應資質參與項目,或提供了虛假的資質信息,偏離業主對工程質量的期望,給工程項目造成一定損失或風險。同時,一些大型工程承包商,由于其具有信息、技術和管理手段等優勢[17],往往表現出對自身信息和技術掌握程度、外界風險控制能力等的高度自信[18],從而低估項目風險[19],由此可能為工程建設配置不符合要求的其他參建單位和人員。因此,獲取參建單位及作業人員信息并進行合規性審計,是工程項目招投標制下合規性審計的重要內容。
(二)JX電力公司工程項目招投標單位及人員資質審計的總體思路
針對信息不對稱和委托代理問題所造成的審計風險,JX電力公司工程項目審計人員應對參建單位及人員資質的合規性和真實性進行審計。在合規性審計中,審計人員應確認參建單位及人員資質的合規性,檢查其是否符合現行法律和法規、專業、行業標準或合同責任的要求。進行合規性審計的審計思路包括以下三步:第一,確定所依據的現行政策、法律法規,如《中華人民共和國招標投標法》《中華人民共和國建筑法》等,審計人員需要從法律法規及招標文件中提取文字內容作為審計依據;第二,審計人員在投標文件中獲取參建單位及人員的資質信息;第三,對參建單位及人員資質信息與法律法規及工程項目采購需求進行比對,以確定是否合規。在真實性審計中,審計人員應采用相應的審計方法以驗證參建單位資質及人員信息是否真實。審計人員需要從建筑市場監督或企業信息查詢等網站中獲取參建單位資質信息和作業人員資質注冊信息,再將其與投標文件或現場收集的參建單位提供的信息進行比對,最終得出信息是否真實的審計結論。
1.參建單位及人員資質合規性審計的人工流程
合規性審計的主要流程是:首先,審計人員需要提取投標文件中的參建單位及相關人員資質要求。其次,獲取參建單位的資質及人員數據,總包單位的資質數據可以從投標文件中提取,分包的參建單位和人員數據需要從工程現場文件收集,審計人員需在現場審計時獲取參建單位及人員信息臺賬。最后,審計人員將總包單位或參建單位資質、人員信息與招標文件要求進行逐一比對,以驗證實施單位資質與人員的合規性。在此過程中,數據來源于投標文件、工程項目相關文件及工程現場記錄等,審計人員通過手工將投標文件和現場記錄文件所含信息記錄于Excel,同時登錄電子商務網站查找文件,通過互相翻閱、人工逐一比對完成,具體人工操作流程見圖1。
2.參建單位及人員資質真實性審計的人工流程
真實性審計重點檢查參建單位現場工作人員名單和資質是否真實,主要流程是:首先,審計人員從投標文件及工程現場收集總包、參建單位資質及作業人員數據;其次,審計人員將收集的單位及人員數據按照單位名稱、人員姓名等關鍵字段,輸入到全國或省級建筑資質注冊網站中,對參建單位及人員進行逐個查詢以獲取其注冊信息;最后,將收集的數據與網站注冊數據進行逐一比對,得出參建單位及作業人員的專業資質是否真實的審計結論(具體人工操作流程見圖2)。在這個過程中,數據來源于投標文件及工程現場工作日志、多家網站等,審計人員需要在網站人工輸入單位及人員名稱或者進行逐一復制粘貼得到搜索結果,再進行識別比對并得出結論。
(三)對參建單位及人員資質審計的痛點問題
現場審計人員對中標單位、參建單位及人員資質合規性、真實性審計是工程招投標審計中的常規審計程序。其中數據的獲取是整個審計環節中最基礎重要的一環,高質量的數據基礎是審計的先決條件,也是后續審計工作開展的重要保障。根據審計目的對所需數據進行采集,包括但不限于招標文件、投標文件、工程現場工作日志、外部網站等,以上內部數據可能來源于單位內部電子商務平臺、工程管控系統,還可能是現場人工填寫的表單;外部數據源可能來源于開放網站和公開的數據庫等。多源異構的審計數據的收集、整理和比對為審計人員帶來很多不必要的工作量,增加了工作強度和錯誤率,影響了審計效果。現有的審計流程存在的痛點問題分析如下。
1.數據來源途徑較多,數據結構存在差異
在參建單位及人員資質核查過程中,人員資質信息分別來源于參建單位投標文件/資質文件、現場作業人員信息表和全國或省級建筑市場監督網站,數據來源途徑較多;并且,以數據、文本、圖片等格式存儲,造成了數據結構化和非結構化的差異,使得審計人員需要將數據轉化為結構化的數據再進行整理和比對,加大了審計的工作難度。
2.審計所需數據量較大,人工操作費時費力
由于工程項目通常體量較大,所需的參建單位和人員眾多,從現場收集的參建單位及人員數據可能是以千或萬為量級計數,對每一個單位及人員都需要反復操作打開文件/網站、復制數據、粘貼到Excel表的操作,人工采集所需的時間長、工作量大,且容易重復采集。
3.多模態數據主要依賴于人工翻閱查找并比對,全量審計存在困難
在實際審計工作中,審計人員獲取的投標文件、作業人員信息、資質等常為文本、圖片、網站信息或電子版文件,人工的核查比對過程需要多重數據來源互相切換,在數據量較大的情況下,常采用抽樣審計來估計總體情況,且容易出現重復比對、出錯率高等問題。
三、工程項目審計數據治理模型應用思路
(一)工程審計數據治理模型架構設計
基于單位及人員資質審計的痛點問題,工程項目審計數據治理以底層數據為起點,結合RPA、ETL等技術,從數據治理角度出發,構建以數據為中心的工程審計數據治理模型架構(見圖3)。核心架構主要包括數據層、模型層、應用層三個層面,涵蓋數據采集、數據處理與融合、數據分析與核查、數據治理工具應用等。數據層的主要任務是實現數據的采集、清洗與融合處理,為工程審計建模提供高質量的數據基礎。數據采集部分利用RPA技術對各種來源的數據進行自動化采集,輔助或代替人工進行結構化數據處理[20]。通過RPA軟件中的預制件與PDF、Web等進行自動交互,形成數據采集的批量處理,實現了向數字化勞動力轉型。數據融合與處理部分采用ETL工具,實現多源異構數據的加載、清洗、鏈接等數據融合的自動化管理,最終形成工程審計數據集市,包括工程項目、參建單位、投標書、項目參建人員、作業人員和市場監管網站數據六個類別的數據子集,且通過主鍵和外鍵構建工程審計中間表。模型層包括基于經驗的核查模型與基于數據驅動的人工智能模型,兩類模型互為補充,協同提升審計工作的質量和效率。應用層則通過搭建工程審計數據治理工具,采用應用商店模式,為工程審計提供個性化與模塊化的應用接口,負載低、輕量化且形式靈活,能夠有效體現智慧審計中“精準提供智能化服務”的重要特征。
工程審計數據治理模型依托數字賦能,實現數據自動采集、自動處理與自動分析,構建數據治理全流程自動化閉環體系,延伸審計取證新思路,精準定位審計疑點,有效提高工程審計質量和效率,推動工程審計的數智化轉型。
(二)技術開發與部署框架
基于工程審計數據治理三層架構模型,對數據治理技術及審計領域專家經驗開展理論研究與數據試驗,設計實現“數據抽取→數據轉換→融合建模→數據質量探查與存儲→數據挖掘應用”的工程審計數據治理技術路線與開發部署策略(圖4)。數據的融合集成部分主要采用RPA與ETL技術實現流程的自動化處理。其中RPA主要在數據采集方面實現流程自動化。ETL技術通過各相關組件進行數據抽取、轉換與加載,并將融合后的工程審計數據存儲到數據庫中,同時ETL在整個數據治理流程中自動完成元數據管理、主數據管理、數據質量監控等。數據挖掘應用則采用python程序語言進行開發,通過pycharts庫進行數據展示與可視化,pytorch庫實現數據溯源、異常檢測與挖掘,pandas庫等實現數據分析,最終依托tkinter庫實現工程項目審計小工具的開發,為審計人員、決策人員與管理人員提供科學支撐。
四、工程項目審計數據治理模型實現路徑
(一)數據獲取的自動化流程設計
利用RPA技術設計的審計數據采集機器人將審計所需各種文件中數據按照審計流程需求進行“搬運”,生成便于審計核查所需的標準化數據。基于RPA技術的數據獲取,主要應用RPA軟件中與各種數據存儲載體如word、PDF、外部網站等交互的自動化預制件。在JX電力公司工程項目招投標審計中,可以利用機器人自動登錄風險管控監督平臺,提取參建單位名稱,再通過機器人打開建筑市場監督相關網站,逐行識別上述已提取的參建單位名稱,自動輸入網站中進行搜索,機器人會將搜索結果自動輸出至目標文檔。機器人從相關網站可以得到參建單位如參建單位統一社會信用代碼、法人、高管人員、資質信息、信用記錄、經營狀況、關聯公司等數據,還可以得到參建單位統一社會信用代碼、注冊人員和其他專業人員的姓名、身份證號、證書類別、證書編號、證書有效期等數據。數據采集的自動化流程具體如圖5所示。
(二)數據的處理與融合
工程審計數據的處理融合實現路徑主要采用ETL工具或定制腳本(如Python、SQL等)連接中間存儲介質,抽取RPA存儲的數據。RPA在前階段負責采集和輸出數據,ETL工具或腳本會從RPA輸出的中間點讀取數據,然后按照預設好的流程進行數據轉換和加載。通過ETL將抽取的RPA數據轉化成規定的格式和結構。在這一流程中,首先是數據清洗和格式轉換,例如采用ETL工具tUniqRow移除重復記錄,使用tReplace或tMap將數據源中的格式統一轉換為標準格式,使用tFilterRow減少噪聲數據等。其次是數據融合,比如使用tMap或tJoin等組件實現多源數據的融合。此融合路徑需要注意,在進行數據融合之前,需要選擇一個數據集作為整合后的數據集,然后在tMap組件上創建輸入表格和輸出表格,分別映射不同來源的字段,包括法人、負責人、第三方網站備案人員、招投標階段應答人員、合同簽訂人員、合同中指定現場負責人、工作票上工作負責人等。
以JX電力公司工程項目參建單位及人員資質審計數據融合為例,根據關鍵字段將查詢到的數據與四庫一平臺數據進行連接和整合。首先,基于上述數據采集與轉換清洗,選定公司內部的配電工程審計相關主數據集(來源于企業內部網站例如ERP、項目安全風險管控監督平臺等),數據字段包括項目基本信息、參建單位基本信息、人員基本信息等。其次,打開tMap或tJoin組件配置界面,選擇“參建單位統一社會信用代碼”作為關鍵字段,將配網工程審計相關數據和基于RPA獲取天眼查等互聯網備案的參建單位及人員相關數據進行連接,形成審計中間表。
(三)數據質量探查與存儲
在數據整合之后,為了保證數據的準確性和完整性,需要對審計中間表中的數據進行質量探查。數據質量探查的技術實現路徑采用ETL工具的Pentaho檢查數據質量,首先定義字段驗證規則,包括非空檢查、數據類型檢查、范圍檢查、正則表達式檢查以及其他自定義,采用tDataQualityCheck等組件進行數據的自動化規則檢查,對驗證通過和未通過的數據進行分離,用于后續存儲、處理和分析。在數據質量探查之后,采用tFileOutputExcel、tMSSQLOutput等組件將清洗和質量通過的數據加載到Excel表格、數據庫等目標存儲區。
(四)工程審計數據建模與審計工具開發
利用ETL技術進行數據融合及清洗后,構建兩類數據分析模型以揭示審計疑點。一是基于經驗的工程審計核查模型,該模型主要是針對融合后的工程審計數據按照人工經驗進行核查和分析,直觀性地識別出不一致的數據疑點,為人工審計的延伸和拓展。二是基于數據驅動的人工智能異常檢測模型,該模型旨在對工程審計數據集合進行特征提取,根據審計數據的特點,選擇合適的深度學習模型,如長短期記憶網絡(LSTM)可用于處理時間序列數據,卷積神經網絡(CNN)可用于處理圖像數據。BERT模型可用于處理數據實體之間的聯系。基于已有數據進行模型訓練與驗證,通過交叉驗證方法驗證模型的準確性和泛化能力,也可以結合多個模型進行集成學習,以提高模型的性能和穩定性。
基于以上數據處理與數據分析模型,采用python開發針對不同工程審計問題的智能審計小工具,并以.exe形式融合進入工程審計工具池中,以輕量化、客制化形式提升審計工作體驗。在JX電力公司工程項目參建單位及人員資質審計中,建立工程審計資質核查工具。經過數據融合及質量探查后的審計中間表中,已經具備了從外部網站獲取的參建單位及人員資質等相關信息,將其導入資質核查小工具中,作為審計依據。通過安全風險管控監督平臺,導出施工人員打卡信息作為待核查數據,將該待核查數據表也導入資質核查小工具中。通過調用小工具中的內置算法,核查出施工人員是否為參建單位注冊備案人員以及參建單位和人員資質是否符合項目資質要求等審計結論。最終核查結果以可視化形式展現到核查小工具界面上,并能通過溯源模型識別問題的關鍵節點。在JX電力公司工程項目審計現場,小工具經過驗證,在對電力工程項目審計過程中,已經發現疑點若干,為審計現場人員縮小了核查范圍,節省了人力和時間,初步產生較好的使用效果。
(五)數據治理模型部署策略
數據治理模型部署策略采用“審計機器人+中間存儲介質+ETL+審計小工具”模塊化部署策略。各個模塊之間相對獨立,同時模塊之間的通信接口需要定義清晰、標準化,確保模塊之間能夠有效交互和通信,實現高內聚、低耦合,從而提高整個系統的靈活性、可維護性和可擴展性。
模塊化部署策略在融合數據的基礎上,完成數據整合,確保每個數據點應有明確的時間戳、數據來源和版本控制,確保數據溯源的可追蹤性,基于整合后的審計中間表,構建數據邏輯模型與異常檢測模型,開發并部署審計小工具。依托數據分析、可視化技術、日志比對審計小工具各項性能和功能指標進行監督,檢查審計小工具能否達成預期目標,并依據指標數據不斷優化審計小工具,逐漸擴大審計工具的實施范圍,確保在不破壞原有流程和業務數據的基礎上實現工程項目審計數智化轉型升級。
五、結論及展望
本文基于RPA技術、ETL工具及異常檢測模型構建工程審計數據治理模型,采用模塊化方式進行部署應用,幫助審計人員完成數據自動化采集、數據處理和融合以及審計分析與決策,將原來只能以紙質媒介存儲的數據,或以圖像、掃描件等方式存在的非結構化數據,轉化為計算機系統和軟件可以讀取和分析的結構化電子數據,并通過自動化、智能化創新工具替代人工完成大量的審計工作,實現全量審計、深度分析、智能洞察、持續監控的全新審計模式,在一定程度上,能夠降低由信息不對稱產生的工程項目風險,實現優化審計流程,縮短審計處理時間,提高審計效率,降低審計風險,在工程審計建模方面具有廣闊應用空間,為工程審計數智化轉型提供參考。
【參考文獻】
[1] 鄭石橋,時現,王會金.論工程合規審計 [J].財會月刊,2019(21):92-95.
[2] 謝前前.基于多源異構數據的新興技術演化軌跡及趨勢預測研究[D].北京:北京工業大學碩士學位論文,2019.
[3] 陳松蹊,毛曉軍,王聰.大數據情境下的數據完備化:挑戰與對策 [J].管理世界,2022,38(1):196-207.
[4] 李華盛.工程造價控制中工程審計的應用分析[J].國際建筑學,2021,3(10):182-184.
[5] 楊道廣,陳波,陳漢文.智慧審計研究:理論前沿、實務進展與基本結論 [J].財會月刊,2022(11):15-31.
[6] 肖晗.大數據技術在S電力工程公司工程項目內審中的應用研究[D].石家莊:河北地質大學碩士學位論文,2022.
[7] 安鑫,孔會青,趙霞.會計師事務所智能工程審計體系構建及應用 [J].財會通訊,2024(1):141-146.
[8] 郭紅建,吳素萱.基于RPA技術的企業內部審計數字化轉型研究[J].會計之友,2023(20):13-19.
[9] 常法亮.基于數據挖掘的智能審計系統的設計與實現[D].成都:電子科技大學碩士學位論文,2010.
[10] 吳勇,陸藝,朱衛東,等.深度學習模型應用:面向審計業務全流程的整合性框架[J].財會月刊,2023,44(1):108-116.
[11] 王雪榮,侯偉龍,大數據智慧工程審計平臺構建——基于“點—線—面”思維的數據式審計模式[J].財會月刊,2021(17):92-97.
[12] 高觀浩,王雨佳,黃佳雯,等.電力工程造價精準管控大數據平臺構建研究[J].建筑經濟,2023,44 (S2):270-274.
[13] 汪麗.基于工程建設項目招投標數據應用的研究 [J].建筑經濟,2023,44(S2):150-152.
[14] 李題印,宣成,郁建興,等.數智賦能時代企業數據治理能力模型研究 [J].情報科學,2022,40 (11):20-25,39.
[15] 李新軍,王利.雙重供需關系下基于信息稟賦差異的均衡采購戰略[J/OL].中國管理科學,1-34[2024-04-07].https://doi.org/10.16381/j.cnki.issn
1003-207x.2023.0028.
[16] 豐景春,劉清,李明,等.信息不對稱視角下工程管理信息化建設決策研究[J].科技管理研究,2018,38 (16):197-204.
[17] 林濤.淺談我國對外承包工程業發展策略[J].人口與經濟,2012(S1):91-92.
[18] 高尚,高文棋,周晶,等.考慮承包商過度自信和時間價值的激勵契約研究[J].管理工程學報,2023,37 (2):108-118.
[19] REN Y,CROSON R.Overconfidence in newsvendor orders:an experimental study[J].Management Science,2013,59(11):2502-2517.
[20] 程平,何家鈺.基于RPA的醫療收費行為審計研究——以A公立中醫院為例[J].會計之友,2023(10):142-148.