◆何 準/ 武漢大學經濟與管理學院實驗與數據中心
隨著信息技術和計算機網絡的興起,各行各業的數據量不斷增加,對大量數據進行分析、查詢、處理成為必然,大數據時代已經來臨。在大數據時代背景下,審計環境發生了翻天覆地的變化,審計數據呈現出體量大、類型多樣、處理速度快等特點,審計手段也進入了大數據式審計。如何更快適應審計環境的變化,更迅速、準確地處理數據,積極探索和創新大數據時代審計信息化建設的方式方法,應對海量信息帶來的機遇和挑戰,是審計人員亟待解決的重要課題。
(一)審計對象的大數據化需要大數據審計。大數據時代,各行各業的財務數據和業務數據海量增長,數據量由MB、GB 為單位存儲提升為TB、PB為單位存儲,并明顯有成倍擴大的趨勢,數據存儲也由結構化數據變為非結構化數據,數據分析軟件、網絡結構圖、圖像、影音等技術大量運用于各行各業。
(二)審計方式方法創新需要大數據審計。重點領域、重點行業多年的審計成果已初步顯現,財務報表、記錄臺賬、文件檔案和相關憑證等所能反映出的“面子”問題已逐步規避。隨著數據信息技術的發展,很多問題更加隱蔽化、深層次化。如何在大量、規范的賬務中發現潛藏的違規問題,需要由賬簿審查、憑證核對、賬表審計的“傳統審計”轉型為全方位、多層次、更為深入的“數據化審計”。
(三)審計全覆蓋需要大數據審計。審計全覆蓋使得審計領域和范圍不斷擴大,對審計機關和審計人員提出了更高的要求。對各項政策落實的高度關注,需要審計部門將關注重點由財政資金的使用情況擴展到使用績效等內容,資金運行由線性審計變為立體式審計,做到“橫向到邊、縱向到底”,實現真正意義上的審計全覆蓋。
(一)實現完備的數據采集和分析
一是對財務電子數據進行審計。在工作過程中不僅要采集財政、財務收支賬本的數據,還要擴大數據來源,開啟數據通道,全面掌握各部門、單位的數據資源,并充分利用信息化系統平臺開展審計,實現由數據說話。二是不僅要實現對審計對象、部門的全覆蓋,更要對各行各業各部門所有歷史時期產生數據的全面收集、整理、分析。只有對批量數據進行分析研判、掌握數據運行規律,才能全面實現對數據的收集、整合、分析,真正實現大數據下的全覆蓋審計。三是數據采集分析的海量化,不僅是采集的原始數據的海量化,還將是分析數據的海量化、數據模型的海量化,更是問題庫、法規庫、審計方法庫的海量化。
(二)提高數據分析的精準性
1.利用大數據資源,結合審計對象業務操作流程,通過對現有數據資源的審計進行總結提煉,挖掘出審計資料、審計方法中的漏洞與不足,為審計項目提供參考依據。
2.實現被審計單位業務流程還原和再造,通過政策關聯和業務數據的獲取,讓審計人員更加熟悉被審計單位的業務運行模式,發現政策運行和部門管理過程的漏洞、缺項和風險點。
3.通過對相關行業數據全面、有效的分析,實現互聯互通與數據資源疊加,將分散的數據相互關聯并進行深度分析,跟蹤資金使用情況與關聯業務的發生,并通過外部相關數據的輔證,逐步強化數據分析的精準性,準確定位被審計單位存在的問題,將每一筆資金的運行都納入審計監督。同時,通過分析評估相關政策實施的效果,發揮審計的“預警”功能。
(三)完善審計過程的可控性
審計項目實施過程中現場審計情況階段性進展、審計發現問題報送、項目資料審理等缺乏“前瞻性管理”,常出現項目前緊后松,重現場審計、輕資料審理和案卷歸檔等問題,不利于收集審計成果。大數據審計模式下,可實現對審計過程化的管理,即對審計由計劃編制、下達、準備到數據分析、現場審計、資料審理的電子化運作,如設置現場審計時間預警,定期報送數據資料,根據審計重點調整各階段實施周期,審計過程留痕便于責任界定和項目及人員考核等,將審計人員的有效工作時間更多地用于審計業務工作中。
(四)建立標準的數據模型庫
1.傳統審計是通過基礎信息發現審計疑點問題,進而深化為審計成果的過程,審計業務人員主觀能動性和關注的側重點及知識結構等差異決定了發現問題的不同。大數據審計模式下,常見問題和基本關注點固化為模板,審計人員依據模板即可完成常規問題審計。

2.強化數據庫應用,實現審計項目計劃編制、項目下達、審計準備、項目實施流程自動化管理。例如在編制審計項目計劃時,通過風險性評估,根據當年經濟發展關鍵字等進行項目篩選,項目確定后的準備階段自動向審計人員匹配相關領域的法律法規政策,甚至提供常見問題的定性及適用條款等。
3.建立完備的數據模型庫、審計案例庫和法規庫,并強化數據庫間的綜合利用,通過基礎數據的錄入,數據模型庫自動完成對數據特征的分析,結合體現出在案例庫或審計線索中對已有問題的表述進行關鍵字匹配,進一步抓取到最直接相關的可疑點,完成問題檢索調用,實現普遍問題準確定性和法規正確適用。
(五)實現審計成果的共享
1.大數據審計不僅可以通過對相關領域數據進行分析,挖掘群體行為的共同特點,提示社會現象的潛在規律,為政府制定政策提供關鍵依據,還可以評估政府政策的實施效果,從而幫助政府不斷發現問題,改進方法。
2.數據庫和審計案例庫的完善和運用,將為審計人員培訓教育、加強橫向交流提供平臺,也將為還原歷史數據,模擬審計對象業務操作流程場景提供技術支撐。同時,審計案例庫、審計方法庫、法律法規庫等的綜合應用將幫助建立更多的審計數據模型,從而進一步擴大審計成果,提升審計能力。
3.大數據審計涉及多部門、多行業,而現在各行業相關部門之間信息資源缺乏整合,數據分散,數據質量難以保證。為促進信息共享和業務協同,提高數據的透明度、可用性和可靠性,需要政府與各行業主管部門自上而下的頂層設計。
(六)統一審計組織方式和統籌調配人員
1.統一審計組織方式。在審計一盤棋的大趨勢下,越來越多的地方組織開展了“上審下”和“交叉審”,更多的項目將采取上下“同步審計”。即同一時間對多個地方的多個項目進行審計、重點指導和部署,審計機關不僅要點對點地交流,還應升級為點面結合和網間互動,不僅要運用普通的視頻會議溝通交流,更要實現審計培訓、信息實時傳送與審計現場對接,對現場的疑點問題實時回傳并進行“預判和診斷”;對常規性審計項目逐步實現全國、全省統一聯動統一采集分析,統一整理數據,集中提出資金管理使用、政策落實、機制制度中存在的疑點,由現場審計人員進行核查。
2.統籌調配審計人員。對所有審計人員實施“智庫”管理,統籌調配審計人員:一是在重點項目審計中完成對不同審計機關人員的抽調、搭配;二是在綜合性審計項目中促成審計人員的力量均衡;三是對重點項目的審計側重點進行專長領域的審計人員安排。
(一)加快大數據平臺建設和管理。應盡快建立能夠實現審計現場和辦公自動化相統一的大數據平臺,建立審計項目計劃、審計文書流轉、審計數據采集、整理、加工、轉化、存儲、分析、交換及審計項目審理、歸檔等協作化運行的審計大數據平臺,通過權限分配完成對數據存儲和占用空間的分配,便于審計工作的開展。應注重數據使用權限的分配、監管和數據加密技術應用,確保大數據存儲和使用的安全,尤其是涉密數據,不僅要保證不被外部數據攻擊,審計人員也需加強自身的大數據保密意識和安全使用。
(二)創新大數據審計思維。審計行業與各行各業的發展,尤其是高科技行業的發展緊密相連,要運用大數據審計思維,創新方式方法應用。審計人員不僅應關注一對一的指向性審計,還要具備舉一反三、深入挖掘的拓展型分析能力;不僅要能夠繞過障礙揭示問題,還應能夠通過障礙進行原因分析;不僅要按照常規思路思考問題,還要具備能夠利用大數據技術實現流程簡化的發散性思維。大數據審計要求每位審計人員不僅要精通審計業務,還要會運用現代化電子信息技術。所以,不僅要在培養現有人員的基礎上下功夫,還要加大對具有大數據思維及創新應用能力的復合型人才的引進,為推進新時代大數據審計提供有力的人才保障。
(三)建設大數據審計平臺架構。在大數據應用領域,數據是核心資源,大數據意味著全樣本數據。審計工作大數據的處理過程如圖1 所示。一是數據來源。數據可以來自本地文件、數據庫、互聯網上網絡爬蟲抓取的HTMI 網頁數據、或各單位實時輸入的數據以及數據流等渠道。ETL 是數據抽取(Extract)、清洗(Cleaning)、轉換(Transform)、裝載(Load)的過程,根據不同的需要,將大量審計數據分別以結構型數據、非結構型數據以及文檔數據等方式存儲,作為數據倉庫以備聯機分析處理(OLAP)。二是數據處理過程。數據計算過程包括離線批處理、實時計算、機器學習和全文搜索等數據處理方式,為價值密度低的審計工作大數據提供有價值的數據資源作準備。OLAP(Online Analytical Processing)是一種聯機分析處理技術,它使分析人員能夠迅速、多維度地觀察信息,深入理解數據的目的。三是數據分析。數據分析包括可視化分析,分析人員要能看見結果;數據挖掘,要從大數據中找出有價值的信息;預測性分析能力,分析出來的結果要有前瞻性,知道未來結果或趨勢;語義引擎,能從文檔中發現所需信息;數據質量和數據管理,分析結果要保證數據高附加值。

圖1