王子豪
(南京審計大學政府審計學院,江蘇 南京211899)
當今社會已經進入大數據的時代,越來越多的大數據技術被運用到社會的各個領域,審計領域也不例外。大數據背景下,審計工作所需的數據量越來越多,數據類型愈加復雜,因此,為保障審計質量,在審計工作中使用大數據技術已經成為提高審計效率、精確審計結論的必然趨勢。
進入大數據時代,數據數量不斷增加,數據類型更加復雜,而傳統審計軟件所能處理的數據數量和數據類型有限,導致其不能滿足大數據審計的需要(陳偉和居江寧,2018)。大數據技術中的可視化技術可以將數據類型轉換成便于審計人員理解的圖像,使審計人員能夠直觀地觀察數據概況,迅速發現數據之間的規律,找出數據背后所隱含的關系及問題。此外,在大數據背景下,傳統的審計工具對被審計單位的電子化數據進行審計時存在諸多不足,如無法找出數據背后隱藏的關聯信息,先進的大數據技術也可能會被審計對象用于作弊等(呂新民和王學榮,2007)。在此情況下,可運用數據挖掘技術中的聚類分析、關聯分析等方法,對被審計單位的財務報表、會計憑證及賬簿等財務數據和音視頻等資料進行深層次分析,揭示其內在聯系,便于審計人員識別與分析。
綜上所述,積極使用可視化技術與數據挖掘技術等大數據技術,是審計工作更高效的重要保障。
目前可視化技術與數據挖掘技術均已用于審計工作中,其中可視化技術借助圖形化的手段,可以將信息清晰地傳達出來,方便審計人員根據信息進行溝通并快速發現問題(陳偉,2017)。
數據挖掘技術可以運用數據挖掘模型,通過對被審計大數據進行挖掘,得出可用于產生審計結論的證據或相關數據。但在運用數據挖掘模型之前,必須對采集到的原始數據進行如格式轉換、提煉等預處理操作。然而從被審計單位獲得的原始數據往往是大量且冗雜的,其中會存在一部分無關數據不利于審計人員從中發現問題(陳丹萍,2009)。若想使數據挖掘技術達到使用目的,就必須做適當的預處理,而可視化技術的作用則是對數據進行處理,將其轉換成便于審計人員理解及使用的形式。因此,將可視化技術與數據挖掘技術配合使用,可以解決數據的預處理問題,便于數據挖掘技術在審計工作中正常運行。
目前有不少文獻研究可視化技術在審計工作中的運用,也有大量文獻研究數據挖掘技術運用到審計工作中的情況,這些文獻對人們分別了解兩種技術在審計中發揮的作用奠定了一定的基礎,但若將兩種技術進行配合運用,則可以解決數據挖掘技術的預處理問題,文章基于可視化技術與數據挖掘技術在審計工作中的運行流程,設計出將兩種技術配合使用的運行流程,并闡述該流程的運用優勢。
可視化分析是通過圖形分析處理復雜數據模型的一種分析方式,將大量數據進行總結概括,將數據轉換成便于審計人員理解的圖像,幫助審計人員發現數據間的規律,及數據背后存在的問題。常見的可視化技術包括:時間序列圖、折線圖、散點圖、氣泡圖、地區分布圖,以及標簽云等技術。目前可視化技術在審計實務工作中被廣泛應用。例如,在大氣污染防治審計中,審計人員借助其中的時間序列圖及散點圖等技術,比對不同時期某地大氣中不同化合物的占比,來分析該地空氣質量有無變差,以此來判斷相關部門的績效情況。此外,在扶貧審計中,由于扶貧資金單項金額較小且覆蓋面廣的特點,因此需要的數據較多,來源較廣,但審計部門所能派出的人力、物力有限。利用可視化技術,通過采集線上數據庫的相關數據,就可收集到大量有用數據,減少了審計人員的現場辦公時間,保留了審計人員的精力,而且可視化技術還可對收集到的數據按照審計人員的思路進行總結,能夠快速且全面地把握被審計單位的基本情況,提高了審計效率。
數據挖掘技術是以找到數據間的關聯性及因果關系為目的對海量、深層次的數據源進行篩查的技術,能夠幫助審計人員在短時間內篩選出具有代表性的審計樣本,在一定程度上降低了審計風險。其主要技術方法包括數據概化技術、統計分析技術、聚類分析技術及關聯分析技術等。
由于數據挖掘技術可收集利用的數據較多,因此該技術常用于外部審計人員對企業財務報表的審計當中。運用統計分析技術,對被審計單位相關財務指標的歷史數據進行分析與預測,得出預測值,再與審計值進行比較,若差別較大,則可對此重點關注。此外由于財務造假需要多項科目進行配合,因此難免出現個別科目存在異常數據的情況,對此可運用關聯分析技術,對可能存在關聯的不同類科目及各類數據進行審查,若存在異常數據,則可對與異常數據相關聯的數據進行審查,判斷是否存在隱藏的經濟活動。
數據挖掘技術雖有傳統審計技術無法替代的作用,但在現階段的運用過程中,還是會存在一定的風險。例如,2014年外部審計人員對某燃氣控股有限公司構建的運用了數據挖掘技術的審計系統進行深層次分析,發現該系統存在一些審計風險。首先,該公司傾向于借助專家的審計經驗,以此為基礎確定審計目的及需要收集的相關數據,而隨著該公司規模的擴大,業務類型也變得復雜,使得專家確定的范圍并不能覆蓋所有類型的業務,產生了審計盲區。其次,該公司運用數據挖掘技術僅對如財務報表、會計憑證等結構化數據進行處理,而如音頻、視頻等非結構化的數據則不進行檢查,這就會導致一些關鍵信息遺漏,從而影響審計結論。
由此可以看出,若在進行數據處理時不借助其他輔助技術進行處理,很可能導致數據收集和篩查不全面的情況發生,從而影響審計結論。
由于可視化技術與數據挖掘技術都是對海量復雜數據進行分析處理,因此,目前二者在個別審計案例中配合使用,但在配合使用過程中,依然是進行分開使用,雖然通過可視化技術與數據挖掘技術產生的審計線索可以相互參考,但這樣分開使用會造成審計思路不清晰、審計流程不便捷的情況。
2016年7月1日,國家發展改革委發布《推進醫療服務價格改革的意見》,要求各地公立醫院調整醫療服務價格,取消藥品加成政策。在此背景下,審計部門就是否存在藥物加成現象對某市某公立醫院進行了審計。由于該公立醫院藥品類型繁多,且要對2013~2016年的藥物價格情況進行審計,涉及數據較多,因此審計部門運用了可視化技術與數據挖掘技術對相關內容進行分析,以保障審查的數據可準確表現該醫院藥品的整體情況。
審計人員首先使用了可視化技術中的氣泡圖進行分析,通過將每年的氣泡圖進行整合,審計人員發現,從2013年到2016年,氣泡圖中氣泡的數量,即加價藥品數量雖然在減少,但是每個氣泡的面積,即加價率卻在增大,在對此情況進一步考察后,審計人員發現該公立醫院表面上響應政策的號召,在減少藥品的加價情況,但實際上通過增加藥品的加價率來變相地對藥品進行加成。隨后,審計人員利用散點圖進行分析,發現加價藥品的購入價大多集中在100元以內。而為了探究對什么類型的藥品進行加價,審計人員又通過數據挖掘技術中的聚類分析,將藥品進行分類篩查后發現,從2015年到2016年,該醫院選擇加價的藥品大多為膠囊藥品。最后,針對以上現象實施進一步審計程序后,審計人員最終得出結論:該公立醫院為對藥品進行加成,選用了購入價較低的膠囊類藥品進行加價,由于購入價較低,因此其加價空間較大,且購入價較低的膠囊類藥品不易被著重檢查。
從以上案例可以看出,可視化技術與數據挖掘技術在審計工作中可同時使用,且能達到審計人員所期望的目的,但是在該案例中,對于兩種技術的使用效率并沒有達到最優。此案例中審計人員先使用了所有需要用到的可視化技術后再使用的數據挖掘技術,然而使用其中的聚類技術的目的便是找到哪些類型的藥品進行了加價,而這一步可以在使用完氣泡圖后就實施。因為氣泡圖可以顯示哪些藥品進行了加價,在此基礎上對氣泡圖所顯示的藥品直接利用聚類分析即可進行分類篩查,這樣在使用數據挖掘技術時就不用對被審計單位的數據進行預處理,因為氣泡圖的作用就是為了預處理,從而可以優化審計流程。
數據挖掘技術在使用過程中,若想建立數據挖掘模型,則必須先對獲取的數據進行預處理,但審計人員在這一環節若只使用數據挖掘技術,很可能遇到難以理解的數據形式,阻礙審計人員進行預處理。此外,預處理的結果關系到審計問題的提出,所以單靠審計人員自身很可能不能精準總結出數據的關聯性及因果關系。因此,若使用可視化技術對收集到的數據進行預處理,則可以幫助審計人員較為全面準確地總結出數據的基本情況,再配合審計目標,就可提出關鍵性的問題進行審查,最終使審計結果更加可靠。
可視化技術在審計工作中運用的基本流程如圖1所示,在收集到被審計單位的相關數據后,將數據錄入承載可視化技術工具的系統中,再根據審計人員的需要,對數據進行可視化建模與分析,將初步的結果通過圖形等方式表現出來。此時審計人員再通過視覺感知,并配合自身的審計經驗進行分析,若對結果存疑,還可再次將數據錄入系統,轉換其表現形式,將此過程不斷循環,最終得出讓審計人員能夠完全理解的數據特征、數據間關系的圖像,將其確定為審計證據。

圖1 可視化技術在審計工作中的運用流程圖
圖2為數據挖掘技術在審計工作中的應用流程,審計人員根據審計目標提出審計需求,根據需求對被審計大數據進行預處理,并對處理結果進行總結與分析,使其轉化成數據挖掘問題。再和數據挖掘人員進行交流與溝通,數據挖掘人員根據問題設計出數據挖掘模型,對被審計單位內外部數據進行挖掘。最后由審計人員對產生的數據挖掘結果進行評價,檢驗結果的有效性,即是否可作為有效的審計線索或審計證據。

圖2 數據挖掘技術在審計工作中的運用流程圖
圖3為可視化技術與數據挖掘技術配合運用的流程,從圖中可以看出,該流程實際上是將數據挖掘技術中原有的預處理步驟換成可視化技術中的分析模塊,即從建模到審計人員判斷可視化結果是否可作為審計線索這一段流程,然后將由可視化技術分析出的審計線索轉化成數據挖掘問題,使可視化技術與數據挖掘技術進行拼接,產生一個新的運用流程,以解決數據的預處理問題。

圖3 可視化技術與數據挖掘技術的配合運用流程圖
該流程相比于未加入可視化流程的數據挖掘流程而言,該流程在建立數據挖掘模型之前,可對數據進行可視化分析,使得預處理的結果不再完全依靠主觀判斷,而是依賴于客觀技術,使分析出的結果更加接近被審計單位的實際情況,幫助審計人員與數據挖掘人員建立有效且包含面廣的數據挖掘模型,使得出的審計結論更加全面可靠。此外,將兩項技術流程組合成一個新流程使用,能夠規范操作步驟,使審計思路更加清晰。就該流程的應用范圍而言,由于該流程既包含了可視化技術,也包含了數據挖掘技術,因此該流程可應用于兩項技術單獨使用的審計項目中,另外,該流程解決了數據挖掘技術的預處理問題,因此可以將該流程嘗試應用到目前數據挖掘技術無法較好發揮作用的審計項目中,進一步檢驗該流程的應用范圍。
綜上所述,在大數據背景下,將可視化技術與數據挖掘技術進行配合運用,可以解決數據預處理難的問題,可保障審計工作順利開展。但在現階段,兩項技術并沒有得到較好的配合,因此需要審計人員不斷提升自身素質,與不同領域的部門進行合作,盡快掌握相關大數據技術,從而優化審計工作流程,提高審計效率。
大數據帶我們進入了一個新紀元,使我們對這個世界有了更加深刻、客觀的認識,而審計作為經濟監督活動的重要工作,審計部門應該對此更加重視,這就需要審計人員既努力學習先進技術,又要掌握大數據背景下新的審計思路,以更加飽滿的態度來迎接大數據技術所帶來的便利與挑戰。