摘要:數據式審計是在信息化環境下應運而生的一種全新的審計模式,它是利用信息技術,針對企業內部基礎數據、數據處理流程及信息系統進行的審計。通過分析數據式審計模式的基本特征及其一般流程,并在此基礎上對聯機分析處理技術和數據挖掘技術在審計數據分析中的應用進行研究,總結了對應用兩種技術實現審計數據分析的過程。
關鍵詞:數據式審計;數據挖掘;聯機分析處理
中圖分類號:TF239.1 文獻標志碼:A文章編號:1673-291X(2010)02-0144-03
隨著信息技術的快速發展,各行業和機構普遍采用信息化管理,審計人員所面對的不再是紙質賬目系統,而是計算機信息系統和多種多樣的數據庫,數據式審計也正是在這樣的背景下孕育而生的,它以無可比擬的優勢代表著“信息化環境下計算機審計的未來”。本文從兩個方面對其進行了探討,第一部分對數據式審計的發展及其在信息化環境下具有的基本特征進行了描述,第二部分闡述了數據式審計的一般流程及關鍵技術的應用。
一、數據式審計的發展及基本特征
數據式審計起源于20世紀60年代初,最早稱為計算機審計,是隨著計算機在財務會計領域的應用而產生的。在此基礎上,從EDP(電子數據處理)、AIS(會計信息系統)、MIS(管理信息系統)到DSS(決策支持系統)的會計信息化的發展歷程正是信息技術在會計領域應用的真實寫照。信息技術在會計工作中的應用不僅改變了原有的會計數據處理流程,也為信息化下的數據式審計成為新的審計方法提供了有利的條件。
隨著信息化進程的加快,企業內部的Internet開始建立,信息流動呈現無紙化特征。至今,前臺以電子商務為主,后臺以ERP(企業資源計劃)系統為支撐的新型數字化企業已經逐步成為企業的主要運營模式。尤其是CRM(客戶關系管理)及SCM(供應鏈管理)與ERP的高度融合,成為新型數字化企業的主流模式。與此同時,企業數據的電子化也極大地擴充了會計數據的范圍,一些非貨幣計量的數據,如音頻、視頻、圖表等與原有的會計數據共同構成了企業的基礎數據庫,企業的各種經營活動數據無一例外地在基礎數據庫中保存。面對大量繁雜數據的存儲、傳輸、查詢以及各種操作人員權限的劃分,以數據庫技術為代表的計算機技術得到進一步的廣泛應用,而這一切都對數據式審計的發展起到了推動作用。
數據式審計是以系統內部控制測評為基礎,針對企業的基礎電子數據展開的審計,與傳統審計相比,數據式審計具有以下特征:
(一)審計對象:源數據庫及信息系統內部控制
企業會計環境的變化,使審計工作重點進一步突出,審計人員所面對的不再是大量的紙質賬簿、會計報表等,而是企業底層數據庫中的基礎數據。信息化環境下企業存儲的主要數據是以記賬憑證為主的會計數據和不能以貨幣計量的非會計數據所構成的“數據源”,其他數據只不過是此“數據源”的翻版。由于會計準則的彈性和人為的盈余管理,財務報告的真實性和有用性一直受到使用者的質疑,會計計量的多元化,使得財務報告所反映的會計信息的有用性變得更加“撲朔迷離”。因此,審計人員可以深入到企業的底層數據庫,獲得原汁原味的數據,在此基礎之上將其轉化為有用的信息,這些信息由于沒有經過企業“人為加工或粉飾”,因而在真實性和有用性方面得到了極大的改善。因此,CPA進行財務審計時,應從這些“數據源”入手,加大對基礎數據的審計。由于運用了先進的信息化手段,數據式審計可以快速和便捷地處理海量數據,解決了在傳統的紙質和手工條件下,審計人員想做而不可能做的事情。
除了上述電子數據外,數據式審計的對象還必須包括計算機系統內部控制。由于計算機系統內部控制涉及到電子數據的安全性和完整性,因此在通常情況下,在對電子數據進行審計以前,應首先對產生這些電子數據的計算機系統內部控制的安全性和有效性進行測試和檢驗。
(二)審計核心方法:構建審計中間表和審計分析模型
通常而言,我們所說的數據式審計是指數據式系統基礎審計,它是以審計模型為出發點,通過采集審計模型需要的數據,并對數據進行處理和分析,實現對數據和信息系統進行審計的方法。其基本審計過程分為兩部分:一是通過研究政策、對信息系統內部控制測評等工作,結合可以采集到的電子數據,確定審計需求,構建審計分析模型。二是根據審計分析模型,通過數據采集、處理與分析,確定審計疑點,實現審計目標。審計過程中,審計人員要經常執行建立某種業務的審計中間表和審計分析模型,并進行某種類型的數據分析等審計程序。其中,審計中間表是在具體的審計項目實施過程中所形成的,是對采集到的被審計單位數據進行清理、轉換之后,將其按照提高審計分析效率、實現審計目標的要求進一步選擇、整合而成的數據集合;審計分析模型則是由審計人員通過設定判斷和限制條件來建立起數學的或邏輯的表達式,用于驗證審計事項實際的時間或空間狀態的技術方法,現有的建模類型主要有專家經驗建模、根據法律法規建模、根據業務規則建模以及根據數據間的勾稽關系建模,它們都是實現數據式審計的關鍵方法。
(三)關鍵審計技術:數據分析技術
在以往的審計模式中,審計的核心技術方法是從最先的詳查法、抽查法發展到后來的符合性測試和實質性測試。在數據式審計模式中,計算機手段既可以解決詳查問題,也可以解決測試問題。面對大量的電子數據,審計人員能否將其轉化為有用的信息成為審計工作的關鍵。因此,數據分析技術成為數據式審計的關鍵技術。
二、數據式審計的關鍵技術
與傳統審計模式一樣,對于一個數據式審計模式下的審計項目而言,按其進行的先后邏輯順序,可以劃分為審計準備、審計實施和審計完成三個過程。其中,主要不同在于審計實施階段,此階段主要完成對電子數據的采集、整理與分析工作。
圖1 數據式審計過程及任務劃分示意圖
在數據式審計模式下,面對被審計單位各式各樣的信息系統以及存儲于其中的海量數據,大量新型審計技術方法正被廣泛運用到審計中來,特別是在審計實施過程中的各個環節:數據的采集、整理過程可以使用各種成熟的技術和工具,包括數據庫訪問技術、數據庫同步復制技術、數據庫聯邦技術、數據裝載與清洗工具以及審計軟件等相關技術。在整個數據式審計過程中,核心問題就是對采集、處理后的電子數據進行分析,從中找出疑點,從而確定審計的重點。 數據分析是對數據的處理,并試圖使數據轉化為有用的信息。 數據是底層的、元素性的,它可以有多種多樣的組合,在用途上可以做多種多樣的拓展,從而形成多種多樣的信息;信息是上層的,具有明確的表現形態和內容,在用途上也有一定的限制,因而只能做有限的再利用,不能作深度的挖掘。 聯機分析處理技術和數據挖掘技術則是數據分析最為重要的工具。
(一)數據式審計關鍵技術之一:聯機分析處理
審計業務流程中,最主要的環節是對基礎數據庫中各種類型的數據進行分析,從中找出疑點,從而確定審計的重點,聯機分析處理技術為數據分析提供了強有力的審計分析工具。
聯機分析處理技術(On-Line Analytical Processing,簡稱OLAP),是針對決策問題的聯機數據訪問和分析,也是目前對于海量數據處理所采取的主要方法。聯機分析處理技術最基本、最核心的特征就是從多個角度分析數據,也稱為多維分析。它支持審計人員從不同的角度,靈活快捷地對被審計單位的電子數據進行挖掘分析,從而發現數據內在規律。OLAP展現在用戶面前的是一幅幅多維視圖:沖破了物理的三維概念,采用了旋轉、嵌套、切片、鉆取和高維可視化技術,在屏幕上展示多維視圖的結構,使用戶直觀地理解、分析數據,進行決策支持。
一般而言,多維數據分析可以分為以下幾個步驟:
1.獲取審計數據源
多維數據分析的數據源可以直接設置為被審計單位的后臺數據庫,也可以設置為審計人員自行生成的中間數據庫:通過了解被審計單位提供的數據字典,了解基礎數據中各表中存儲數據的內容、各字段的含義以及各表之間的關聯關系,結合審計目標和特點,從與審計分析主題業務類別相關的基礎數據表中選擇反映該業務類別主要信息的字段,組織這些字段,來構建我們的數據倉庫模型。審計人員可通過數據庫嵌入或數據庫鏈接等連接方式將數據導入,在對數據進行格式定義和清理后,生成所需的審計中間數據倉庫。相對來說,后一種方式更為安全、可靠。
2.創建多維數據集
多維數據集也就是常說的數據立方體,它是聯機分析處理(OLAP)中的主要對象,是一項可對數據倉庫中的數據進行快速訪問的技術。多維數據集是一個數據集合,通常從數據倉庫的子集構造,并組織和匯總成一個由一組維度和度量值定義的多維結構。維度是審計人員分析指標時所觀察的不同角度,度量值則是各個角度的具體數值,如一個用于銷售分析的多維數據集內包括時間、地區、產品維度及其度量值銷售金額、銷售數量等。
3.瀏覽分析數據
建立完多維數據集之后,原來需要反復、多次查詢和無法查詢的數據信息,就可以通過切片、切塊、旋轉等操作挖掘出來。審計人員可以根據實際的業務需求,對數據進行匯總、關聯、聚類、分類、預測等分析,尋找其中隱含的模式和知識,來迅速掌握總體情況。當趨勢、異常或者錯誤被確定后,還可以深入到底層數據進行鉆取,作進一步的分析和判斷。
(二)數據式審計關鍵技術之二:數據挖掘
數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、事先不知道的、但又是潛在有用的信息和知識的過程。它一般采取排除人為因素而通過自動的方式來發現數據中新的、隱藏的或不可預見的模式的活動,利用數據倉庫中包含的信息;數據挖掘可以回答審計人員原先根本沒有想過的問題,它是在對數據集全面而深刻認識的基礎上,對數據內在和本質的高度抽象與概括。
數據挖掘技術分析方法很多,目前在審計工作中的常用方法主要有:(1)數據概化。數據庫中通常存放著大量的細節數據,通過數據概化可將大量與任務相關的數據集從較低的概念層抽象到較高的概念層。通過該方法,審計人員可從不同角度、不同層次上了解某類數據的概貌,從而為其判斷提供依據。(2)聚類分析。 聚類分析是將數據分組成多個類或簇,同一個簇中的對象之間具有較高的相似度。在審計中,對于特定交易記錄群的聚類分析可以以不同特征劃分為不同的特征群,從而描述各個群的特征,找出離群孤立點,對其重點分析,確定審計風險,發現審計線索。(3)關聯分析。它通過利用關聯規則可以從操作數據庫的所有細節或事務中抽取頻繁出現的模式,其目的是挖掘隱藏在數據間的相互關系。因此,在對財務數據或經濟數據的審計中,可運用關聯分析技術方法,針對同類或不同類會計科目及數據項之間可能存在某種對應關系來查找、挖掘,從而發現一些隱藏的經濟活動,為審計人員的進一步工作提供參考。
數據挖掘在審計數據分析中的實施步驟如圖2:
數據挖掘技術在審計數據分析中的應用過程一般需要經歷確定挖掘對象、數據準備、建立模型、數據挖掘、結果分析與知識應用這樣幾個階段。審計人員和數據挖掘人員首先要根據審計目標和內容要求確定數據來源,并對有關數據進行轉換和清理;在此基礎之上,針對審計任務的所屬類別,確定將要進行的挖掘操作類型,如統計分析、聚類、關聯規則等,設計或選擇有效的數據挖掘算法,產生數學分析模型并加以實現;然后對模型進行評價,解釋并評估挖掘結果,其使用的分析方法一般應視數據挖掘操作而定,通常會用到可視化技術;最后,根據審計人員的要求,對所獲得的設計知識進行組織,并以一種審計人員能夠使用的方式呈現。
聯機分析處理與數據挖掘兩種技術的主要區別在于:聯機分析處理屬于一種驗證型的分析,即在某個假設的前提下通過數據查詢和分析來驗證或否定這個假設,其分析過程本質上是一個演繹推理的過程。它側重于與用戶的交互、快速的響應速度及提供數據的多維視圖,屬于用戶驅動,因此,很大程度上受到用戶水平的限制。而數據挖掘不是用于驗證某個假定模型的正確性,而是在數據庫中自己尋找模型,注重自動發現隱藏在數據中的模式和有用信息,其本質是一個歸納的過程。數據挖掘屬于數據驅動,使審計人員不必提出確切的要求,系統能夠根據數據本身的規律性,自動地挖掘數據潛在的模式。所以,從數據分析深度的角度來看,聯機分析處理位于較淺的層次,而數據挖掘則處于較深的層次,二者最關鍵的差別在于是否能自動地進行數據分析。
三、結論
綜上所述,雖然基于聯機分析處理和數據挖掘的審計數據分析技術在審計中的應用尚處于起步階段,但已經顯示出傳統審計方法無法比擬的巨大優勢。數據分析技術不僅是一種審計技術,而且是一種審計的思維方式。相信這種新的審計方式將為審計行業帶來新的機遇,并促進審計理論與實務的深層次發展。
參考文獻:
[1]董化禮,劉汝焯,等.計算機審計——數據采集與分析技術[M].北京:清華大學出版社,2002:151-153.
[2]張磊,莊作欽.數據轉換整理方法分析[J].中國審計,2006,(18):40-41.
[3]易仁萍,陳耿,楊明,等. 數據挖掘及其在審計風險管理中的應用[J]. 審計與經濟研究,2003,(1):3-6.
[4]胡榮.數據挖掘——現代審計處理數據的新方法[J].中國審計,2004,(7):38-40.
[5]桑果.數據式審計的分析模型探析[J].南京審計學院學報,2008,(2):71-74.
[6]石愛中,孫儉.初釋數據式審計模式[J].審計研究,2005,(4):3-6.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文