李新平

摘要:信息化社會累積了大量電子數據,如何審計這些電子數據的研究與應用是近幾年來審計領域需要面對的熱點問題。本文首先分析了可視化技術電子數據審計方法的重要性;其次對大數據的特點以及相關的技術進行了分析,同時闡述了可視化技術的電子數據審計措施,為今后的大數據環境電子數據審計提供理論基礎。
關鍵詞:大數據;數據可視化;電子數據;審計
隨著計算機網絡和信息科技技術的快速發展和興起,信息社會的構建完成,數據累積已經達到了海量,從結果數據到半結構數據甚至非結構數據的飛速變化、發展和累積,都昭示著我國社會已經面臨大數據時代。在這種背景下,電子數據的審計面臨著巨大的機遇和挑戰。國家早在2013年就已經指出要以積極的態度學習國外先進的大數據分析技術,并充分結合自身發展的實際情況將大數據技術積極應用于審計信息化建設中,讓我國的審計工作更加方便和科學。
數據可視化是指將數據信息用可以直觀感知的圖形圖像表現出來,使得人們可以直接在原本紛繁復雜的數據中非常快速高效地提取有用信息,以便能迅速地做出正確決策。數據可視化是一種快捷有效的圖形化審計手段,可以幫助審計人員清晰地傳達和接受信息,迅速發現問題,提高效率。本文將首先分析可視化技術電子數據審計方法的重要性;其次對大數據的特點以及相關的技術進行了分析,同時闡述了可視化技術的電子數據審計措施,為今后的大數據環境電子數據審計提供一些理論基礎。
一、基于數據可視化的電子數據審計方法
現在的大數據環境各種新技術如云計算、物聯網、移動互聯網等的推動下已經發生了爆炸式的增長,數據累積呈現出了指數級的升高。如何在海量數據中進行有效分析,將數據的分析結果以直觀的、可視的形式進行表達,是當前計算機 IT 界和學術界等研究的熱點。
(一)大數據概述
大數據的定義在目前來說沒有一個統一的定義,國內外學術界還沒有完全達成一致,但是它已經開始呈現自己的特點,具有獨一無二的特征。綜合表述的話,大數據(big data),是指海量的網絡或電子數據,既包括在互聯網上累積呈現的結構化、半結構化數據以及非結構化的數據。這種電子數據具有種類繁多的信息價值,是一種重要的信息資產,具有較高的開發價值,需要一定的技術手段進行處理或分析。我國對大數據的定義主要采用的是國務院于2015年頒發的行動綱要中的定義:大數據的主要特征為容量大、存取速度快且具有較高的應用價值,其是一類數據集合。而且在該發展行動綱要中已經清晰表明了這新一代信息技術和服務業態能夠成為發現新知識、創造新價值、提升新能力的發展新方向,可以采集、存儲以及分析大量、格式多樣的數據信息,更好的為社會為國家做出貢獻。
大數據主要具有大量(Volume)、多樣(Variety)、快速(Velocity)、真實(Veracity) 4個特點。
(二)數據可視化工具
數據可視化是當前大數據研究的一個重要研究方向,起源于 1960 年計算機圖形學。簡單地講,數據可視化就是通過圖形化的直觀手段,將復雜的數據模型表現出來。大數據可視化目前常用的工具主要有R語言、D3.js、Processing.js、TABLEAU、DATAWATCH、大數據魔鏡、Qlikview、SAS、SAP Business Object、水晶易表、IBM Cognos、Microsoft Excel等開源工具或者工具軟件。
這些工具比起早期的柱狀圖、餅狀圖等簡單的數據分析而言是用來處理較為復雜的或較大規模的非結構化數據,它們的主要目的和功能就是幫助數據使用人員通過數據的直觀觀察,快速洞察數據中的規律,清晰有效地提取數據信息,把數據的各個屬性值以多維數據的形式直觀呈現,將數據的各種屬性和變量直接展現出來,幫助使用人員從不同的維度觀察分析數據,協助數據使用人員對數據進行更深入更全面更細化的觀察和分析。
在大數據技術研究的推動下,數據可視化的含義已經明顯的擴大和延伸,并且其由單一的展示圖表轉變成為能夠分析、展現圖表的綜合體。
(三)電子數據審計原理
數據可視化技術能夠在大數據環境下更加簡潔的將海量被審計的數據信息表達出來,審計人員也能夠通過數據可視化技術發現大數據中存在的問題以及被審計數據信息中的模式,目前數據可視化可以成為審計的重要環節和手段。圖1是程偉提出的電子數據審計原理示意圖,筆者認為這個簡單的可視化流程示意圖已經清晰演示了在大量的需要被處理和被表達的信息的前提下,數據可視化是一個非常有效快速簡潔的結果呈現工具,能夠幫助用戶清晰明了的理解復雜概念或者數據。
(四)大數據分析原理
大數據分析是實現和應用大數據價值的重要途徑,只有通過多維度、詳細的數據分析才可以發現總結大數據中出現的規律,才能更好地實現基于數據的決策,才能基于實際情況去理解現實、對未來進行合理的預測。
大數據現有的分析數據源包括但不限制于結構化數據、多媒體數據、非結構化數據、移動數據以及日志數據等。通過對這些數據的抽取、轉換、過濾、排序、處理和加載,最后利用數據可視化工具進行數據的可視化轉換,為使用人員提供直觀數據結果。
在現代社會中,審計人員在大數據環境下開展審計工作具有一定的難度,海量和復雜的數據讓審計數據的分析和解讀更加困難。而數據可視化的分析方法能夠在一定程度上幫助審計人員對海量的數據進行分析和探索,其不僅讓審計工作人員能夠更加直觀的分析審計數據,同時也能幫助工作人員深入分析和了解審計數據。利用數據可視化分析方法分析數據信息的基本流程主要是利用可視化軟件將需要審計的數據轉變為更加形象的圖像內容,幫助他們從總體上系統地理解和分析被審計數據的內涵和特征。另外,也可以審計人員與可視化軟件進行交互,自我設定輸出的可視化圖形和圖像,從不同的角度和層面獲得對被審計數據的理解,達到全面地分析被審計數據的目的。
二、電子數據審計方法對比
電子數據可視化的審計手段基于數據可視化工具使用上。大數據可視化目前常用的工具主要有 R語言、D3.js、Processing.js、TABLEAU、DATAWATCH、大數據魔鏡、Qlikview、SAS、SAP Business Object、水晶易表、IBM Cognos、Microsoft Excel等開源工具或者工具軟件。
開源工具使用起來較為復雜,目前常用的基于SQL的數據查詢方法一般是通過對被審計對象的專業審計分析,構建相關SQL語句,在數據庫或審計軟件中運行SQL命令,這就需要審計人員具有一定的計算機技術,可以編寫SQL命令。這在無形中提高了審計條件,增加了審計難度,在實際的審計工作中并不推薦使用。
而市場上現有的數據可視化工具中對審計人員最友好的應該是TABLEAU,該類數據可視化工具軟件是比較簡單的一類軟件,其完美結合了數據運算和圖表分析內容,用戶只需要在數字畫布上放入大量的數據信息既能夠直接獲取到已經制好的圖表信息。這對審計人員的其他技術要求非常低,使用方法和用戶界面也比較友好。
至于專業的審計軟件,使用范圍不是很廣,被審計對象不一定會購買專業的審計軟件,而且專業軟件的友好性要比商業化的數據可視化軟件低。
三、總結
大數據環境下審計工作不得不面臨被審計單位的大數據累積,審計人員需要改變傳統審計觀念,學習掌握新的審計技術,利用數據可視化技術這一重要手段,從整體上把握被審計數據情況,快速發現可疑數據,推動審計工作在新時代中的前進。
參考文獻:
[1]陳偉.計算機輔助審計原理及應用(第三版)[M].清華大學出版社,2016.
[2]陳偉,Wally Smieliauskas.大數據環境下的電子數據審計:機遇、挑戰與方法[J].計算機科學,2016,43 (1):8-13,34.
[3]陳世敏.大數據分析與高速數據更新[J].計算機研究與發展,2015,52 (2):333-342.
[4]張引,陳敏,廖小飛.大數據應用的現狀與展望[J].計算機研究與發展,2013,50 (11):216-233.
[5]謝然.大數據可視化之美[J].互聯網周刊,2014 (6):32-34.