999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘算法的審計數據分析及案例應用

2020-06-10 12:02:48王良鮑喜王云周建成張海超
中國注冊會計師 2020年6期
關鍵詞:數據挖掘分析

王良 鮑喜 王云 周建成 張海超

“數據挖掘”通常也稱為“知識發現”,顧名思義就是從海量數據中找出有用的知識。數據挖掘一般是指從大量的數據中通過算法搜索隱藏于其中信息的過程。本文主要利用機器學習界提供的技術來分析海量數據,利用數據庫界提供的技術來管理海量數據,通過機器學習和數據庫的交叉運用,從而實現基于數據分析挖掘的審計方法。

數據挖掘是針對日益龐大的電子數據應運而生的一種新型信息處理技術。它一般排除人為因素而通過自動的方式來發現數據中新的、隱藏的或不可預見的模式或活動。這些模式或活動是指隱藏在大型數據庫、數據倉庫或其他大量信息存儲的特定數據。利用數據倉庫中包含的信息,數據挖掘可以發現注冊會計師(CPA)原先根本沒有關注過的問題。數據挖掘方法千差萬別,不同的方法應用于不同的領域和對象。選取合適可行的挖掘算法對挖掘的效果起著重要的作用,它將直接影響我們的決策。在實際運用過程中,很多挖掘方法不是單獨使用的,它往往和其他方法結合起來,才能產生預期的效果。

本文對數據挖掘分析方法在審計數據分析中如何應用進行深入研究,同時結合數據挖掘應用案例探索其具體實現路徑。

一、基于數據挖掘算法的審計應用

對于審計人員來說,如何利用人工智能技術、圖算法、機器學習、遷移學習、數據挖掘算法等新技術,實現審計人員從被審計單位海量的數據中心找出高質量的審計數據,挖掘潛在的審計疑點,作為審計證據是一個難題。數據挖據技術的出現,為審計師進行大數據分析和挖掘有價值的數據提供了可能。基于挖掘技術的審計就是利用各種數據分析方法對審計數據的充分利用、充分挖掘,以獲取更多相關的審計線索。其主要達到如下目標:

(1)直接提供審計證據,如明顯違反會計準則和相關會計法規的行為;

(2)發現異常信息,起到“紅旗(red flag)”的指向標作用,能引起審計師的注意;

(3)借助數據挖掘技術,可部分代替審計職業判斷,減輕審計師的工作強度。

數據挖掘技術在審計中的應用包括數據驗證、數據分析、智能推理三個方面。具體如圖1所示。

1.數據驗證

數據驗證子系統具體可分為檢查、核對兩大功能。檢查是按照會計準則和相關政策法規的要求,對某一項數據或處理進行檢查,以發現是否有違反規定的情況。核對是將某些具有內在聯系的數據,按照其勾稽關系,進行逐一核對與排查,其目的是驗證被審計單位信息系統業務流程的正確性,有無人工非法干預等,為分析提取數據間的隱性關系做好基礎支撐。數組驗證包含全面重算、社會對賬兩個重要方法。

(1)全面重算:是對導入會審軟件的基礎數據,按照與被審計單位相同或相似的處理方法全方位重新計算,來驗證被審計單位提供數據的真實性與正確性,以及信息系統處理邏輯的正確性,這是一種簡單、經濟的防止“假賬真查”的方法。

(2)社會對賬:社會對賬目的是實現對原始憑證和公允價值的自動化查證。它要求監管部門建立會計信息中心,要求各經濟單位定期上傳標準格式的會計數據,CPA通過相關的認證機制從中獲取標準對賬數據。從而克服傳統函證方式的不足,實現原始憑證查證的自動化。通過專業估價網站,獲取各個時點的公允價值數據進行審計。

2.數據分析

數據分析子系統具有數據檢索、篩選、統計和智能分析四大功能。檢索是按照CPA的要求,以靈活多樣的方式向CPA提供信息,達到“想看什么就能看什么”的目的,使CPA徹底地從紙質資料中解放出來。篩選是依據抽樣的原則與方法,按照CPA的指令將CPA感興趣的或具有代表性的一部分數據挑選出來,目的是縮小審計范圍,降低審計風險。統計為CPA提供一系列的分析指標與工具,最大程度地方便CPA進行信息處理。智能分析是運用數據倉庫技術,對被審計單位的數據進行多維分析和挖掘,給CPA提供新的疑點。

基于現有審計知識的數據分析方法主要有以下幾種:

(1)合規分析方法:通過會審軟件的會計核算部分,根據會計準則和被審計單位業務處理邏輯的數據處理要求,檢查是否有賬證不符、賬賬不符、賬表不符、表表不符的情況;賬戶對應關系是否正常;是否存在非正常掛賬、非正常調賬現象;賬戶余額方向是否存在異常;是否有違背被審計單位業務處理邏輯的情況等等。

(2)趨勢分析方法:指CPA將被審計單位若干期相關數據進行比較和分析,從中找出規律或發現異常變動的方法。它是利用少量時間點上或期間的經濟數據來進行比較分析的特殊時間序列法,此法有助于CPA從宏觀上把握事務的發展規律。CPA可根據審計需要來確定時間序列的粒度,如年、季、月、旬、日等。

(3)結構分析方法:也叫比重分析法,是通過計算各個組成部分占總體的比重來揭示總體的結構關系和各個構成項目的相對重要程度,從而確定重點構成項目,提示進一步分析的方向。結構分析法和趨勢分析法還可結合應用,進行數據結構比例在若干期間的變動趨勢分析。應用結構分析法和趨勢分析法,對被審計單位的資產、負債、損益和現金流的結構分析、趨勢分析以及結構比例的趨勢分析,對被審計單位的總體財務狀況、經營成果和現金流量情況形成總體的全面了解。

(4)比率分析方法:比率是兩個相關聯的經濟數據的相對比較,主要用除法,它體現的是各要素之間的內在聯系。比率分析法計算簡單,結果簡單,便于 CPA 判斷,由于采用了相對數,因此可以適用于不同國家、地區、行業、規模的客戶。

(5)經驗分析方法:CPA在長期的對某類問題的反復審計過程中,往往能摸索、總結出此類問題的表征。在審計實踐中抓住這種表征,從現象分析至實質,就可以較為方便地核查問題。將CPA的這種經驗運用到計算機審計中,將問題的表征轉化為特定的數據特征,通過編寫結構化查詢語句(SQL)或利用審計軟件來檢索,查詢出可疑的數據,并深入核實、排查,來判斷、發現問題,便能實現根據審計經驗構建個體分析模型的目的。

(6)多維數據分析:聯機分析處理(on-line analysis processing,OLAP)工具為多維數據分析提供了十分有效的功能,它能夠從多種角度對從原始數據中轉化出來的、可真正為用戶所理解的、并真實反映企業的、多維特性的信息進行快速、一致、交互地存取,從而獲得對數據更深入地了解。

3.智能推理

智能推理子系統包括推理、判斷和預警三大功能。推理是根據CPA經驗與規則,采用機器學習、遷移學習和基于大數據技術的知識圖譜,實現審計數據的融合,進一步挖掘審計知識中的隱性關系。判斷是根據CPA經驗與規則,針對某個問題給出一個參考性的結論。預警是自動運用已經存在的知識與經驗進行推理與判斷,預示問題的類型與可能發生的環節。會審軟件的專家系統、智能審計系統的特征主要由該模塊來實現。

圖1 基于數據挖掘技術的審計系統

圖2 聚類算法模型思路

圖3 審計績效評價因素

二、基于數據挖掘的數據分析與案例應用分析

數據分析、智能推理實現的核心就是數據挖掘分析方法,數據挖掘分析方法對挖掘審計線索、確定審計重點有不可忽視的作用。基于已有的審計數據顯性網絡,通過探究推理算法、關系挖掘算法等技術手段,實現審計知識中的隱性關系挖掘,實現豐富和擴充審計關注點知識庫。如針對用電用戶行為、供應商行為、支付行為、信息化用戶操作行為等通過聚類分析方法找出異常行為的事項,作為審計重點關注對象。數據挖掘分析方法通常需結合使用,如采用聚類分析將業務類似的工程項目進行細分,再利用關聯規則分析歷史數據的領用情況,即根據歷史領用情況分析出領用規律,作為編制領用標準的依據。

下面將重點對聚類算法、數值分析算法、層次分析算法在審計數據分析中應用方式和應用流程進行研究分析,并結合“基于聚類算法的廣告費審計”案例進行闡述。

表1 各單位經營數據及廣告費

表2 聚類分析結果

(一)聚類算法

運用聚類分析可進行一些“孤立點”的挖掘。所謂“孤立點”就是存在一些數據,它們不符合數據的一般模型。數據中的異常點可能隱藏了重要的信息,反映了企業經營中潛伏的問題或暗藏的商機。孤立點挖掘通常描述為:給定一個n個數據點或對象的集合及預期的孤立點數目k,發現與剩余的數據相比時顯著相異的、異常的或不一致的k個數據。孤立點挖掘運用廣泛,能用于欺詐檢測,如探測不尋常的信用卡使用或電信服務。

如A公司設計了一個用于成本費用審計的模型。傳統上,A公司主要通過將各個單位的成本支出進行排序,然后把排在前頭的單位確定為審計關注點。面對被審計單位比較隱蔽的違規行為時,這種簡單的分析方法是很難發現異常,所以應該先挖掘成本費用的數據規律,根據這些規律確定各單位進行的哪些支出存在疑點。

為此,模型思路如下:首先,利用聚類分析將各單位劃分成若干組,各組內的單位具有相同的經營特征;然后,判斷被審單位某項成本費用支出是否與同組單位的支出有顯著差異,從而評估該成本費用支出是否出現異常,并提請審計師關注。

以廣告費用為例,A公司各單位的廣告投放與當地經營環境相關,如果各單位經營環境相當,其廣告費水平應該相當。所以對于廣告費異常檢測模型是一個2步模型:首先,利用數據挖掘引擎對A公司單位進行聚類分析,將當年與被審單位經營環境相當的單位劃分成一組;然后使用t檢驗判斷被審單位的廣告費是否與組內單位的廣告費支出有顯著性差異,如果被審單位廣告費支出與同類單位的支出有顯著差異,表示當年被審單位與經營環境相當的單位相比,花費更多或者更少的廣告費,顯示廣告費的支出存在審計疑點,需要審計師執行進一步分析,模型思路如圖2所示。

表1為各單位經營數據及廣告費(與單位1的比值)。其中,省會城市表示單位所在地是否是省會城市,1表示是,0表示否;居民人數為單位所在地常住居民數;工業用電量和生活用電量表示單位所在地的工業用電量和生活用電量;供電容量表示單位可提供的總供電容量;供電面積表示各單位所在地供電業務的覆蓋范圍,這些字段統稱為各單位的特征變量。

其中,“分組類別”為聚類分析的結果,可以看到單位1分到組別2之中,也就是說屬于組別2的單位擁有與單位1相當的經營情況特征(表2)。

執行聚類分析之后,執行顯著性檢驗。該步驟主要檢驗被審單位1的廣告費支出與同組的單位的廣告支出是否存在顯著差異。該模型采用基于t檢驗的顯著性檢驗方法,檢驗單位1的廣告費支出是否處于組別2單位廣告費支出的有顯著性的差異(表3)。

從表4檢驗結果看,Sig.值小于0.001,表示單位1的廣告費支出與組別2內的單位廣告費支出有顯著差異,表示存在審計疑點,審計師應該進一步關注單位1廣告費與其他單位發生偏差的原因。

表3 單個樣本統計量

表4 單個樣本檢驗

表5 判斷矩陣的元素標度

(二)數值分析方法

數值分析是根據字段具體的數據值的分布情況、出現頻率等對字段進行分析,從而發現審計線索的一種數據處理方法。這種方法從“微觀”的角度對電子數據進行分析,它在使用時不用考慮具體的業務,對分析出的可疑數據,再結合具體的業務進行審計判斷,從而發現審計線索。相對于其他方法,這種審計數據處理方法易于發現被審計數據中的隱藏信息。

常用的數值分析方法主要有重號分析、斷號分析、Benford 法則分析,這些數值方法已經被國際著名審計軟件ACL、IDEA 等采用。重號分析是用來計算某個字段中相同數值的重復次數;斷號分析是對統計字段的數據記錄中是否連續性進行分析,如果有斷點,則統計出來,否則只列出統計字段的最大值和最小值,它主要針對的是整型和日期型數據。Benford 法則(Benford’s Law)認為數據庫中的數據與數據順序必然遵循某種預定的規則,即符合Benford 分布,若某個系列的數據分布與Benford 分布不符,就可能存在發生錯誤、潛在的舞弊或其他違規行為。

本福特定律,也稱為本福德(Benford)法則,是指一堆從實際生產生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近期望值1/9的3倍。推廣來說,越大的數,以它為首幾位的數出現的機率就越低。它可用于檢查各種數據是否有造假。

Benford可以用于審計數據抽樣和審計線索發現,Dr.Nigrini 從1995年開始從事Benford 法則在會計審計領域的應用研究,并發表了一些經典案例。他提出Benford 法則適用的3個經驗條件:

(1)數據量具備一定規模,能夠代表所有樣本。一般而言,應用Benford 法則進行分析的數據集越大,分析結果越精確。

(2)沒有人工設定的最大值和最小值范圍。一般單位的固定資產臺賬數據就可能不適合Benford 分布規律,因為按照財務制度,在一定金額的固定資產才能登入臺賬。

(3)目標數據受人為的影響較小,一般是經過數學運算的結果。例如,價格會計數據中發票金額一般為:價格*數量。相反,單純對價格數據進行分析就可能不符合分布規律,因為價格受人為的影響較大。

以Benford法則為基礎的數值分析法則進行分析的一般流程如下:

(1)對審計領域進行分析,初步判斷數據集是否符合Benford法則的分析條件,選擇分析的目標字段。

(2)對總體進行分析,進行第一、二位有效數字Benford法則的符合性測試,初步發現測試線索和重點。

(3)根據初步線索,進行三、四位數字的詳細分析。

(4)在需要的情況下,對數據進行細分,進行分組分析,按照1~3步驟深入挖掘。

(5)對標準分布頻率和實際分布頻率進行比較,記錄頻率偏差。

(6)研究頻率的偏差,與合理偏差進行比較,尋找異常偏差點。

(7)對異常點詳細數據進行分析。在必要的情況下對照原始憑證,分析出現的異常情況,落實發現的問題。

(三)層次分析法

層次分析法,簡稱AHP,是指將與決策總是有關的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。在風險評估和績效測評業務中,涉及到的因素通常比較多,而且各個因素之間缺乏可比性,這給風險和績效的量化帶來了極大挑戰,層次分析法為風險和績效的量化提供了一個解決方案。

比如,某集團企業要評價其各子公司的審計績效,其涉及的因素如圖3。

由于指標眾多,如何量化不同指標對績效的貢獻成為一個難點。傳統方式是人為定出一個權重,各個指標考核值乘以相應權重得到相應績效分數。這種方式主觀性強,難以準確衡量不同指標間的相對重要性。

層次分析法提出構造成對比較矩陣,不是把所有因素放在一起比較,而是兩兩因素相互比較,以盡可能減少性質不同的因素相互比較的困難,以提高結果準確度。成對比較矩陣是表示該層所有因素針對上一層某一個因素的相對重要性的比較。判斷矩陣的元素aij用1-9標度方法給出,見表5。

在對審計績效評價層次結構模型的基礎上,由專家進行評價,本文可構造相應的判斷矩陣:

采用Matlab 軟件,通過計算最大特征值λmax及其所對應的特征向量W,可以計算出相應的權重及CR 值,并判斷各自的一致性。

基于審計績效評價的AHP 層次結構模型,可以構建如下績效評價模型結構:

其中,Wi為被評價對象A 指標層中的各個評價指標的權重,Wn為被評價對像A 準則層中各個準則的權重,Pi為被評價對象A 的指標層中各個評價指標的值,Mk為第K 個準則層中所包含的指標的個數,K 為準則層中準則的個數。

根據審計績效評價模型,可以對評價對象的績效進行評價,即對各指標層的值與相應的最終權重的乘積進行求和,可以得到審計績效評價的結果。將此方法用于評價審計績效,通過對績效的縱向考核,可以得出本年度審計目標的實現程度,以進一步落實審計責任;此外,通過對總體目標層權重的排序,確定當年審計工作的主要任務和關鍵領域,以提高審計工作的效率,并將審計目標落實到位。根據模型評價結果,可以看出在目標確定的過程中,應充分關注員工的反饋意見以及審計的整改率,以使審計資源得到更大的發揮。

三、小結

傳統的審計分析手段局限在數據的對比分析查證疑點,指標的統計分析、趨勢分析、對比分析等,較少運用數據挖掘分析方法對審計線索的深度挖掘。隨著大數據基礎設施、大數據架構的不斷成熟及完善,大數據審計已具備了軟硬件條件,為深度挖掘審計線索、分析審計重點提供了數據和技術保障。

本文基于全業務統一數據中心和數字化審計平臺的數據,結合案例業務特點,從數據驗證、數據分析、智能推理三個方面研究了數據挖掘技術在審計中的具體應用,并分析探討了如何通過數據挖掘算法來構建數據分析與智能推理子系統,同時研究了聚類算法、數值分析法、層次分析法在審計中的應用方法。通過對審計數據的深度挖掘與分析,探索了從模型分析->模型構建-> 模型結果與評價的構建路徑,并結合具體案例進行分析、驗證了技術實現路線。通過對數據挖掘分析的研究實現了審計業務由事后監督審計向事中、事前審計的轉變,通過審計工作模式的轉變,從而提升審計的工作效率。利用數據挖掘算法,探索構建審計模型,對于數字化審計的建設和實現,具有重要的指導意義。

猜你喜歡
數據挖掘分析
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: V一区无码内射国产| 久久婷婷六月| 国产午夜精品鲁丝片| 国产精品va免费视频| 精品人妻一区无码视频| 国产人人干| 99无码中文字幕视频| 精品国产Av电影无码久久久| 日韩欧美国产区| 成人a免费α片在线视频网站| 青青草一区| 亚洲成综合人影院在院播放| 精品少妇三级亚洲| 中日韩欧亚无码视频| 亚洲天堂网站在线| 国产美女免费网站| 亚洲无码精品在线播放 | 四虎精品国产AV二区| 欧美日韩亚洲综合在线观看| 免费播放毛片| 97国产精品视频人人做人人爱| 九色综合伊人久久富二代| 亚洲天堂精品在线| 一级毛片免费观看久| 秋霞午夜国产精品成人片| 黄色一级视频欧美| 26uuu国产精品视频| 国产第二十一页| 亚洲无码一区在线观看| 日韩一区二区三免费高清| 国产成人亚洲欧美激情| 国产日韩欧美成人| 国产精品v欧美| 在线观看亚洲精品福利片| 国产乱人伦偷精品视频AAA| 日本在线视频免费| 亚洲欧洲天堂色AV| 人妻精品久久无码区| 91精品人妻互换| 国产成人无码播放| 熟妇人妻无乱码中文字幕真矢织江 | 四虎永久免费网站| 国产精品九九视频| 午夜啪啪网| 精品国产成人国产在线| 好久久免费视频高清| 妇女自拍偷自拍亚洲精品| 国产福利观看| 99久久国产自偷自偷免费一区| av免费在线观看美女叉开腿| 91成人精品视频| 亚洲av片在线免费观看| 2020久久国产综合精品swag| 毛片网站观看| 亚洲VA中文字幕| 亚洲天堂视频网站| 成人无码区免费视频网站蜜臀| 激情五月婷婷综合网| 亚洲免费黄色网| 青青草原偷拍视频| 色网站在线视频| 久久一日本道色综合久久| 国产va在线观看免费| 亚洲综合二区| 亚洲综合九九| 色天天综合| 91最新精品视频发布页| 毛片网站在线看| 亚洲天堂在线免费| 99精品一区二区免费视频| 亚洲AⅤ波多系列中文字幕| 国产福利影院在线观看| a毛片免费在线观看| 免费无码一区二区| 亚洲欧美综合精品久久成人网| 人妻精品久久久无码区色视| 免费一级毛片完整版在线看| 国产va欧美va在线观看| 最新国语自产精品视频在| 精品视频福利| 尤物精品国产福利网站| 久热中文字幕在线|