999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

審計信息系統(tǒng)的異常數(shù)據(jù)挖掘算法和應(yīng)用

2020-09-22 03:26:26毛玲玥
全國流通經(jīng)濟 2020年19期
關(guān)鍵詞:應(yīng)用

摘要:信息系統(tǒng)作為企業(yè)經(jīng)營管理活動的基本手段,需要從海量數(shù)據(jù)中搜索得到有效的審計證據(jù)和審計線索,能夠發(fā)現(xiàn)經(jīng)營活動的異常是審計工作的重要內(nèi)容。本文在對各類異常數(shù)據(jù)挖掘算法的分析和總結(jié)基礎(chǔ)上,關(guān)注審計數(shù)據(jù)挖掘中問題的解決,使得審計信息系統(tǒng)的異常數(shù)據(jù)挖掘算法得以推廣應(yīng)用。

關(guān)鍵詞:審計信息系統(tǒng);異常數(shù)據(jù);挖掘算法;應(yīng)用

中圖分類號:F232.6;TP393?文獻(xiàn)識別碼:A?文章編號:2096-3157(2020)19-0183-02

隨著信息技術(shù)的發(fā)展和廣泛應(yīng)用,審計單位的經(jīng)營和管理及核算模式出現(xiàn)明顯變化,其更加復(fù)雜且龐大的信息系統(tǒng),使得傳統(tǒng)的會計核算和經(jīng)營管理系統(tǒng)的構(gòu)成要素也隨之改變。審計人員在進(jìn)行資料整理的時候,需要面對大量電子數(shù)據(jù)信息,信息系統(tǒng)審計屬于信息環(huán)境中全新的審計方式,其地位日益凸顯。當(dāng)前審計信息系統(tǒng)所面臨的問題是應(yīng)對數(shù)據(jù)海量化的挑戰(zhàn),能夠在海量數(shù)據(jù)中有效快速得到規(guī)律及特點,挖掘?qū)徲嬀€索,降低審計工作的風(fēng)險,需要數(shù)據(jù)挖掘技術(shù)的支持,這也為審計信息系統(tǒng)的構(gòu)建及應(yīng)用提供新的發(fā)展方向[1]。

一、數(shù)據(jù)挖掘概論

數(shù)據(jù)挖掘主要是指從大量不完全和有噪音及隨機數(shù)據(jù)信息中提取隱含的信息和知識的過程,數(shù)據(jù)挖掘在信息系統(tǒng)審計工作開展的時候具有重要作用和積極影響,其不僅能夠?qū)π畔⑾到y(tǒng)所產(chǎn)生審計業(yè)務(wù)數(shù)據(jù)及財務(wù)信息等深層次研究,得出其本來所具有的特點和內(nèi)在聯(lián)系,也可以在模型匹配及挖掘算法的支持下實現(xiàn)信息系統(tǒng)開發(fā)審計和安全審計等各個方面的實際應(yīng)用,在數(shù)據(jù)挖掘技術(shù)和信息系統(tǒng)審計技術(shù)的融合下,能夠明確系統(tǒng)控制審計符合文件資料嵌入審計程序所需要采集的信息內(nèi)容[2]。

二、異常數(shù)據(jù)及其來源

數(shù)據(jù)挖掘主要是在計算機技術(shù)和軟件支持的基礎(chǔ)上,所獲取的大量模糊的數(shù)據(jù)中提取一些不明顯的規(guī)律,在這一基礎(chǔ)上得出更多有效的知識內(nèi)容。異常指不一般的數(shù)據(jù),推動人們認(rèn)識到這些數(shù)據(jù)不屬于原本系統(tǒng)的隨機偏差,多數(shù)情況下是在不同機制的支持下實現(xiàn)的,異常本質(zhì)和正常數(shù)據(jù)之間差異明顯,個數(shù)和正常數(shù)據(jù)相對比具有對象數(shù)量比較少的特點,通常情況下,異常數(shù)據(jù)的來源主要有相異的類和自然變異及數(shù)據(jù)收集誤差等。

首先,相異的類屬于數(shù)據(jù)對象的異常,其可能來源于不同的對象,在審計處理的時候,需要分析異常變動數(shù)據(jù),例如資金流量異常變化和異常的交易情況等,這些異常多數(shù)情況下存在著代表性特點,是關(guān)注的重要對象。

其次,自然變異則屬于多數(shù)數(shù)據(jù)在正態(tài)規(guī)律分布的基礎(chǔ)上實現(xiàn)的,通常這些數(shù)據(jù)都比較接近數(shù)據(jù)的中心,而兩邊的數(shù)據(jù)相對較少,例如在營業(yè)收入分析的時候,主營業(yè)務(wù)是正常的計算對象,而偶然一次性營業(yè)收入是對象類中的異常情況[3]。

最后,數(shù)據(jù)測量收集誤差的異常是在設(shè)備測量問題比較突出所得出的不正確記錄問題,這些數(shù)據(jù)本身不會提供被審計對象認(rèn)可的有價值信息支撐,相關(guān)數(shù)據(jù)資料不會為去除這些異常,同時注重提高數(shù)據(jù)及數(shù)據(jù)分析的質(zhì)量。

三、異常數(shù)據(jù)挖掘算法

1.基于統(tǒng)計方法的數(shù)據(jù)挖掘算法

數(shù)據(jù)挖掘算法產(chǎn)生之前,多數(shù)情況下處于異常數(shù)據(jù)的時候是利用剔除法,近些年是基于不同分布的異常檢驗方式進(jìn)行異常數(shù)據(jù)處理,通常是在不同分布的異常檢驗方式基礎(chǔ)上實現(xiàn)的,在概率分布模型支持下,隨后在某一個顯著性水平上明確得出具體的拒絕域和接受域,如果數(shù)據(jù)落在拒絕域范圍中,將其確定為異常數(shù)據(jù),基于統(tǒng)計的算法受到廣泛關(guān)注,實際操作的時候,具有兩種比較簡單快速的異常檢測方式,也就是3σ異常檢測方法和Z統(tǒng)計量法。統(tǒng)計方法本身具有較為堅實的數(shù)學(xué)基礎(chǔ),如果給定相關(guān)模型,其本身存在著比較大的指導(dǎo)意義,但是這一方式多數(shù)是在明確單個屬性的情況下實現(xiàn)的,無法有效處理多維空間的異常數(shù)據(jù)。

2.基于距離方式的數(shù)據(jù)挖掘算法

基于距離方式的數(shù)據(jù)挖掘算法是基于數(shù)據(jù)點距離進(jìn)行計算的,其本身具有明顯的幾何解釋,且能夠避免統(tǒng)計方式的局限性特點,其也能夠有效應(yīng)用到多維數(shù)據(jù)樣本中,而統(tǒng)計方法則不行。基于距離的算法中應(yīng)用比較多的包含著DB(p,d)方法和k-近鄰方法。DB(p,d)方法的基于距離的異常是沒有充足的另據(jù)的對象。k-近鄰方法的主要思想是為每個對象找到其k個最近的鄰居,在有效對其對象到這k個鄰居的最大的距離分析的情況下,進(jìn)行對象距離排序處理,得出排序比較靠前的對象作為異常點。

3.基于密度的數(shù)據(jù)挖掘算法

基于統(tǒng)計學(xué)和距離的異常數(shù)據(jù)方式主要是在給定的數(shù)據(jù)集合的全局分布基礎(chǔ)上實現(xiàn)的,隨后,也要能夠結(jié)合明確數(shù)據(jù)分布情況得出當(dāng)前基于密度的方法是局部離群范圍是遠(yuǎn)離的,則可以成為局部離群點,其不將離群點作為二元性質(zhì)的對象,而僅僅是評估一個對象為離群點的程度[4]。

四、審計信息系統(tǒng)的異常數(shù)據(jù)挖掘算法的選擇和應(yīng)用

在審計數(shù)據(jù)的時候,要求能夠盡快發(fā)現(xiàn)其中的異常數(shù)據(jù),從而達(dá)到預(yù)警和減少損失的效果,被審計的信息通常情況下都會被儲存到ERP等信息系統(tǒng)中,審計人員也要能夠?qū)?shù)據(jù)導(dǎo)入到計算機分析數(shù)據(jù)表內(nèi),隨后挖掘其所包含著的異常數(shù)據(jù),但是,在企業(yè)信息化更大范圍推廣和數(shù)據(jù)庫并行應(yīng)用的基礎(chǔ)上,單一的異常數(shù)據(jù)挖掘算法當(dāng)前無法滿足被審計對象數(shù)據(jù)異常的及時發(fā)展過程中,需要加強對算法的改進(jìn)和完善[5]。

1.基本算法

首先,測量距離的量度相對較為常用的包含著絕對距離和歐式距離,絕對距離的定義為:

最后,描述算法,如果數(shù)據(jù)集合S中所涉及到的P部分和對象O距離明顯要大于d,對象O也為帶參數(shù)的P和d的給定距離方面具有的異常點。R[k]表示在第一屬性值記錄情況下,假設(shè)O(1,2,…,n)按照順序排列,則具體算法如下:第一步選擇中心點,第二步設(shè)置初始值和權(quán)重向量,第三步WHILE(不滿足結(jié)束條件)。

2.基于單元的異常數(shù)據(jù)算法

基于單元的孤立點是充分將數(shù)據(jù)劃分為相似的單元格,根據(jù)單元格的坐標(biāo)及數(shù)據(jù)對象關(guān)系有效推動數(shù)據(jù)對象能夠更好地映射到單元格中,從而對其異常點深入檢查和有效確定,對于無法利用單元格的算法也能夠根據(jù)其所具有的距離算法加以解決,首先假設(shè)數(shù)據(jù)為二維數(shù)據(jù),隨后向多維數(shù)據(jù)推導(dǎo)[6]。

(1)經(jīng)典的基于單元的異常點算法

最早得出基于單元的異常數(shù)據(jù)的算法是可以檢測儲存于內(nèi)部的存儲數(shù)據(jù)信息,這一算法能夠檢測所有的DB(p,d)異常點,其也存在著一定不足,也就是閾值和距離值屬于常量,并不是動態(tài)調(diào)整的,其中閾值首先是不會隨著單元格的位置不同而產(chǎn)生差異,可以在相關(guān)分析中得出,如果邊界單元格的第一層鄰居主要為三個或者五個,而其他的單元格顯示為八個,如果是結(jié)合單一的閾值,就可以使得邊界處的異常點出現(xiàn)誤判。另外距離值也屬于固定值,在程序給定這一固定值后,對距離值進(jìn)行計算,在不同的用戶需求分析的時候,也要能夠明確尺度差異,需要存在著不同的距離值,且對比不同的距離值之后產(chǎn)生結(jié)果的時候,也會促使問題掌握更加透徹。

(2)算法的實際調(diào)整

固定閾值對判斷會造成一定影響,而造成這些影響的主要原因是邊界單元格和非邊界單元格之間的差異,因此,對閾值調(diào)整的時候,較為有效的方式是判斷單元格是否為邊界單元格,這一問題解決的時候,主要是利用以下公式解決:

(3)經(jīng)典單元異常挖掘算法的完善擴展

多維度數(shù)據(jù)始終是沒有問題的。

五、具體實踐及效果

為了對算法實際應(yīng)用效果有效改善,需要在實驗的方式基礎(chǔ)上開展實際驗證,實際數(shù)據(jù)主要是基于電力企業(yè)的2017年~2019年的財務(wù)信息和業(yè)務(wù)數(shù)據(jù)等收集分析處理,數(shù)據(jù)屬性中主要有52項,其具體的實驗?zāi)繕?biāo)是監(jiān)測異常數(shù)據(jù)。硬件環(huán)境Pentium雙核2.1GHz,3.2G內(nèi)存,硬盤為160G,數(shù)據(jù)庫利主要是利用DB2,程序則實驗net架構(gòu)編寫。實驗的過程也要清理相關(guān)數(shù)據(jù),將中文和字幕等充分轉(zhuǎn)換為統(tǒng)一編碼數(shù)值數(shù)據(jù),在這一環(huán)境下確定相關(guān)的目標(biāo)數(shù)據(jù)庫,隨后利用算法挖掘的方式得出具有的實驗結(jié)果。

在和原本算法相對比的基礎(chǔ)上,可以得出新的算法對不同數(shù)據(jù)操作時間相對減少,平均的節(jié)約量主要為3%,新的算法也會得到比較多異常數(shù)據(jù)點,在實際實施的時候存在著顯著的指導(dǎo)作用,利用電力企業(yè)的實際應(yīng)用情況分析,為企業(yè)提供更多舞弊行為的審計證據(jù)。

六、結(jié)語

在基于距離的經(jīng)典算法擴展的基礎(chǔ)上,能夠?qū)徲媽ο蠖囝悢?shù)據(jù)應(yīng)用的要求有效滿足,明確得出滿足審計系統(tǒng)的異常數(shù)據(jù)挖掘算法,這一算法也就能夠充分發(fā)現(xiàn)異常數(shù)據(jù),從而減少損失,同時也能夠廣泛在相關(guān)商務(wù)實踐活動異常數(shù)據(jù)挖掘中具體實施。

參考文獻(xiàn):

[1]潘東陽,劉靜瑞.基于數(shù)理統(tǒng)計的網(wǎng)絡(luò)運行異常數(shù)據(jù)挖掘模型構(gòu)建[J].信息通信,2019,(07):21~22.

[2]張波,李舸.基于改進(jìn)聚類算法的Web異常數(shù)據(jù)挖掘軟件設(shè)計[J].現(xiàn)代電子技術(shù),2019,42(08):73~76+81.[3]張凱斐,劉繼華,張菊芳.大規(guī)模高維數(shù)據(jù)集中局部異常數(shù)據(jù)挖掘算法[J].微電子學(xué)與計算機,2018,35(03):116~119+124.

[4]向楨,向守兵.基于模糊遺傳算法的數(shù)據(jù)庫異常數(shù)據(jù)挖掘[J].控制工程,2017,24(05):947~951.[5]馬寧,廖慧惠.云計算環(huán)境下頻繁出現(xiàn)異常數(shù)據(jù)挖掘方法研究[J].赤峰學(xué)院學(xué)報(自然科學(xué)版),2017,33(03):31~32.

[6]王樂,王芳.數(shù)據(jù)庫異常數(shù)據(jù)的檢測仿真研究[J].計算機仿真,2016,33(01):430~433.

作者簡介:

毛玲玥,供職于浙江浙能富興燃料有限公司,中級審計師。

猜你喜歡
應(yīng)用
配網(wǎng)自動化技術(shù)的應(yīng)用探討
科技視界(2016年21期)2016-10-17 19:54:47
帶壓堵漏技術(shù)在檢修中的應(yīng)用
科技視界(2016年21期)2016-10-17 19:54:05
行列式的性質(zhì)及若干應(yīng)用
科技視界(2016年21期)2016-10-17 18:46:46
癌癥擴散和治療研究中的微分方程模型
科技視界(2016年21期)2016-10-17 18:37:58
紅外線測溫儀在汽車診斷中的應(yīng)用
科技視界(2016年21期)2016-10-17 18:28:05
多媒體技術(shù)在小學(xué)語文教學(xué)中的應(yīng)用研究
考試周刊(2016年76期)2016-10-09 08:45:44
微課的翻轉(zhuǎn)課堂在英語教學(xué)中的應(yīng)用研究
分析膜技術(shù)及其在電廠水處理中的應(yīng)用
科技視界(2016年20期)2016-09-29 14:22:00
GM(1,1)白化微分優(yōu)化方程預(yù)測模型建模過程應(yīng)用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機人機工程學(xué)應(yīng)用分析
科技視界(2016年20期)2016-09-29 11:47:01
主站蜘蛛池模板: 手机在线免费毛片| 99成人在线观看| 女人毛片a级大学毛片免费| 国产原创第一页在线观看| 国产乱视频网站| 欧美一区二区福利视频| 亚洲第一色视频| 国产欧美日韩专区发布| 日韩精品欧美国产在线| 国内精品免费| 亚洲精品视频免费| 在线看国产精品| 国产精品福利导航| 国产丝袜无码一区二区视频| 久久综合九色综合97婷婷| 精品国产乱码久久久久久一区二区| 青青久在线视频免费观看| 亚洲午夜国产精品无卡| 国产清纯在线一区二区WWW| 久青草免费视频| 欧美日韩动态图| 在线人成精品免费视频| 国产微拍精品| 亚洲综合精品香蕉久久网| 亚洲欧美国产五月天综合| 亚洲美女一级毛片| 欧美日韩国产成人高清视频| 国产激情无码一区二区APP| 国产第一页亚洲| 婷婷六月激情综合一区| 人妻中文字幕无码久久一区| 中文字幕在线视频免费| 欧美人人干| 国产欧美日本在线观看| 成人韩免费网站| 欧美日本在线播放| 97在线免费视频| 91亚洲精品第一| 日韩视频福利| 亚洲第一中文字幕| 日韩在线观看网站| 精品在线免费播放| 久久精品国产亚洲麻豆| 国产一级妓女av网站| 91九色视频网| 欧美国产视频| 久久综合丝袜日本网| 久久免费视频6| 日韩欧美国产精品| 亚洲综合18p| 免费在线看黄网址| 青草视频久久| 国产一级二级在线观看| 国产自视频| 麻豆精品在线视频| 99久久亚洲精品影院| 亚洲六月丁香六月婷婷蜜芽| 色播五月婷婷| 99视频在线观看免费| 亚洲精品中文字幕午夜| 国产人前露出系列视频| 中国精品自拍| 日韩精品毛片人妻AV不卡| 国产欧美在线观看一区| 日韩精品高清自在线| 五月婷婷激情四射| 成人午夜免费观看| 久久这里只精品国产99热8| 老汉色老汉首页a亚洲| 亚洲国产无码有码| 最新国产高清在线| 国产区免费| 色婷婷狠狠干| 国产农村精品一级毛片视频| 国产精品亚洲va在线观看| 国产精品密蕾丝视频| AV无码无在线观看免费| 五月激激激综合网色播免费| 精品视频免费在线| 黄色不卡视频| 毛片基地视频| 91九色视频网|