999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類分析在內部審計中的應用研究

2019-02-16 11:38:46杜潔李芹潘媛李玲璠孫銀博何加攀
中國管理信息化 2019年1期

杜潔 李芹 潘媛 李玲璠 孫銀博 何加攀

[摘 要] 聚類分析的目的是將收集到的數據按照某一特征進行分類,形成相似元素的集合。在內部審計中的應用是通過收集各個業務領域的數據,運用聚類分析,發現同類數據間的差距,根據差異分析出疑點數據,從而提出審計意見,解決了傳統審計管理效率低、實施難等問題。實驗結果表明,通過該算法能夠快速高效地發現各業務領域的疑點數據,為審計工作提供了依據和新的方式,提高了工作效率和收益。

[關鍵詞] 聚類分析;k-means算法;疑點數據;內部審計

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 01. 001

[中圖分類號] F239.45 [文獻標識碼] A [文章編號] 1673 - 0194(2019)01- 0004- 03

0 引 言

聚類分析應用于醫學、市場分析、信息安全、金融等多個領域。目前,在內部審計中的應用主要是在企業和同業間的差距分析,很少針對業務數據存在的問題進行分析,傳統的內部審計限于單一的看賬、查賬,難以發現數據底層的潛在問題,為了讓內部審計有一個質的提升,采用聚類對業務數據進行分析與挖掘去發現深層次的問題,所以面對不同的業務數據采用不同的分析手段成為當前研究的熱點與難題,但很少在內部審計方面應用。本文針對內部審計的業務數據采用k-means聚類方法對業務數據進行分析,并取得了不錯的結果,填補了對內部審計業務數據分析的空白。

1 聚類分析的原理及分類

1.1 聚類分析的原理

聚類分析的基本原理是,根據對象自身屬性,運用統計方法根據某種差異性和相似性,得到對象間的相似性關系,按照相似性關系對對象進行分組聚類,可能提供多個分析結果解,需要根據實際情況提供主觀判斷和后續的分析。

1.2 聚類分析的分類

目前聚類方式有三類:一是系統聚類,用于對小樣本的對象間聚類以及對變量聚類。二是有序樣品聚類,對有排序次序的樣本的對象間聚類,要求是次序相鄰的對象才能聚為一類。三是動態聚類,適用于樣本量大時對象間的聚類,一般用k-means法處理。由于內部審計一般依靠歷史數據,提出有價值的工作建議,所以由于涉及內部審計的業務數據量較大,所以本文采用第三種聚類分析方式。

2 聚類方法k-means算法

2.1 k-means算法基本原理

k指的是將數據集分為簇的個數,means指的是簇內對象的均值。如果簇內的相似性越大,簇間的差別性越大,那么聚類效果就越好。相似度是根據聚類對象的平均值進行計算,其算法步驟如下:

(1)從數據集中任意選取k個點作為初始質心,即每個簇的均值,其中,質心的計算方法是:除去第一次質心手動指定外,以后的質心都是由計算均值獲得。

(2)根據數據點到質心的距離將剩余的每個對象收歸到最近的質心所在的簇中。

(3)根據分類結果重新計算每個簇(有變化)的質心或平均值。重復進行(2)、(3)步驟,直到質心不再改變,即準則算法函數收斂,采用平方誤差準則:

2.2 k-means過程示意圖

2.3 k-means算法優缺點分析

k-means算法的時間復雜度為:O(nkt)。其中,k指聚類簇數,t指迭代次數,n指對象數,所以對于處理大數據集時,具有高效性,而且實現方式簡單、快速。通過實驗表明,k-means對于處理簇接近高斯分布時,效果更好。因為k-means需要事先指定k作為初始質心,對k的選取會導致不同的分析結果,所以對于一些事先需要分類的數據分析效果不好,影響最終分析結果。對“噪聲”和孤立點數據較為敏感,容易對均值產生較大影響,且分析只能保證局部最優,不能保證全局最優。

3 內部審計的應用

3.1 R語言實現k-means算法

由于內部審計涉及的營銷、財務等多個業務,所以本文針對以紅河建水居民用電量為例子使用R語言實現k-means算法進行分析,來體現聚類算法在內部審計中的應用。具體實現流程如下。

3.1.1 標準化處理

分析數據可能存在量綱不同的情況,如體重和身高,它們量綱不同,體重可能在40-60kg間,身高可能在140-170cm之間,那么就需要進行數據標準化處理。若直接用原數據分析,可能會加強數值較高的指標在分析結果的作用,削弱數值較低的指標在分析結果的作用。數據標準化公式:

3.1.2 輪廓系數

3.2 實驗結果

經過k-means聚類分析得到疑點數據表(見表1)。

從疑點數據表中可知:在重度用電客戶簇中,有一個疑點用戶,在輕度用電客戶簇中有9個疑點用戶都可能存在偷電等情況的發生。經過實際有關人員對這些用戶的調查,確實發現存在問題。實驗結果表明該算法能夠為內部審計提供審計依據,提高了工作效率。

4 結 論

聚類分析算法在內部審計涉及數據分析與挖掘方面都可能用到,傳統的內部審計的分析都是通過Excel、SQL等方式進行分析,對于復雜且數據量大的數據分析過程會變得相對復雜,而使用R語言實現的聚類分析能夠快速高效地得出分析結果。為審計人員提供了直接、高效的審計依據。本文主要是針對大工業用電的電費與電量進行分析,證明算法的簡單、高效與實用性強,但只考慮了接近高斯分布類型的數據,在實際應用中,會涉及不同的數據類型,有很多針對不同數據類型的改進算法,需要進一步研究。

主要參考文獻

[1]方匡南.基于數據挖掘的分類和聚類算法研究及R語言實現[D].廣州:暨南大學,2007.

主站蜘蛛池模板: 波多野结衣第一页| 欧美激情,国产精品| 亚洲中文字幕久久精品无码一区| 亚洲AV无码乱码在线观看代蜜桃 | 国产成人综合网| 亚洲精品麻豆| 国产一区二区三区在线精品专区| 亚洲中文精品久久久久久不卡| 亚洲精品天堂自在久久77| 97成人在线视频| 99热最新在线| 精品精品国产高清A毛片| 日韩中文无码av超清| 成年av福利永久免费观看| 东京热高清无码精品| 午夜国产精品视频| 国产在线拍偷自揄观看视频网站| 人妻精品久久久无码区色视| 在线视频一区二区三区不卡| 亚洲欧美另类色图| 国产亚洲精品91| 狠狠色丁香婷婷综合| 亚洲精品国产精品乱码不卞| 日韩黄色精品| 亚洲无卡视频| 国内精品九九久久久精品 | 国产手机在线观看| 在线无码九区| 综合色在线| 综合久久久久久久综合网| 日韩欧美在线观看| 在线免费看片a| 欧美乱妇高清无乱码免费| av午夜福利一片免费看| 无码日韩人妻精品久久蜜桃| 免费人成视网站在线不卡| 国产精品视频免费网站| 大香网伊人久久综合网2020| 大乳丰满人妻中文字幕日本| 免费全部高H视频无码无遮掩| 成人一区在线| 欧美视频在线播放观看免费福利资源| 欧美不卡在线视频| 亚洲日韩第九十九页| 国产精品白浆在线播放| 成人噜噜噜视频在线观看| 亚洲成人高清在线观看| 日韩av在线直播| 98精品全国免费观看视频| 99福利视频导航| 国产系列在线| 国产剧情一区二区| 亚洲欧美不卡视频| 久久久久亚洲AV成人网站软件| 久久99国产综合精品女同| 亚洲国产天堂久久综合226114| 少妇高潮惨叫久久久久久| 色婷婷电影网| 精品成人一区二区三区电影| 乱码国产乱码精品精在线播放| 在线看国产精品| 麻豆精品在线播放| 亚洲综合18p| 一区二区理伦视频| 天天躁日日躁狠狠躁中文字幕| 亚洲最大福利网站| 欧美第一页在线| 操操操综合网| 干中文字幕| 伊人成人在线视频| 好吊色妇女免费视频免费| 日韩在线欧美在线| 久久99久久无码毛片一区二区| 午夜成人在线视频| 99青青青精品视频在线| 国产欧美视频在线| av手机版在线播放| 亚洲午夜国产片在线观看| 免费又黄又爽又猛大片午夜| 精品福利视频网| 亚洲国产成人自拍| 成人综合久久综合|