朱宇龍 劉森 袁陽(yáng)春 張君 陳灝生



摘 要:隨著信息技術(shù)的發(fā)展,企業(yè)業(yè)務(wù)系統(tǒng)日益完善,積累了大量的企業(yè)數(shù)據(jù)資產(chǎn),而機(jī)器學(xué)習(xí)等新興技術(shù)的出現(xiàn),為處理海量數(shù)據(jù)帶來(lái)了可能性,也為非現(xiàn)場(chǎng)審計(jì)提供了技術(shù)基礎(chǔ)。應(yīng)用機(jī)器學(xué)習(xí)技術(shù)創(chuàng)建相應(yīng)的非現(xiàn)場(chǎng)審計(jì)模型,能夠有效地提高審計(jì)工作的效率,擴(kuò)寬審計(jì)覆蓋面,并為加強(qiáng)審計(jì)監(jiān)督提供了新途徑。本文介紹了應(yīng)用樸素貝葉斯和K-means聚類兩種機(jī)器學(xué)習(xí)算法構(gòu)建的非現(xiàn)場(chǎng)審計(jì)模型的原理及實(shí)踐經(jīng)驗(yàn)。
關(guān)鍵詞:機(jī)器學(xué)習(xí);非現(xiàn)場(chǎng)審計(jì);樸素貝葉斯;K-means
應(yīng)用機(jī)器學(xué)習(xí)相關(guān)算法構(gòu)建審計(jì)模型輔助非現(xiàn)場(chǎng)審計(jì),是近年來(lái)大數(shù)據(jù)審計(jì)工作的發(fā)展趨勢(shì)。在企業(yè)數(shù)據(jù)平臺(tái)的基礎(chǔ)之上,審計(jì)業(yè)務(wù)人員和數(shù)據(jù)分析人員緊密協(xié)作,運(yùn)用統(tǒng)計(jì)分析、數(shù)據(jù)挖掘等工具,開展以業(yè)務(wù)數(shù)據(jù)為基礎(chǔ)的非現(xiàn)場(chǎng)審計(jì)模型的構(gòu)建工作,從而更加有效的完成審計(jì)目標(biāo)。
一、應(yīng)用機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)中臺(tái)的基礎(chǔ)之上構(gòu)建審計(jì)業(yè)務(wù)中臺(tái)
(一)審計(jì)業(yè)務(wù)中臺(tái)
大數(shù)據(jù)時(shí)代,企業(yè)的發(fā)展伴隨著企業(yè)業(yè)務(wù)的多元化,各大企業(yè)也都致力于企業(yè)的數(shù)字化轉(zhuǎn)型。企業(yè)數(shù)據(jù)中臺(tái)是為了解決業(yè)務(wù)數(shù)據(jù)孤島問(wèn)題,統(tǒng)一數(shù)據(jù)治理和數(shù)據(jù)資產(chǎn)管理,以達(dá)到技術(shù)降本、應(yīng)用提效、業(yè)務(wù)賦能的目標(biāo);企業(yè)數(shù)據(jù)中臺(tái)是企業(yè)的數(shù)據(jù)樞紐,是橫向跨專業(yè)、縱向跨層級(jí)的各類企業(yè)數(shù)據(jù)資源匯聚中心、數(shù)據(jù)資產(chǎn)轉(zhuǎn)化中心、數(shù)據(jù)價(jià)值發(fā)掘中心,是企業(yè)數(shù)字化轉(zhuǎn)型的重要支撐。審計(jì)業(yè)務(wù)中臺(tái)是以大數(shù)據(jù)分析、人工智能等作為技術(shù)支撐,在企業(yè)數(shù)據(jù)中臺(tái)的基礎(chǔ)上,直接面向?qū)徲?jì)對(duì)象構(gòu)建審計(jì)模型,識(shí)別評(píng)估企業(yè)風(fēng)險(xiǎn),輔助審計(jì)人員梳理審計(jì)線索,圈定審計(jì)重點(diǎn),實(shí)現(xiàn)從“大海撈針”式的隨機(jī)抽樣審計(jì)到依托審計(jì)模型的“精準(zhǔn)撒網(wǎng)”式審計(jì)的轉(zhuǎn)變,拓展審計(jì)的寬度、高度、深度,提升審計(jì)效率和質(zhì)量。
(二)非現(xiàn)場(chǎng)審計(jì)
非現(xiàn)場(chǎng)審計(jì)是為一個(gè)或多個(gè)審計(jì)對(duì)象提供綜合審計(jì)數(shù)據(jù)分析建模服務(wù)。通常可以面向全域的業(yè)務(wù)對(duì)象,具有一定大數(shù)據(jù)特征,是一個(gè)典型的數(shù)據(jù)應(yīng)用和數(shù)據(jù)價(jià)值發(fā)現(xiàn)場(chǎng)景。若采用傳統(tǒng)現(xiàn)場(chǎng)審計(jì)作業(yè)方式同時(shí)對(duì)多個(gè)審計(jì)對(duì)象開展審計(jì)業(yè)務(wù),不僅對(duì)人員的需求量大,而且審計(jì)項(xiàng)目實(shí)施過(guò)程中辨別風(fēng)險(xiǎn)、分析問(wèn)題的工作量也很大,甚至在審計(jì)工作成果匯總階段,會(huì)存在不同對(duì)象審計(jì)定性不一致的風(fēng)險(xiǎn),若采用基于機(jī)器學(xué)習(xí)的非現(xiàn)場(chǎng)審計(jì),則可通過(guò)結(jié)合歷史審計(jì)經(jīng)驗(yàn),構(gòu)建審計(jì)數(shù)學(xué)模型,在全量數(shù)據(jù)的基礎(chǔ)之上,統(tǒng)一運(yùn)行,并根據(jù)模型結(jié)果識(shí)別審計(jì)問(wèn)題,能夠顯著提高審計(jì)覆蓋面和審計(jì)效率。當(dāng)前非現(xiàn)場(chǎng)審計(jì)模型的構(gòu)建主要依托于資深審計(jì)業(yè)務(wù)人員的審計(jì)策略,并基于國(guó)家法律法規(guī)和企業(yè)規(guī)章制度識(shí)別審計(jì)規(guī)則,運(yùn)用機(jī)器學(xué)習(xí)算法構(gòu)建數(shù)學(xué)模型,達(dá)到識(shí)別數(shù)據(jù)異常點(diǎn)的目標(biāo),為審計(jì)工作提供線索,審計(jì)人員再通過(guò)線索查找不合規(guī)的異常情況。
二、非現(xiàn)場(chǎng)審計(jì)工作的開展方式
機(jī)器學(xué)習(xí)在非現(xiàn)場(chǎng)審計(jì)工作中的應(yīng)用主要分為分為五個(gè)步驟:審計(jì)需求分析、審計(jì)模型設(shè)計(jì)、審計(jì)數(shù)據(jù)準(zhǔn)備、審計(jì)模型開發(fā)、審計(jì)應(yīng)用。從技術(shù)架構(gòu)上看,非現(xiàn)場(chǎng)審計(jì)依托企業(yè)數(shù)據(jù)中臺(tái),運(yùn)用統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、自助可視化等工具構(gòu)建審計(jì)業(yè)務(wù)中臺(tái),推進(jìn)非現(xiàn)場(chǎng)審計(jì)工作。
技術(shù)架構(gòu)圖如下圖所示:
(一)審計(jì)需求分析
為了發(fā)揮出高質(zhì)量數(shù)據(jù)的審計(jì)價(jià)值,必須充分考慮實(shí)際審計(jì)項(xiàng)目的應(yīng)用需求,才能有效地為審計(jì)現(xiàn)場(chǎng)提供有力的支撐。在進(jìn)行需求梳理過(guò)程中,主要由各單位審計(jì)部門通過(guò)研討會(huì)、現(xiàn)場(chǎng)摸底調(diào)查和電話訪談等方式對(duì)審計(jì)應(yīng)用現(xiàn)狀開展需求調(diào)研工作,主要調(diào)研目前各業(yè)務(wù)數(shù)據(jù)歸集情況、數(shù)據(jù)分析應(yīng)用情況、數(shù)據(jù)范圍、應(yīng)用范圍、功能需求范圍等。
(二)審計(jì)模型設(shè)計(jì)
根據(jù)審計(jì)工作流程和研究的業(yè)務(wù)領(lǐng)域,將模型設(shè)計(jì)工作分為五部分:算法初選、數(shù)據(jù)樣例設(shè)計(jì)、訓(xùn)練方案、評(píng)價(jià)體系、應(yīng)用界面設(shè)計(jì)。算法初選主要根據(jù)需求分析結(jié)果初步進(jìn)行算法選取,基本明確建模范圍;根據(jù)需求分析結(jié)果進(jìn)行樣例設(shè)計(jì),作為數(shù)據(jù)樣例和實(shí)際應(yīng)用數(shù)據(jù)的采集準(zhǔn)備依據(jù);訓(xùn)練方案是指在系統(tǒng)提供數(shù)據(jù)樣例的基礎(chǔ)上,應(yīng)用機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)處理和算法分析;評(píng)價(jià)體系是對(duì)機(jī)器學(xué)習(xí)訓(xùn)練成果進(jìn)行多維度的評(píng)價(jià)方案,選取最合適的機(jī)器學(xué)習(xí)算法公式;應(yīng)用界面是審計(jì)模型的成果展示界面,應(yīng)用界面設(shè)計(jì)側(cè)重于面向?qū)徲?jì)業(yè)務(wù)人員的人機(jī)交互行為習(xí)慣,提供簡(jiǎn)單明了的數(shù)據(jù)圖標(biāo)展示和模型結(jié)果數(shù)據(jù)導(dǎo)出功能。
(三)審計(jì)數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備工作指從原始業(yè)務(wù)數(shù)據(jù)到形成最終數(shù)據(jù)集的所有操作,主要包含數(shù)據(jù)的收集、清洗和轉(zhuǎn)換工作。在審計(jì)需求分析和審計(jì)模型設(shè)計(jì)的基礎(chǔ)之上,明確數(shù)據(jù)準(zhǔn)備范圍,然后進(jìn)行數(shù)據(jù)清洗和轉(zhuǎn)換操作,在數(shù)據(jù)準(zhǔn)備階段通常要處理的數(shù)據(jù)問(wèn)題有:數(shù)據(jù)的不唯一性、格式上不統(tǒng)一、非法值、特征依賴、缺失值、錯(cuò)誤拼寫等。數(shù)據(jù)準(zhǔn)備任務(wù)可能要進(jìn)行多次、沒有規(guī)定的固定順序,整體花費(fèi)時(shí)間占整體建模工作50%到80%的時(shí)間。
(四)審計(jì)數(shù)據(jù)建模
審計(jì)模型開發(fā)包含模型訓(xùn)練、模型質(zhì)量評(píng)估和模型部署三個(gè)子環(huán)節(jié),模型訓(xùn)練通常依托存量數(shù)據(jù),進(jìn)行算法的選擇和參數(shù)的調(diào)優(yōu);模型質(zhì)量評(píng)估是針對(duì)算法的執(zhí)行結(jié)果和實(shí)際情況進(jìn)行比對(duì),得到模型的準(zhǔn)確度等評(píng)估指標(biāo),只有通過(guò)質(zhì)量評(píng)估且執(zhí)行效率高的模型,才具有模型部署應(yīng)用的價(jià)值。模型部署是指將模型部署到正式環(huán)境,進(jìn)行常態(tài)化的運(yùn)營(yíng),按需或定時(shí)輸出模型結(jié)果。
(五)審計(jì)應(yīng)用
非現(xiàn)場(chǎng)審計(jì)模型可以應(yīng)用在兩種場(chǎng)景下:場(chǎng)景一,業(yè)務(wù)驅(qū)動(dòng)的審計(jì)項(xiàng)目實(shí)施場(chǎng)景,審計(jì)部門結(jié)合開展的審計(jì)項(xiàng)目,將成熟的模型直接應(yīng)用到審計(jì)現(xiàn)場(chǎng),輔助縮小審計(jì)范圍,提高審計(jì)效率。場(chǎng)景二,數(shù)據(jù)驅(qū)動(dòng)的常態(tài)化的日常監(jiān)控場(chǎng)景,隨著審計(jì)模型構(gòu)建的越來(lái)越完善,模型的精準(zhǔn)度也逐步提高,不僅擴(kuò)寬了數(shù)字化審計(jì)的覆蓋面,也大幅度提高了審計(jì)的質(zhì)量和效率,即可在審計(jì)模型的基礎(chǔ)之上開展常態(tài)化的審計(jì)監(jiān)控工作,進(jìn)一步提高審計(jì)部門快速識(shí)別企業(yè)風(fēng)險(xiǎn)的能力。
三、實(shí)證研究
(一)基于樸素貝葉斯算法下的資產(chǎn)異常識(shí)別
企業(yè)的資產(chǎn)管理業(yè)務(wù)系統(tǒng)包含大量資產(chǎn)數(shù)據(jù),包括資產(chǎn)類別、使用保管人、資產(chǎn)變動(dòng)、資產(chǎn)狀態(tài)、資產(chǎn)折舊值等。依據(jù)資產(chǎn)部門的日常運(yùn)維工作和歷史審計(jì)經(jīng)驗(yàn)可識(shí)別出四類資產(chǎn)異常:資產(chǎn)歸類異常、資產(chǎn)管理異常、資產(chǎn)數(shù)據(jù)完整性異常和資產(chǎn)數(shù)據(jù)準(zhǔn)確性異常。本實(shí)例運(yùn)用樸素貝葉斯算法,通過(guò)數(shù)據(jù)收集、特征值提取、分區(qū)訓(xùn)練和質(zhì)量評(píng)估等步驟,準(zhǔn)確識(shí)別資產(chǎn)異常情況,輔助資產(chǎn)域的審計(jì)工作。
1.數(shù)據(jù)收集及特征值屬性選取
取某待審計(jì)公司建筑業(yè)務(wù)資產(chǎn)數(shù)據(jù)作為樣本量,總計(jì)12萬(wàn)左右,有覆蓋性和普遍性,現(xiàn)分為以下四大類資產(chǎn)異常,特征值與選取標(biāo)準(zhǔn)詳見下表:
資產(chǎn)異常特征描述特征值選取資產(chǎn)歸類異常資產(chǎn)描述與類別不匹配資產(chǎn)編碼、資產(chǎn)類別、資產(chǎn)狀態(tài)、數(shù)量、計(jì)量單位
資產(chǎn)管理異常管理要求未執(zhí)行資產(chǎn)類別、使用保管人、數(shù)量、資產(chǎn)變動(dòng)方式資產(chǎn)數(shù)據(jù)完整性異常關(guān)鍵資產(chǎn)屬性數(shù)據(jù)為空資產(chǎn)描述、數(shù)量、計(jì)量單位、資產(chǎn)原值、累計(jì)折舊、使用年限資產(chǎn)數(shù)據(jù)準(zhǔn)確性異常資產(chǎn)數(shù)據(jù)不準(zhǔn)確資產(chǎn)類別、資產(chǎn)原值、賬面凈值、累積折舊額
經(jīng)過(guò)綜合分析確定11個(gè)特征值并分為兩類:①離散型變量,即不以數(shù)據(jù)體現(xiàn),需要文字描述部分,包括資產(chǎn)類別、資產(chǎn)描述、資產(chǎn)變動(dòng)方式、資產(chǎn)狀態(tài)、計(jì)量單位、使用保管人等;②連續(xù)型變量:可從以數(shù)字區(qū)間取值且有連續(xù)性,包括數(shù)量、使用年限、資產(chǎn)原值、賬面凈值、累計(jì)折舊額。
2.數(shù)據(jù)清洗
通過(guò)設(shè)置公式篩選將無(wú)意義、不成立的等式進(jìn)行剔除,因?yàn)榇祟悢?shù)據(jù)可直接反映資產(chǎn)數(shù)據(jù)異常,可直接作為異常結(jié)果處理,例如資產(chǎn)原值≤0、累計(jì)折舊<0、賬面凈值<0、資產(chǎn)原值—累計(jì)折舊額—賬面凈值<0等無(wú)財(cái)務(wù)意義的數(shù)據(jù),清洗后留存數(shù)據(jù)量為82891個(gè)樣本。
3.數(shù)據(jù)替代
由于機(jī)器學(xué)習(xí)模型無(wú)法分析語(yǔ)義,因此在離散型變量必須采用可識(shí)別的數(shù)據(jù)替代這些文本描述類型,例如資產(chǎn)狀態(tài)如果分為①待報(bào)廢②報(bào)廢③在運(yùn)④退運(yùn)⑤未投運(yùn)⑥庫(kù)存?zhèn)溆芒攥F(xiàn)場(chǎng)留用,即可以實(shí)現(xiàn)數(shù)字代換。這種分類只能體現(xiàn)靜態(tài)狀態(tài),不能分析其成因,但可以反映其異常并引起注意,具有分析價(jià)值。
4.區(qū)分訓(xùn)練集與測(cè)試集
數(shù)據(jù)分為58023個(gè)訓(xùn)練集(70%樣本量)和24867個(gè)測(cè)試集(30%樣本量)(測(cè)試集計(jì)99470條數(shù)據(jù)),進(jìn)行訓(xùn)練模型和評(píng)價(jià)模型的反復(fù)演算。
實(shí)驗(yàn)數(shù)據(jù):
利用貝葉斯分類器進(jìn)行訓(xùn)練,根據(jù)條件概率p(yi|x)的大小判斷待分類項(xiàng):
5.模型質(zhì)量評(píng)估
利用樸素貝葉斯算法進(jìn)行建模與預(yù)測(cè)分析,預(yù)測(cè)結(jié)果如下:
識(shí)別率=(13282+42008/13282+5570+5453+42008)×100%=83.3773167%
通過(guò)計(jì)算發(fā)現(xiàn),準(zhǔn)確率與樣本數(shù)量有關(guān),樣本數(shù)量越多,準(zhǔn)確率越高,此外樣本的選取特征還可以進(jìn)一步擴(kuò)大其關(guān)聯(lián)關(guān)系,并對(duì)連續(xù)型變量作進(jìn)一步采樣區(qū)分特征屬性,可以略微提高樸素貝葉斯模型的準(zhǔn)確率。
(二)運(yùn)用K-means聚類算法識(shí)別企業(yè)財(cái)務(wù)報(bào)銷費(fèi)用異常
企業(yè)的財(cái)務(wù)報(bào)銷數(shù)據(jù)量巨大,通常有差旅費(fèi)、住宿費(fèi)、會(huì)議費(fèi)等,形式多種多樣,且非常零碎,在審計(jì)工作中,財(cái)務(wù)審計(jì)占比非常高,如果采用人工的方式核查,抽樣率較低,且效果不佳,本實(shí)例運(yùn)用K-means算法進(jìn)行報(bào)銷費(fèi)用的聚類分析,并識(shí)別各類別群體的特征,重點(diǎn)分析離群數(shù)據(jù),輔助發(fā)現(xiàn)報(bào)銷費(fèi)用的異常情況,分析過(guò)程如下:
1.數(shù)據(jù)抽取
選擇分析觀察窗口,抽取觀察窗口內(nèi)的全部人員報(bào)銷明細(xì),對(duì)于后續(xù)新增的人員報(bào)銷信息,以后續(xù)新增的新的時(shí)間點(diǎn)作為結(jié)束時(shí)間,采用上述同樣的方法進(jìn)行抽取,形成增量數(shù)據(jù)。
從報(bào)銷系統(tǒng)數(shù)據(jù)庫(kù)中抽取n個(gè)人員的分析觀察窗口下的全部報(bào)銷數(shù)據(jù),共計(jì)r條記錄,其中包括acc_no、register_from、real_name、報(bào)銷日期、報(bào)銷次數(shù)、異常時(shí)間存在報(bào)銷次數(shù)、觀察期內(nèi)報(bào)銷總金額、觀察期內(nèi)報(bào)銷總筆數(shù)、報(bào)銷金額、報(bào)銷筆數(shù)、異常時(shí)間報(bào)銷金額、異常時(shí)間報(bào)銷筆數(shù)等屬性。
2.數(shù)據(jù)探索分析
對(duì)數(shù)據(jù)進(jìn)行缺失值及異常值分析,分析數(shù)據(jù)的規(guī)律及異常值,查找各屬性的空值個(gè)數(shù)、最小值、最大值,根據(jù)箱型圖觀察報(bào)銷金額的異常情況。
原始數(shù)據(jù)中數(shù)據(jù)屬性太多,選擇與指標(biāo)相關(guān)的屬性,刪除與其不相關(guān)、弱相關(guān)或冗余的屬性,例如:acc_no、register_from、real_name等屬性。
3.數(shù)據(jù)變換
需要通過(guò)原始數(shù)據(jù)來(lái)進(jìn)行屬性構(gòu)造,具體的計(jì)算方式如下:
(1)無(wú)報(bào)銷天數(shù)占比=無(wú)報(bào)銷天數(shù)/觀察期天數(shù);
(2)異常報(bào)銷天數(shù)占報(bào)銷天數(shù)比=異常時(shí)間存在報(bào)銷天數(shù)/觀察期天數(shù);
(3)異常時(shí)間段報(bào)銷金額占比=異常時(shí)間報(bào)銷金額/觀察期內(nèi)報(bào)銷總金額;
(4)異常時(shí)間段報(bào)銷筆數(shù)占比=異常時(shí)間報(bào)銷筆數(shù)/觀察期內(nèi)報(bào)銷總筆數(shù);
(5)單筆為100倍數(shù)占比=報(bào)銷金額單筆額度為100的倍數(shù)的筆數(shù)/觀察期內(nèi)報(bào)銷總筆數(shù);
(6)單筆金額額度異常的占比=單筆金額在該用戶的報(bào)銷金額范圍中是異常的筆數(shù)/觀察期內(nèi)報(bào)銷總筆數(shù)。
6個(gè)指標(biāo)的數(shù)據(jù)提取后,對(duì)每個(gè)指標(biāo)數(shù)據(jù)的分布情況進(jìn)行分析,并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
4.模型構(gòu)建
模型主要有兩部分組成,第一部分根據(jù)人員報(bào)銷數(shù)據(jù)的6個(gè)指標(biāo)數(shù)據(jù),對(duì)人員進(jìn)行聚類分群。第二部分結(jié)合業(yè)務(wù)對(duì)每個(gè)人員群進(jìn)行特征分析,分析其報(bào)銷特點(diǎn),并對(duì)人員群進(jìn)行排名。
5.聚類特征分析
利用K-means聚類算法進(jìn)行建模與預(yù)測(cè)分析,預(yù)測(cè)結(jié)果如下:
采用k-means對(duì)人員報(bào)銷數(shù)據(jù)進(jìn)行分群,可通過(guò)如下手肘法來(lái)確定K的取值,在K=4時(shí),出現(xiàn)肘點(diǎn),因此K=4,分成4類。
分群1特點(diǎn):該類人員無(wú)報(bào)銷天數(shù)占比在95%以上占比較大,異常時(shí)間段報(bào)銷情況基本不存在,且報(bào)銷金額也較少,異常單筆金額筆數(shù)也較少,可以認(rèn)為該類人員為不活躍人員。
分群2特點(diǎn):該類人員無(wú)報(bào)銷天數(shù)占比在75%以上,且報(bào)銷金額占比在50%左右,而單筆報(bào)銷金額存在異常的筆數(shù)占比在3%~8%,存在異常金額報(bào)銷情況。
分群3特點(diǎn):該類人員無(wú)報(bào)銷天數(shù)占比在75%以上,且報(bào)銷金額占比在50%左右,而單筆報(bào)銷金額存在異常的筆數(shù)占比低于10%占多數(shù),存在異常金額報(bào)銷情況。將該人員分為報(bào)銷比重較大人員。
分群4特點(diǎn):該類人員無(wú)報(bào)銷天數(shù)占比在25%以下及60%以上占比較大,且有90%以上的報(bào)銷天數(shù)都存在異常時(shí)間段報(bào)銷;在異常時(shí)間段的報(bào)銷金額占比為50%,異常時(shí)間段的報(bào)銷筆數(shù)占比在40%占比較大,而單筆報(bào)銷金額存在異常的筆數(shù)占比低于15%占多數(shù),存在異常金額報(bào)銷情況。將該人員作為重點(diǎn)觀察人員。
四、機(jī)器學(xué)習(xí)在非現(xiàn)場(chǎng)審計(jì)中的前景展望
(一)機(jī)器學(xué)習(xí)方法用于提升數(shù)字化審計(jì)能力前景
從上文的機(jī)器學(xué)習(xí)模型建立情況來(lái)看,證明在非現(xiàn)場(chǎng)審計(jì)領(lǐng)域中,使用機(jī)器學(xué)習(xí)方法構(gòu)建審計(jì)模型,能夠解決非現(xiàn)場(chǎng)審計(jì)工作的三個(gè)主要問(wèn)題:①人工查證;②規(guī)則查證;③審計(jì)疑點(diǎn)識(shí)別;而且機(jī)器學(xué)習(xí)方法所建立的數(shù)學(xué)模型在此類數(shù)據(jù)工作方面能夠?qū)崿F(xiàn)經(jīng)驗(yàn)留存,具有較強(qiáng)的推廣性。
應(yīng)用機(jī)器學(xué)習(xí)方法建立數(shù)學(xué)模型技術(shù),能夠促進(jìn)被審查對(duì)象提供清晰、有效的審計(jì)原始數(shù)據(jù),更為直接地體現(xiàn)審計(jì)工作中隱藏的財(cái)務(wù)風(fēng)險(xiǎn),有效地避免被審計(jì)對(duì)象數(shù)據(jù)作假,規(guī)范審計(jì)過(guò)程。除此以外,基于數(shù)字化審計(jì)得出的審計(jì)結(jié)果有樣本性與研究?jī)r(jià)值,對(duì)同類數(shù)據(jù)的后續(xù)參考借鑒意義較客觀。
(二)機(jī)器學(xué)習(xí)方法在審計(jì)工作中應(yīng)用現(xiàn)存問(wèn)題
目前機(jī)器學(xué)習(xí)方法建立數(shù)學(xué)模型技術(shù)遇到的最大問(wèn)題就是如何解釋其中的邏輯和推理的客觀性問(wèn)題,因?yàn)橹挥谢A(chǔ)分類屬于人工決策的內(nèi)容,常常被認(rèn)為是黑盒模型,向非專業(yè)的工作人員或決策者們解釋起來(lái)很困難,他們很難理解模型是怎樣工作并做出決定的,因此在模型設(shè)計(jì)的邏輯判斷標(biāo)準(zhǔn)上要本著國(guó)家會(huì)計(jì)制度的基礎(chǔ)原則,增加非現(xiàn)場(chǎng)審計(jì)機(jī)器學(xué)習(xí)模型的可信度,絕不能因?yàn)榈谌降目陀^要求而背離審計(jì)基本原則,使模型喪失基本計(jì)算性能和準(zhǔn)確性。
五、結(jié)語(yǔ)
機(jī)器學(xué)習(xí)技術(shù)為非現(xiàn)場(chǎng)審計(jì)模型應(yīng)用實(shí)踐帶來(lái)了機(jī)會(huì),復(fù)雜且難以人為識(shí)別的模型算法可以通過(guò)機(jī)器學(xué)習(xí)技術(shù)進(jìn)行訓(xùn)練,從而擴(kuò)大非現(xiàn)場(chǎng)審計(jì)模型的容量。在審計(jì)實(shí)踐中,機(jī)器學(xué)習(xí)技術(shù)是需要在深入業(yè)務(wù)需求分析的基礎(chǔ)上結(jié)合多種算法和分析工具進(jìn)行綜合的應(yīng)用。基于機(jī)器學(xué)習(xí)的非現(xiàn)場(chǎng)審計(jì)模型的應(yīng)用,顯著降低了現(xiàn)場(chǎng)審計(jì)人員的投入、提高審計(jì)效率、擴(kuò)大了審計(jì)對(duì)象范圍,有效推動(dòng)了審計(jì)方式的進(jìn)步。
參考文獻(xiàn):
[1]呂勁松,等.基于數(shù)據(jù)挖掘的商業(yè)銀行對(duì)公信貸資產(chǎn)質(zhì)量審計(jì)研究[J].金融研究,2016,(07).
[2]王會(huì)金,陳偉.非現(xiàn)場(chǎng)審計(jì)的實(shí)現(xiàn)方法研究[J].審計(jì)與經(jīng)濟(jì)研究,2005,(05).
[3]易仁萍,王昊,朱玉全.基于數(shù)據(jù)挖掘的審計(jì)模型框架[J].中國(guó)審計(jì),2003,(03).