禹湘暉 廣東電網(wǎng)公司調(diào)度中心
大數(shù)據(jù)挖掘技術(shù)屬于一種基于數(shù)據(jù)分析與數(shù)據(jù)挖掘的計(jì)算方式,目前在許多領(lǐng)域均有著廣泛性應(yīng)用,按照國(guó)網(wǎng)審計(jì)業(yè)務(wù)的綜合分析,目前已經(jīng)在許多領(lǐng)域均有應(yīng)用,按照電力審計(jì)風(fēng)險(xiǎn)防范工作特征來(lái)看,其主要是將驗(yàn)證性的分析方式轉(zhuǎn)變?yōu)橥诰蛐缘姆治龇绞?,并將審?jì)方式轉(zhuǎn)變?yōu)轱L(fēng)險(xiǎn)預(yù)警,實(shí)現(xiàn)對(duì)審計(jì)思維、內(nèi)容、目標(biāo)、技術(shù)等多方面的優(yōu)化改進(jìn),并基于聚類分析算法方式實(shí)現(xiàn)應(yīng)用空間的擴(kuò)展。伴隨著信息化及時(shí)的持續(xù)性發(fā)展,數(shù)據(jù)形成速率以及生成量持續(xù)增多,大數(shù)據(jù)挖掘技術(shù)的應(yīng)用價(jià)值也會(huì)隨之提升。對(duì)此,探討大數(shù)據(jù)挖掘技術(shù)在電力審計(jì)風(fēng)險(xiǎn)防范中的應(yīng)用具備顯著實(shí)踐性價(jià)值。
對(duì)于挖掘性的數(shù)據(jù)分析方式屬于大數(shù)據(jù)中最為典型的一種技術(shù)形式,其主要是從大數(shù)據(jù)當(dāng)中尋找到隱含的數(shù)據(jù)規(guī)律的模式,并以預(yù)測(cè)的方式將趨勢(shì)與行為完成數(shù)據(jù)的分析,數(shù)據(jù)挖掘技術(shù)屬于實(shí)現(xiàn)發(fā)掘性有價(jià)值數(shù)據(jù)的一種處理方式[1]。大數(shù)據(jù)挖掘技術(shù)的關(guān)鍵在于數(shù)據(jù)挖掘的算法,算法屬于數(shù)據(jù)中非線性關(guān)系與因果關(guān)系的決定性因素,不同的算法可以應(yīng)用于不同的場(chǎng)景。當(dāng)前按照大數(shù)據(jù)挖掘技術(shù)的大數(shù)據(jù)審計(jì)可以在財(cái)政、金融、電信、保險(xiǎn)等多方面提供海量數(shù)據(jù)并實(shí)現(xiàn)對(duì)行業(yè)生命力、效能的強(qiáng)化,逐漸在財(cái)政審計(jì)、工程審計(jì)、民生專項(xiàng)資金以及社保資金審計(jì)等方面提供支持。
大數(shù)據(jù)挖掘技術(shù)中關(guān)鍵的技術(shù)便是數(shù)據(jù)挖掘算法,聚類分析方式主要是將所有數(shù)據(jù)對(duì)象劃分成為不同的子集,其目的是將同一個(gè)子集當(dāng)中的對(duì)象保持高度相似性,對(duì)于不同的機(jī)組中對(duì)象差別相對(duì)較大,聚類算法屬于無(wú)監(jiān)督性學(xué)習(xí)方式,因?yàn)樗婕暗降臄?shù)據(jù)提供不同的類型標(biāo)簽數(shù)據(jù),借助觀察學(xué)習(xí)實(shí)現(xiàn)對(duì)非示例的學(xué)習(xí),聚類可以實(shí)現(xiàn)對(duì)數(shù)據(jù)內(nèi)在性質(zhì)與規(guī)律的挖掘,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)綜合分析,聚類分析方式主要涉及到劃分方法、層次方法以及基于密度與網(wǎng)格的方式。
普遍而言,數(shù)據(jù)的挖掘過(guò)程主要涉及到三個(gè)階段,分別為數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘模型建設(shè)、數(shù)據(jù)的運(yùn)用與評(píng)估。
在數(shù)據(jù)準(zhǔn)備與預(yù)處理方面,主要是將審計(jì)問(wèn)題轉(zhuǎn)化成為數(shù)據(jù)挖掘問(wèn)題,明確問(wèn)題相關(guān)數(shù)據(jù)源之后將不同數(shù)據(jù)源集中到一起,并形成原始的審計(jì)數(shù)據(jù)資料,數(shù)據(jù)預(yù)處理過(guò)程中需要實(shí)現(xiàn)對(duì)數(shù)據(jù)的完整性處理以及噪聲判斷,對(duì)于不理想的原始數(shù)據(jù)實(shí)現(xiàn)預(yù)處理并實(shí)現(xiàn)對(duì)數(shù)據(jù)清理、集成以及規(guī)約等轉(zhuǎn)變[2]。數(shù)據(jù)挖掘模型的構(gòu)建方面,主要是按照審計(jì)任務(wù)和轉(zhuǎn)換完成之后的數(shù)據(jù)類型,采用適當(dāng)?shù)臄?shù)據(jù)挖掘技術(shù),并從相應(yīng)的算法庫(kù)當(dāng)中采用適當(dāng)?shù)乃惴ê途C合應(yīng)用算法方式構(gòu)建數(shù)據(jù)挖掘模型,建設(shè)模型期間屬于反復(fù)進(jìn)行的,借助修改模型參數(shù)的方式按照不同評(píng)估方式對(duì)比模型實(shí)現(xiàn)對(duì)最有效模型的判斷。在模型應(yīng)用和評(píng)估方面,將處理后的數(shù)據(jù)基于數(shù)據(jù)輸入模型和輸出分析的結(jié)果,在設(shè)置好模型參數(shù)之后通過(guò)計(jì)算機(jī)自動(dòng)完成計(jì)算,模型的評(píng)估主要是對(duì)模型完成審計(jì)任務(wù)的質(zhì)量進(jìn)行評(píng)估,并衡量模型的適用性。
基于全業(yè)務(wù)的數(shù)據(jù)中心建設(shè)方式,基于國(guó)家電網(wǎng)地方企業(yè)結(jié)合自身信息化的發(fā)展需求和已有的專業(yè)領(lǐng)域信息系統(tǒng)構(gòu)建成果數(shù)據(jù)資源并構(gòu)建全業(yè)務(wù)的數(shù)據(jù)中心,面向全業(yè)務(wù)范圍、類型以及時(shí)間維度等實(shí)現(xiàn)統(tǒng)一性的儲(chǔ)存與管理服務(wù),為企業(yè)提供全量的業(yè)務(wù)數(shù)據(jù)匯總與數(shù)據(jù)分析統(tǒng)一服務(wù),實(shí)現(xiàn)業(yè)務(wù)高度融合以及數(shù)據(jù)充分分享,基于全業(yè)務(wù)的統(tǒng)一性數(shù)據(jù)中心挖掘方式,可以綜合分析并開(kāi)展夯實(shí)基礎(chǔ)、數(shù)據(jù)擴(kuò)充介入以及資源在線納管的處理工作,從而進(jìn)一步完成數(shù)據(jù)資源的儲(chǔ)存與應(yīng)用,更好的服務(wù)于大數(shù)據(jù)分析應(yīng)用?;诙?jí)部署系統(tǒng)的介入以及一級(jí)部署系統(tǒng)數(shù)據(jù)按需介入,實(shí)現(xiàn)對(duì)業(yè)務(wù)數(shù)據(jù)的有效處理,結(jié)構(gòu)化的數(shù)據(jù)接入表與數(shù)據(jù)總量達(dá)到TB級(jí),采集數(shù)量涉及設(shè)備上百萬(wàn)臺(tái),非結(jié)構(gòu)化的數(shù)據(jù)也可以實(shí)現(xiàn)對(duì)大量采集。對(duì)于業(yè)務(wù)系統(tǒng)數(shù)據(jù)可以基于系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)模型實(shí)現(xiàn)規(guī)范化的儲(chǔ)存,并為后續(xù)大數(shù)據(jù)分析奠定基礎(chǔ)。
在數(shù)字化審計(jì)平臺(tái)建設(shè)方面,基于全業(yè)務(wù)數(shù)據(jù)中心的大數(shù)據(jù)資源,基于數(shù)字化審計(jì)平臺(tái)的建設(shè)目標(biāo),打破傳統(tǒng)專業(yè)系統(tǒng)之間的壁壘,采用全業(yè)務(wù)數(shù)據(jù)中心的海量數(shù)據(jù)資源,可以實(shí)現(xiàn)對(duì)數(shù)據(jù)字段的綜合分析,并基于營(yíng)銷、財(cái)務(wù)、工程以及物資等實(shí)現(xiàn)對(duì)不同業(yè)務(wù)領(lǐng)域的審計(jì)需求并構(gòu)建智能化審計(jì)模型以展示審計(jì)結(jié)果,對(duì)存在疑點(diǎn)信息以及資料明細(xì)的業(yè)務(wù)數(shù)據(jù)實(shí)現(xiàn)穿透性的查詢,借助圖像化的方式可以實(shí)現(xiàn)對(duì)在線智能審計(jì)工作成果的判斷,促使審計(jì)問(wèn)題與結(jié)果保持可視化。
為了更好的貫徹落實(shí)生態(tài)環(huán)境保護(hù)、清潔取暖等政策精神,某電力企業(yè)投資大量資金實(shí)現(xiàn)對(duì)配電網(wǎng)的改造與煤改電等民生項(xiàng)目的建設(shè),內(nèi)部審計(jì)屬于保障企業(yè)重大項(xiàng)目安全穩(wěn)定有效落實(shí)的關(guān)鍵,可以實(shí)現(xiàn)全程化的民生項(xiàng)目資金審計(jì)工作。借助重大民生項(xiàng)目的資金構(gòu)成,發(fā)現(xiàn)約有50%的資金應(yīng)用于購(gòu)置物資并存在大量的結(jié)余表現(xiàn),資金風(fēng)險(xiǎn)相對(duì)較高[3]。對(duì)此,內(nèi)部審計(jì)工作期間需要將物資的全流程風(fēng)險(xiǎn)防范作為民生項(xiàng)目的審計(jì)工作重點(diǎn)。
企業(yè)的物資管理部門采用常規(guī)物資管理全流程模式,在物資采購(gòu)和配送、物資需求與采購(gòu)配送等環(huán)節(jié)中應(yīng)用SAP系統(tǒng)開(kāi)展操作,線下按照采購(gòu)清單根據(jù)相應(yīng)比例收貨,物資管理部門的全程監(jiān)控在物資結(jié)算方面需要基于工程現(xiàn)場(chǎng)實(shí)際情況實(shí)現(xiàn)對(duì)物資結(jié)算清單的管理,同時(shí)基于管理、施工、監(jiān)理以及設(shè)備運(yùn)行等不同部門進(jìn)行聯(lián)合確定,設(shè)備運(yùn)行單位需要將現(xiàn)場(chǎng)所應(yīng)用的設(shè)備投入到PMS系統(tǒng)中,保障系統(tǒng)中電網(wǎng)拓?fù)浣Y(jié)構(gòu)和實(shí)際情況保持一致,從而確保電網(wǎng)的安全穩(wěn)定性,確保工程物資結(jié)算時(shí)的準(zhǔn)確性。在結(jié)余物資退庫(kù)方面,因?yàn)椴煌貐^(qū)供電企業(yè)的物資倉(cāng)庫(kù)容納空間有限,大量結(jié)余的物資線下無(wú)法實(shí)現(xiàn)有效的退回,只能夠存在其他的非注冊(cè)倉(cāng)庫(kù)中[4]。按照這一風(fēng)險(xiǎn)問(wèn)題,內(nèi)部審計(jì)工作期間需要將工程結(jié)余物資的總量作為審計(jì)的工作重點(diǎn),并借助大數(shù)據(jù)挖掘技術(shù)方式實(shí)現(xiàn)對(duì)物資存量、風(fēng)險(xiǎn)的評(píng)估,在審計(jì)期間針對(duì)問(wèn)題爆發(fā)之前采取相應(yīng)的防范措施,達(dá)到早期防控的干預(yù)目的。
在數(shù)據(jù)來(lái)源方面,線上物資的需求需要基于提報(bào)、審計(jì)、收發(fā)貨、結(jié)算以及利庫(kù)等業(yè)務(wù)操作方式在SAP系統(tǒng)中進(jìn)行操作,所以和相關(guān)數(shù)據(jù)源應(yīng)當(dāng)以結(jié)構(gòu)化的方式進(jìn)行處理,按照SAP系統(tǒng)數(shù)據(jù)進(jìn)行處理。在結(jié)余物資的取向系統(tǒng)分析方面,工程結(jié)余物資線下可以基于倉(cāng)儲(chǔ)容量限制和物資管理單位的要求實(shí)現(xiàn)對(duì)庫(kù)存物資的統(tǒng)一性管理,并基于線上不采取退回注冊(cè)倉(cāng)庫(kù)的方式進(jìn)行操作。隨著結(jié)余物資的工程項(xiàng)目結(jié)決算關(guān)閉,保障物資結(jié)算時(shí)的準(zhǔn)確性,在結(jié)余物資方面線上必須先退回原項(xiàng)目,在無(wú)法退回注冊(cè)庫(kù)時(shí)需要基于SAP系統(tǒng)應(yīng)用不停寄存的方式應(yīng)用于其他工程,對(duì)于電力企業(yè)而言,在建工程所有物資中過(guò)濾出全量工程結(jié)余物資屬于數(shù)據(jù)挖掘?qū)徲?jì)模型中的核心,屬于模型建設(shè)與應(yīng)用的重點(diǎn)。對(duì)于在建工程的所有物資應(yīng)當(dāng)劃分為兩個(gè)方面,分別為藏匿的結(jié)余物資與工程實(shí)際使用物資。伴隨著藏匿的結(jié)余物資持續(xù)流轉(zhuǎn),相對(duì)于工程實(shí)際使用物資與藏匿的結(jié)余物資有兩個(gè)基本特征,分別是時(shí)間維度,結(jié)余物資形成之前已經(jīng)結(jié)算關(guān)閉項(xiàng)目,藏匿的結(jié)余物資在系統(tǒng)中存在時(shí)間比較長(zhǎng)和實(shí)際使用物資存在比較大的差異,此時(shí)可以借助設(shè)置庫(kù)齡指標(biāo)的方式進(jìn)行區(qū)分[5]。另一方面在于空間維度,藏匿的結(jié)余物資流轉(zhuǎn)在不同工程項(xiàng)目中,流轉(zhuǎn)項(xiàng)目數(shù)量明顯超過(guò)了實(shí)際使用的物資流轉(zhuǎn)項(xiàng)目數(shù)量,此時(shí)可以設(shè)置流轉(zhuǎn)項(xiàng)目并明確區(qū)分于實(shí)際物資的特征,借助聚類算法的方式實(shí)現(xiàn)對(duì)數(shù)據(jù)分組,并將其相似性保持最大化,按照相似性最小化的原則實(shí)現(xiàn)分組與聚類,并以兩店的歐式距離作為聚類規(guī)范。
在結(jié)余物資總量方面,明確結(jié)余物資在SAP當(dāng)中唯一取向?qū)儆谠诮üこ痰闹攸c(diǎn),借助篩查在建工程中所有物資的明細(xì),結(jié)合物資的年齡、類型、沖轉(zhuǎn)次數(shù)、移庫(kù)次數(shù)等因素,計(jì)算出物資的庫(kù)齡與流轉(zhuǎn)項(xiàng)目數(shù)量并設(shè)置兩個(gè)考核指標(biāo),構(gòu)建藏匿物資的識(shí)別模型,借助聚類算法方式計(jì)算歐式距離內(nèi)的物資庫(kù)齡長(zhǎng)和流轉(zhuǎn)項(xiàng)目多的物資,明確結(jié)余物資的數(shù)量與明細(xì),從而實(shí)現(xiàn)對(duì)整體物資風(fēng)險(xiǎn)的準(zhǔn)確評(píng)估。在挖掘數(shù)據(jù)模型方面,需要基于藏匿在建工程的物資數(shù)量和金額,明確審計(jì)主體,同時(shí)借助聚類算法方式獲得物資庫(kù)齡與項(xiàng)目流轉(zhuǎn)次數(shù),同時(shí)明確物資交集,針對(duì)庫(kù)齡數(shù)據(jù)與項(xiàng)目流轉(zhuǎn)的明細(xì)實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化處理,并通過(guò)SAP系統(tǒng)提供數(shù)據(jù)實(shí)現(xiàn)對(duì)相應(yīng)數(shù)據(jù)的準(zhǔn)確處理。
綜上所述,在審計(jì)工作環(huán)境之下大數(shù)據(jù)挖掘技術(shù)對(duì)于審計(jì)工作的影響顯得越發(fā)突出和明顯,為了更好的適應(yīng)新形勢(shì),仍然需要不斷的改進(jìn)發(fā)展,特別是需要從數(shù)據(jù)質(zhì)量、審計(jì)思路等方面進(jìn)行不斷的創(chuàng)新與改進(jìn),注重?cái)?shù)據(jù)分析與數(shù)據(jù)挖掘的真實(shí)性以及數(shù)據(jù)高質(zhì)量水平,在數(shù)據(jù)量不斷增多的環(huán)境之下必然需要強(qiáng)化對(duì)系統(tǒng)數(shù)據(jù)的稽核,保障數(shù)據(jù)真實(shí)性,提升審計(jì)工作中數(shù)據(jù)質(zhì)量水平,同時(shí)做好內(nèi)部審計(jì)工作的多樣化轉(zhuǎn)變,按照不同審計(jì)目標(biāo)采用針對(duì)性方式,應(yīng)用統(tǒng)計(jì)學(xué)、分析性程序以及內(nèi)控評(píng)審,提高審計(jì)工作精準(zhǔn)度與數(shù)據(jù)分析與挖掘深度,從而確保電力企業(yè)綜合經(jīng)營(yíng)水平。