999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據背景下的社會審計探索

2018-09-10 03:48:21曾堯
企業科技與發展 2018年7期
關鍵詞:大數據

曾堯

【摘 要】目前,我國審計領域的大數據技術和方法僅停留在理論上的呼吁與倡導層面,社會審計亟待運用科學的大數據分析方法創新現有審計分析思維,以適應海量數據的持續增長。文章應用最流行的大數據分析語言和成熟的統計分析、數據挖掘算法,為審計業務部門提供探索性的數據分析思路,為審計數據分析的拓展做出貢獻。

【關鍵詞】統計模型;大數據;數據可視化

【中圖分類號】F239 【文獻標識碼】A 【文章編號】1674-0688(2018)07-0033-03

1 目的和意義

伴隨國家審計大數據的逐漸形成,傳統審計的思維方式和數據分析方法成為現出效率低、范圍窄的弊端,探索大數據環境下的審計方法已是當務之急。隨著云計算、移動互聯網等新技術的不斷推廣,全球社會經濟發展迎來了新機遇和新挑戰,大數據時代的來臨,不僅是體量的擴充,更是數據思維的轉變,面對因數據思維轉變所帶來的分析模式及分析要求的變化,審計人員需應時而變以適應大數據導致的新變革。

2 使用的軟件及研究方法介紹

本文主要使用R語言處理數據。一方面,由于被審計單位多樣,數據標準不一,所以審計人員必須做大量的數據處理和清洗工作(統稱審計預處理),而R語言對數據處理的強大性能可以滿足多樣的審計預處理需求。此外,審計預處理往往需要多個步驟,審計人員在數據庫中保存為中間表的傳統做法對大數據表進行操作時,不僅占用存儲空間,效率也較低,而R語言可以通過多種形式靈活保存中間結果,十分快捷、方便。另一方面,R語言具備強大的數據可視化功能,被公認為行業中的佼佼者,可以滿足一般圖形展示要求。對于高級數據圖形展示,會用到gplot2數據包,其理念是將繪圖與數據分離,以圖層作圖的理念,并把常見的統計變換融入繪圖中,可以創建優雅、信息豐富、定制化的圖形。

3 樣本的選擇實證分析

3.1 對A市高速公路數據的描述

通過對A市高速現場的各個路口采樣,我們對A市高速公路的各個收費站出現的問題數進行分類與匯總,首先繪制箱線圖(如圖1所示),直觀明了地表明在某一方面表現極其異常的收費站名稱。其次可以將各收費站按照其所屬中心進行匯總,繪制星圖,不僅可以觀察與比較各個所屬中心的表現情況,還可以直觀地看到各個所屬中心在不同問題方面的表現情況。此外,對于不同貨車車型在不同時間段內的超限比率進行分析時,我們也可以使用箱線圖(如圖2所示)。

由圖1可知,該收費站在入口大客車出口變小客車問題上極為異常,需要重點檢查與加強管理。由圖2的雷達圖我們可以直觀地了解到所屬中心為1號、4號、10號、18號、19號、22號、24號、28號、30號、40號、50號的問題很少,而26號問題最多,具體又可以表現為入口貨車出口變客車、車型貨車變客車及車型大客車變小客車問題較為嚴重,23號所屬中心只是入口貨車出口變客車問題嚴重。

對24個行車時段進行了聚合,按照1~6、7~12、13~18、19~24時段分為深夜、上午、下午和晚上4個分類變量。由此對某月份所有超載記錄的貨車進行了箱線圖繪畫(如圖3所示),并在途中顯示了各個分類下的均值點,可以看到貨車15號的超限比率最高,而所有車型都是在深夜超限率最高,這也對高速部門整治有了精確方向。

散點圖分析時,我們選取其中某個收費站某一天(2月27日)的數據,分車型畫出收費與里程關系的散點圖(如圖4所示),擬合曲線并將置信區間設置為90%,追蹤具體到車牌號的異常值的信息(如圖5所示)。

從圖4中可以看出1、2、3、4類車型擬合曲線最好,因其代表車型為客車,是按照里程數計費,所以很少存在偏差,而其他車型在擬合的曲線外仍存在較多離散的點,因其代表車型為貨車,收費標準不僅依據里程數,更受到載重量及是否超限的影響,而擬合曲線時僅考慮了里程數,所以擬合效果不是特別好,針對離散最為嚴重的紫色圓圈內的點追蹤車牌后可以得到圖5,不難看出車型全為大貨車,經查詢也發現其大都是超限所致,從而也印證了前面的說法。

3.2 對A市高速公路數據的實證分析

3.2.1 因子分析模型

應用因子分析模型,對314個收費站進行降維處理:將9個變量合并為2個復合因子,且重新命名為免費問題因子和收費問題因子。根據擬合的統計公式得到了在2個因子上的得分,畫出散點圖(如圖6所示),直觀地展示出314個收費站中特別異常的收費站。根據各個收費站的年通行次數即權重,原點的大小代表了收費站的年通行量大小;藍色深淺表示了各個收費站免費軍車通行次數的等級。免費軍車通行次數等級的劃分標準是選取了上下四分位數和中位數為劃分依據。X坐標軸代表了收費問題因子的得分大小,Y坐標軸表示了免費因子的得分。得到了問題比較多的9個收費站。收費站在坐標軸得分大于0表示該收費站的問題大于平均水平,小于0表示低于平均水平,可以看出年通行量較大的收費站收費問題更大。

3.2.2 Kmeans模型聚類分析

如今,信息技術飛速發展,大多數企業、機關、事業單位及其他組織的財務、業務信息早已實現了電算化,脫離了傳統的紙質記錄。在此背景下,審計工作也日益依賴計算機的協助。在計算機審計中,傳統的查找異常、發現審計線索的方法主要有排序、篩選、查找重號、查找斷號、分類、分層等。但在當下數據量越來越大、數據維度越來越復雜的情況下,許多異常數據混雜在海量的數據中,要用這些略顯原始的方法將它們一一找出來,多少顯得力不從心。因此,我們希望能夠通過將統計方法引入審計工作中,利用統計模型對數據有一個宏觀的把握,從而查出異常,進而發現審計線索。

我們取A市高速2017年某一個月的出口收費站流水數據,共2 000余萬條記錄進行試驗,考慮到計算機內存處理能力的限制,需要對這些數據進行壓縮。于是使用R語言取其中所有超限記錄,再選取出口站編號、最終車種、最終車型3個變量作為分類變量,對分得的每一類都計算其行駛里程、車貨總重、通行次數,得到壓縮后的數據記錄約4 000條,之后采用Kmeans聚類算法進行聚類,結果如圖7所示。

圖7中文字表示坐標軸含義,如第一行各圖的縱坐標和第一列各圖的橫坐標是“行駛里程”,以此規律可讀出其他各圖的橫、縱坐標含義。圖1中的圓點即壓縮后的數據點,它們的顏色表示它們在Kmeans聚類算法中被歸入的類別(見表1)。

3.2.3 面板模型分析

根據各收費站2017年的最終收費金額及總的通行次數先建立面板數據進行動態分析(如圖8所示)。

由圖8可知,各收費站最終收費金額一年中整體走勢較平穩,在2月份(春節期間)全部收費站收費金額均下降,縱向比較來說有幾個收費站的收費金額明顯高于其他收費站。這是由很多因素決定的,其中經濟因素是最不容忽視的,從中我們可以看出區域經濟發展的不均衡性及需要加強管理的地區。

下面我們將各收費站2017年1年間的最終收費金額對通行次數、車貨總重、行駛里程等變量進行了建模分析。

最終收費金額=X1×通行次數;R方=39.43%。

最終收費金額=X2×車貨總重;R方=69.57%。

最終收費金額=X2×行駛里程;R方=61.95%。

說明通行次數每增加1次,各收費站收費平均增加X1元。其中,通行次數的變化可以解釋最終收費金額變化的39.43%;車貨總重的變化可以解釋最終收費金額變化的69.57%;行駛里程的變化可以解釋最終收費金額變化的61.59%;說明收費站的最終收費金額與車貨總重關系最密切。

4 結論與啟發

大數據時代的審計方法應該結合我國社會審計的信息化條件,一方面將傳統成熟的數據分析方法繼續融入審計實踐中,形成面向數字化平臺的海量數據分析機制,另一方面結合科學的統計數據分析方法與工具特征研究如何將這些技術應用到審計創新,為將來社會審計使用這些技術提供前期積累和準備。通過實證分析發現,年通行量較大的收費站收費問題更大,行駛里程、車貨總重、通行次數3個指標都顯著大于其他類別,應作為審計重點加以審查。通過面板分析發現,收費站的最終收費金額與車貨總重關系最密切。收費站流量預測是一個很值得分析的問題,統計學上所提到的很多模型都可以用來對其進行預測,我們嘗試過采用一些其他模型,時間問題還沒有形成系統的結果,沒有辦法呈現。后期若條件允許,在流量預測方向上還有很多可以深入分析拓展的內容。我們對高速數據的分析,目前僅限于微觀層面上,后期若結合宏觀數據分析一些收費站問題出現的原因,會是一個很好的思路。

參 考 文 獻

[1]邵松長.淺議大數據環境下企業內部審計工作的轉型提升[J].財會學習,2018(11):145,147.

[2]馬志娟,梁思源.大數據背景下政府環境責任審計監督全覆蓋的路徑研究[J].審計研究,2015(5):28-34.

[3]周霞,林津翹,華峰.大數據時代企業內部審計新常態研究[J].中國內部審計,2017(3):13-17.

[4]王茂森.大數據背景下政府審計工作的挑戰及解決策略研究[J].財會學習,2018(13):168.

[5]王昊,趙越,石楷文,等.審計方法于大數據時代的革新[J].市場周刊,2018(5):123-124.

[責任編輯:鄧進利]

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 亚洲综合日韩精品| 国产精品lululu在线观看| 色婷婷亚洲十月十月色天| 免费毛片a| 亚洲第七页| 国产成人精品午夜视频'| 国产精品冒白浆免费视频| 亚洲欧美天堂网| 国产一区二区人大臿蕉香蕉| h视频在线播放| 久热精品免费| 亚洲高清无在码在线无弹窗| 日韩欧美国产综合| 在线亚洲小视频| 老司机精品99在线播放| 亚洲三级电影在线播放| 国产成人久久777777| 欧美成人免费午夜全| 日韩午夜福利在线观看| Jizz国产色系免费| 少妇精品在线| 操美女免费网站| 无码又爽又刺激的高潮视频| 无码AV动漫| 国产视频 第一页| 国产成人一区免费观看| 国产91线观看| 美女毛片在线| 毛片基地视频| 久久人人爽人人爽人人片aV东京热 | 国产亚洲精品无码专| 国产午夜精品一区二区三区软件| 国产性猛交XXXX免费看| 亚洲精品黄| 精品三级在线| 国产大片黄在线观看| 国产亚洲欧美在线人成aaaa| 日本影院一区| 天堂在线www网亚洲| 国产成年女人特黄特色毛片免| 18禁黄无遮挡网站| 热99re99首页精品亚洲五月天| 天堂成人在线视频| 九色视频最新网址| 四虎影视国产精品| 国产尤物视频网址导航| 东京热一区二区三区无码视频| 99这里只有精品免费视频| 欧美中文字幕一区二区三区| 9cao视频精品| 91青青视频| 日韩免费毛片| 欧美一区二区三区欧美日韩亚洲 | 国产99久久亚洲综合精品西瓜tv| 久久国产拍爱| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 国产成人h在线观看网站站| 久久一本日韩精品中文字幕屁孩| 无码高潮喷水在线观看| 欧美日在线观看| 72种姿势欧美久久久大黄蕉| 亚洲精品另类| 精品国产中文一级毛片在线看| 亚洲欧美日韩中文字幕在线一区| 伊人无码视屏| 亚洲成人在线免费| 日韩人妻少妇一区二区| 美女一区二区在线观看| 欧美一级色视频| 狠狠躁天天躁夜夜躁婷婷| 成人免费一区二区三区| a亚洲视频| 老熟妇喷水一区二区三区| 在线免费a视频| 午夜视频免费试看| 亚洲欧美h| 免费一级毛片在线播放傲雪网| 国产成人久久综合一区| 欧美不卡二区| 四虎国产精品永久一区| 国产噜噜噜视频在线观看| 欧美专区在线观看|