王雪榮 侯偉龍
【關鍵詞】 大數據審計; Citespace; 知識圖譜; 研究綜述
【中圖分類號】 F239.1? 【文獻標識碼】 A? 【文章編號】 1004-5937(2021)23-0078-09
一、引言
大數據(Big Data)就表層含義而言,可定義為以傳統數據處理工具和軟件無法進行有效處理的各種來源的巨型非結構化數據集。大數據的出現促進了主題廣泛的新研究,各種大數據統計方法不斷涌現和發展。2014年,國務院發布《關于加強審計工作的意見》,提出將大數據技術應用于國家審計,提高信息化技術應用程度。2015年,國務院在《促進大數據發展行動綱要》中提出國家大數據戰略,進一步強調大數據的重要性。2018年2月28日,中國共產黨第十九屆中央委員會第三次全體會議通過的《中共中央關于深化黨和國家機構改革的決定》,強調綜合運用大數據,增強宏觀調控前瞻性,強化經濟監測預測預警能力,更好發揮國家戰略、規劃的導向作用。2020年新冠肺炎疫情期間,各方工作皆受到影響,但審計單位靈活運用大數據技術開展審計工作,使其得以正常運轉。審計署重慶特派辦、審計署哈爾濱特派辦、廣東省審計廳電子數據審計處均采用大數據技術開展疫情下的審計工作,并取得了顯著的成果[ 1 ]。
面對日益龐大的數據量以及復雜的數據環境,需要利用更加高效的審計手段對被審計對象進行審計,同時,審計全覆蓋也對全體審計人員專業水平提出了更高的要求,需要審計人員及時掌握相關技術。正如胡澤君(2018)所說,當前審計正面臨從傳統審計向現代審計的轉變,審計開展現代化大數據智慧審計是時代要求,大數據是實現審計全覆蓋的必經之路。因此,為了進一步明確大數據審計領域的研究現狀、研究熱點以及未來可能的發展方向,本文使用Citespace,將來自CNKI的2 768篇文章以知識圖譜的形式進行可視化分析,展示大數據審計領域的研究情況,為研究者了解大數據審計提供借鑒和參考。
二、研究方法及樣本選擇
(一)研究方法
本文采用Citespace5.6.R5(Expires December 31, 2020)和Citespace5.7.R2(Expires Sept 30,2021)進行文獻分析,綜合新舊兩個版本,可以確保可視化成果的完整性以及研究成果展示的時效性。Citespace是美國德雷塞爾大學(Drexel University, Philadelphia, PA, USA)信息科學與技術學院英籍華人陳超美教授于2014年開發的軟件。Citespace在國內又被翻譯為引文空間,是基于數據可視化以及計量學背景下發展起來的一項專門分析科學研究中潛在知識的引文可視化分析軟件。該軟件通過可視化的手段來分析呈現出的科學知識結構、規律和分布情況,因此,分析結果被稱為“科學知識圖譜”[ 2 ]。
科學知識圖譜是顯示科學知識、新興學科發展過程和發展現狀、科學知識內外部結構的一種圖形。科學知識圖譜的直接研究對象是科學知識,以科學計量學為理論基礎,同時涉及科學學、應用數學、信息科學和信息計量學的交叉領域[ 3 ]。相比傳統的文獻綜述,科學知識圖譜分析利用可視化分析,將科學知識更為直觀、系統地展現在研究人員面前,使得理解更容易,并且對未來發展方向能夠更好地把握。該方法已廣泛應用于醫學、工程學、心理學、管理學、教育學、經濟學等許多學科,并取得了豐富的研究成果,但在審計學中鮮有使用[ 4 ]。
(二)樣本選擇
本文中文樣本取自CNKI數據庫。為保證所選取的樣本量具有價值性,選擇期刊庫中的SCI、EI、核心、CSSCI、CSCD數據庫,初步篩選時主題詞為“大數據”或含“數據挖掘”,選擇“同義擴展”確保主題篩選后的樣本無遺漏,時間區間為“2012—2020年”(2020年文獻僅包括12月前收錄文獻)①,初步檢索出文獻147 594篇。更改主題詞為“審計”,保持其他條件不變,在初次檢索結果中進行二次檢索,得到“大數據審計相關文獻”2 799篇,剔除英文文獻后為2 799篇。將得到的數據進行手工篩選,剔除“會議”“廣告”“征文”等無關文獻,得到2 768篇相關文獻。經過Citespace除重以及缺失處理后,最終得到中文文獻2 768篇。對最終文獻進行年度分布分析,如圖1所示,發現自2012年以來,年發文數量逐年提高,占發文總量(2 799篇)的99.78%,2012—2016年、2018—2019年每年發文數量基本為上年的兩倍,由此可見大數據審計研究的熱度逐年提升,學者對其關注度明顯增加。

三、大數據審計整體研究情況的知識圖譜分析
使用Citespace得到的知識圖譜由網絡節點以及網絡連接線組成。圓點代表網絡節點,圓圈越大表示出現頻率越高。圓圈中圓環的不同顏色代表了網絡節點出現的年份,圓環圈數越多代表節點出現持續的年份越多。圓環的深淺程度代表出現年份,顏色越深代表出現年份越近。同時節點的大小也代表了節點出現頻率的高低,節點字體越大,節點出現頻率越高。圓點之間的連線代表節點之間的關系,連接線越密集代表兩節點在同一篇文獻中共同出現的頻次越高。連線的顏色含義與圓環顏色相同,表示年份遠近。
(一)高產作者以及作者合著情況
對作者進行分析,可以準確掌握研究領域內的權威專家學者,他們對該領域通常已經有了充分的了解,形成較為成熟的研究體系,對其發表文章進行閱讀,可以快速、有針對性地了解該領域的最新研究現狀和前沿動態。利用Citespace軟件分析,將網絡節點設置為作者(Author),對2012—2020年的文獻以1年為一個時間跨度進行切片,閾值為默認設定Top N=100、Top N%=10%,前中后三個時間段c、cc、ccv的閾值分別為(2,2,20)、(4,3,20)、(3,3,20),得到大數據審計研究發文作者的知識圖譜,如圖2所示,關鍵節點326個(N=326),關鍵路徑109個(E=109)。通過分析知識圖譜,可以發現高產作者主要有3位,分別是陳偉(20篇)、程平(13篇)、劉國城(11篇),并主要以這3位學者形成了明顯的合著網絡,其他學者大多為兩人、3人之間的簡單合作。從整體來看,國內關于大數據審計的學者分布較為分散,缺乏大量的密集的關聯性,作者合作網絡松散。


將作者發文數量以及初次發文時間整理得到表1,從中可以發現,發文數量超過10篇的僅有3人,分別是陳偉、程平、劉國城,其他人發文數量均偏少。陳偉發文時間較早并且發文數量最多,形成了數量可觀的研究成果,除此之外還出版了《大數據審計理論、方法與應用》《計算機輔助審計原理及應用(第四版)——大數據審計基礎》等一系列專業教材,因此具有一定的權威性。劉國城代表的節點發文顏色深,表示其發文時間集中于近幾年,可見其文獻具有一定的前沿性,通過對其文獻進行閱讀可以掌握大數據審計領域內的最新動態。同時進行作者知識網絡分析,發現與劉國城合作密切的學者王會金、張文秀同屬一家研究機構(南京審計大學),屬校友、同事或師生關系,且圖中其他小范圍聯系網絡的作者均存在這種關系。小范圍學者之間的合作雖然有利于高質量研究成果的產生,但不利于管理審計的持續發展(李紅霞,2018)。縱觀整個作者合作網絡,單人發文量仍處于一個比較低的水平,且作者的合作水平都很低,大多處在一個3~5人的小合作網絡。因此,社會以及學界要積極鼓勵跨學科學者之間的合作,豐富學科內涵,并將理論成果落實轉化為生產力工具。
(二)發文機構分析
利用Citespace對發文機構進行分析可以得到機構發文網絡,基于此網絡分析得出該研究內容在不同研究機構的分布情況。其他參數不變,得到大數據審計研究發文機構的知識圖譜,如圖3所示。其中關鍵節點304個(N=304),關鍵路徑52個(E=52)。從圖中可知,發文數量最多的高校分別為南京審計大學、重慶理工大學、審計署審計科研所、安徽財經大學、河南大學。其中南京審計大學發文數量最多,有一定的時間跨度,說明其具備持續產出的能力,并且以其為中心形成了一個較大的合作網絡,合作對象既有高校(安徽財經大學),也有政府機關(審計署),并且積極與審計署各部門之間進行合作,實現了理論與實務的有機結合,形成了產學研一體化的局面。其他合作網絡還有重慶工商大學合作網絡、蘭州財經大學合作網絡、中南財經政法大學合作網絡,但是大多屬于學校內部學院之間合作,且合作程度不深,持續生產力差,成果有限。除去理論界,審計署審計科研所、審計署金融審計司、審計署部分特派辦也對大數據審計有所研究,但存在成果不足的局面。


鑒于部分學者發文時署名為某大學,而部分學者署名為大學的二級學院,因此,圖示并不能十分清晰地表示整體研究實力。為了更清晰地展示,對后臺數據進行整理,將研究機構統一整理為一級研究單位,即某大學,排名前10的發文機構如表2所示。排名前10的機構中,高校占6位,企業機關占4位,高校發文數量高于企業機關。但是,企業機關發文時間早于高校,說明企業機關在實務層面上對大數據審計的需求更早,從一定程度上印證了大數據審計實務的重要性。
(三)關鍵詞分析
關鍵詞可以高度凝練一篇論文的主題,因此利用關鍵詞進行論文分析可以掌握文章的研究目標。基于齊普夫定律,對大量文獻進行關鍵詞分析,得到某一指定領域在特定時間區間內關鍵詞出現頻率,并按出現頻率對其進行排序,便可以直觀地得到該領域內的研究動態以及研究熱點。關鍵詞分析也是使用Citespace進行文獻分析的主要目的,可以很好地觀察研究主題的聯系和發展。本文擬從關鍵詞共現、關鍵詞突現、主題聚類以及關鍵詞共現時區四個角度對關鍵詞進行分析,以展現大數據審計的研究變遷、研究現狀、研究熱點以及未來研究方向。
1.關鍵詞共現
利用Citespace對關鍵詞進行分析可以得到關鍵詞共現網絡,基于此網絡分析得出研究熱點。將網絡節點設置為關鍵詞(Key Word),其他參數不變,使用最小生成樹算法,得到大數據審計研究關鍵詞共現的知識圖譜,如圖4所示,其中關鍵節點477個(N=477),關鍵路徑2 511個(E=2 511)。根據知識圖譜分析,除研究主題“大數據”“審計”外,出現頻次最高的分別為“內部審計”“審計工作”“審計信息化”“大數據技術”“云審計”。可以將關鍵詞分為三類:一是大數據審計方法,例如“審計信息化”“云計算”“云審計”“數據挖掘”“關聯規則”“區塊鏈”等;二是大數據審計的使用主體,例如“內部審計”“國家審計”“政府審計”等;三是大數據審計目標,例如“審計全覆蓋”“審計監督”“精準扶貧”“審計風險”“經濟責任審計”等。大數據審計技術方法均是根據大數據的性質特征而提出的,其中最重要的兩大性質特點是數據量龐大、數據價值密度低。“云計算”“數據挖掘”出現頻率高,這也展示出大數據的特征,即數據量龐大、價值密度低,需要進行大量的算法運算從數據中挖掘、篩選具有含金量的信息。同性質的關鍵詞還有“數據分析”“大數據技術”“關聯規則”等,均表現出大數據在數據量以及價值密度方面的特性。在大數據審計使用主體方面,主要是兩大類,一類是“政府審計”“國家審計”,另一類是“內部審計”。從政府審計來看,黨的十八屆四中全會、中央審計委員會第一次會議、金審三期工程均對審計的職能定位以及審計技術方法提出了新的要求,大數據與審計的契合可以滿足實現政府審計工作的各項要求,審計署各特派辦以及地方審計局對大數據審計的實現路徑和優勢進行了充分的探索,可見政府是積極探索大數據審計的重要力量。從內部審計來看,企業也希望借助大數據審計來防止內部腐敗,進一步加強企業結構的良性發展。從審計目標來看,大多為政府審計的目標,這與國家宏觀政策具有高度一致性,例如“審計全覆蓋”“審計監督”“精準扶貧”“經濟責任審計”均是近期國家宏觀政策的目標。大數據與審計的有效結合可以促使政府審計目標的實現,加速社會主義現代化的進程,同時審計的監督與全覆蓋可以保證發展的高質量。

將關鍵詞進行整理,得出詞頻較高的關鍵詞,之后手動整理,刪除與研究主題無關的關鍵詞,并進行同類關鍵詞合并,得出高頻關鍵詞Top20,如表3所示。

2.關鍵詞突顯
利用Citespace進行關鍵詞突顯知識圖譜分析,選擇與前節主題分布相同的系統參數,得到圖5。關鍵詞突顯分析可以進一步觀察關鍵詞熱度持續時間、目前研究熱點,以及未來研究方向預測。圖中“Year”表示關鍵詞出現年份,由于數據時間范圍為“2012—2020年”,因此關鍵詞均從2012年開始持續出現;“Strength”表示關鍵詞突現強度;“Begin”表示關鍵詞突顯初始時間,關鍵詞從該年成為了研究熱點;“End”表示關鍵詞熱度結束的時間。圖中藍色部分(淺色)表示關鍵詞出現并持續時間,紅色(深色)部分表示關鍵詞成為研究熱點并持續的時間。

從圖中可以看到“云計算”作為熱點研究出現時間相對最早,從2013年開始便受到廣泛關注,并且突現強度高,達到4以上,成為研究熱點。計算力的高低將直接影響大數據分析的效率和程度,因此,在大數據價值得到廣泛認可之后,學者希望通過目前的數據分析技術,將其全部信息進行挖掘,從而展現數據集的全部數字特征,并將其與客觀事實相結合,轉化為有價值的信息線索。“云審計”“計算機審計”“云會計”在2014年之后成為研究熱點,代表審計領域的研究者逐漸將“大數據”這一概念和特點與審計相結合,嘗試探索審計領域內“大數據”的應用。同時2014年國務院發布《關于加強審計工作的意見》、2015年國務院發布《促進大數據發展行動綱要》,均對大數據技術在審計的應用提出了要求,促使“國家審計”研究熱度在2014年之后提高,突現強度達到4.25。近年大數據審計研究領域內,“人工智能”的研究熱度最高,并且持續至今。目前學者通過云計算與大數據審計相結合已經初步解決了算力問題,同時嘗試建立大數據審計平臺,在此過程中,引入人工智能、機器學習使得審計平臺更加智能、智慧,將審計人員從重復、機械式的數據處理、簡單判斷中解放出來。綜上所述,大數據審計的研究方向逐步由宏觀轉入微觀,更注重于大數據審計的綜合應用。
3.關鍵詞時區圖
關鍵詞時區圖主要展示研究主題變遷。選擇與前節主題分布相同的系統參數,得到大數據審計關鍵詞共現時區(Time Zone),如圖6。從時區圖中可以觀察到國內大數據審計研究的知識周期與不同階段的發展軌跡。

通過圖6所展示出的信息,可以將大數據審計的發展歸結為三個階段。第一階段為2012—2014年大數據初步發展階段,學者開始意識到大數據時代的到來。在此期間,文獻發表數量比較少,主題詞數量也較少。該階段主要論證大數據審計的可行性,并嘗試將大數據與審計多方面進行結合。一方面是審計主體,從圖中可以觀察到此階段大數據與企業審計、內部審計、國家審計聯系密切;另一方面是審計技術,代表關鍵詞包括“大數據審計”“大數據技術”“云計算”“數據挖掘”“計算機審計”等。該階段的研究還處于初步階段,研究比較籠統、粗糙,只是從宏觀層面展開。第二階段為2015—2017年大數據細化發展階段,該階段的主題詞數量以及代表內容相較于第一階段更加豐富。相對于傳統審計,信息環境下審計客體由傳統賬簿實物為載體轉化為數字信息,因此該階段審計客體變為“信息系統審計”“電子數據審計”。除此之外大數據審計也參與到更多的審計業務中,例如“績效審計”“離任審計”“經濟責任審計”。業務審計主體主要是政府方,在審計全覆蓋概念提出后,政府機構積極拓展新的審計方式,在充分發揮審計監督作用的同時,擴大審計面,這意味著國內大數據審計研究的發展趨勢與國家的大政方針以及社會發展的方向相契合。第三階段為2018年至今,研究主題進一步細分,研究方向更加多樣化,與審計結合程度更深,出現了“扶貧審計”“跟蹤審計”“工程審計”等新的領域,同時不斷吸收類似于“區塊鏈”等新興技術。綜合分析可以發現,大數據審計研究經歷了由籠統到細致、由宏觀到微觀的發展階段,審計主體、審計客體、審計業務不斷擴充,到現在已經基本覆蓋傳統審計的全部領域,且對大數據審計領域進行細分,充實、豐富了大數據審計的范疇。大數據審計技術方法也不斷創新,及時吸收新興技術,加速了大數據審計的智慧性建設。
4.關鍵詞聚類分析
關鍵詞聚類圖中Q值代表圖譜的信息模塊性,描繪聚類圖內部連線的密集程度,內部連線越多,Q值越大,聚類效果越好,當Q>0.3時,便可以認為聚類模型模塊性是顯著的。聚類出的模塊用S值表示圖譜的輪廓系數,當S>0.7時,認為聚類是高效且令人信服的。本文數據的結果(限于篇幅圖略),Q值為0.94,S值為0.88,因此本文的聚類結果是十分有效并且可靠的。本文數據量大,共有20聚類,為聚焦研究熱點,選擇聚類最大的10個進行呈現,分別是“#1大數據技術”“#2大數據”“#3云會計”“#4審計方法”“#5對策”“#6企業審計”“#7專項審計”“#8計算機輔助審計技術”“#9內部審計人員”“#10大數據審計”。針對聚類結果進行分析可知,基于大數據的新審計技術方法是研究重點,10大聚類中有4個屬于大數據審計技術。除此之外大數據審計適用審計主體及其對審計人員產生的影響也是研究領域內的重點。
將聚類分析與關鍵詞時區圖相結合,如圖7所示,從關鍵詞聚類與時間演變二維角度分析大數據審計研究主題的變遷,可以使讀者更加清楚地把握大數據審計領域內研究主題的分布以及隨時間變化的情況。每一條橫線代表了一個研究主題,橫向表示時間,橫線最左端是該聚類出現時間,橫線上的圓圈代表該聚類領域內研究的關鍵詞,圓圈所在位置即關鍵詞在此聚類中首次出現時間,圓環代表了關鍵詞出現橫跨年度。可以清晰地觀察到“#2大數據”這一研究主題最早出現,其他研究均是建立在該研究聚類基礎之上的。此后“#1大數據技術”“#10大數據審計”出現,是對大數據研究的外延以及在審計領域研究的進一步拓展。隨后研究領域不斷細化,一方面是“#6企業審計”,緊接著“#9內部審計人員”,最終“#7專項審計”;另一方面與大數據審計方法有關,先是產生了“#3云會計”,緊接著是“#4審計方法”,隨后逐漸變得專業化,“#8計算機輔助審計技術”最終誕生,意味著大數據審計研究專業領域的形成。對時區圖內容以及聚類圖內容的進一步理解,可達到對大數據審計領域研究發展充分了解的目的,為學者提供幫助。
四、研究結果綜述
隨著審計項目日益復雜和對審計要求的提升,需要更新審計技術手段來輔助審計工作的開展。通過Citespace進行文獻可視化分析,只能獲得宏觀層面上的信息,為使研究者更加細致地了解大數據審計領域內的研究現狀,筆者利用傳統文獻分析綜述方法對大數據審計進行綜述,已有研究主要集中在以下三個方面。
(一)大數據審計技術開發及優劣分析
在大數據研究初始階段,學者首先對大數據與審計的適用性問題展開討論,主要關注大數據應用于審計的可能性以及優越性,并在此基礎上從不同角度嘗試提出大數據審計技術方法。國外學者Adrian Gepp等[ 5 ]分析了大數據技術在審計中的使用,發現大數據并不像在其他相關領域那樣普遍,審計在使用有價值的大數據技術方面落后于其他領域。Xiang JianWei[ 6 ]提出傳統的審計模式會給審計機關帶來高昂的維護成本,基于此提出云計算,構建了云計算環境審計信息系統的基本框架。Nest等[ 7 ]、Smidt等[ 8 ]均認為GAS(通用審計軟件)的使用頻率尚未達到最佳狀態,全球內部審計職能部門對GAS的使用仍處于較低水平。但是也存在學者對大數據審計持保守態度,Rose等[ 9 ]通過對四大127名審計師進行調查發現,大數據審計并沒有給審計工作的開展提供更多便利。
國內學者張曉東和俞振華[ 10 ]通過介紹中國國情與工程審計情況,提出適合當時情境的審計技術方法——BIM審計。徐鶴田[ 11 ]基于傳統的SWOT分析,對國家治理視角下的大數據審計工作模式展開研究,得到了肯定的結論。劉星等[ 12 ]從大數據審計全過程角度分析了數據采集、數據處理標準化、數據存儲、數據分析方法和組織模式。牛艷芳等[ 13 ]應用計算機R語言進行審計數據挖掘分析。裴文華和成維一[ 14 ]針對財政大數據審計開展研究,提出了財政大數據審計的分析思路和方法。秦榮生[ 15 ]從會計的角度出發,論證了大數據思維在會計工作中的重要性。
此階段,學者對大數據適用于審計的情況是基本肯定的,大數據審計技術可以提高審計效率,增強審計質量,節約審計資源,充分發揮審計的監督職能,做到審計全覆蓋。但是該階段研究還是停留在理論層面,對于大數據審計技術實務層面的展開和應用方面的研究成果存在不足。
(二)大數據審計適用方向
在進行大數據審計可行性分析的基礎上,學者嘗試將大數據與審計的具體方面相結合,充分發揮大數據的作用。王雪榮等[ 16 ]針對政府投資項目審計與項目持續跟蹤審計進行了綜述,提出建立基于現代工程特點和現代信息技術的跟蹤審計框架以及數據庫。梁秀根等[ 17 ]提出構建跟蹤審計大數據挖掘,并論述了其優點和可行性。鮑朔望[ 18 ]認為將大數據審計引入政府采購系統,優化對政府采購系統的審計模式,可以大幅度提高審計效率。李強和謝汶莉[ 19 ]認為大數據技術應用于審計是必要的,但是大數據分析的成果需要適當地轉化,使之更為具體化、形象化,更為直觀,因此提出大數據可視化分析,并嘗試進行信息系統的構建。陳偉[ 20 ]認為大數據審計平臺的建立應適用于稅務審計、社保審計、固定資產投資審計等不同的審計項目。
(三)大數據審計平臺的構建
在大數據審計理論研究的基礎上,學者提出各自的想法,從各方面推演大數據審計平臺的構建。對大數據審計背后采用的原理,學者提出可以采取模糊匹配的審計證據獲取方法以及數據匹配方法,找到數據的重復點和存疑點,基于此種方法可以大幅縮短數據運行的處理時間,進而提高數據的處理效率[ 21-22 ]。劉國城和王會金[ 23 ]將大數據審計平臺分拆為采集、預處理、分析和可視化四個子平臺,基于方法支撐、過程建模和運行機理等方面對各個子平臺進行專項研究。魯清仿等[ 24 ]提出從審計法律法規出發,將審計人員的審計經驗、思路、判斷依據匯集于一體,借由計算機系統自動實施,并且隨著審計實踐的發展不斷完善,將越來越“智慧”。智慧審計有助于解決大數據審計存在的問題,從而更有效率地實施全面、全年度不停歇的審計。陳大峰和陳海勇[ 25 ]構建了趨勢審計實施框架,利用大數據集中處理技術和統計技術代替傳統的數據抽樣處理,最終通過趨勢研究得到的審計結論更有說服力。
綜上所述,大數據審計研究到目前為止已經基本完成了由理論研究向實務研究的過渡,并且逐漸成為現代審計技術方法研究領域的熱點,取得了大量的研究成果,提出了基于模糊匹配、可視化分析、智慧審計等大數據審計方法。但是,大數據審計平臺的構建過于理想化,對與原數據的理想程度過于樂觀,且經過現實數據運行的大數據審計平臺較少,并未完成大數據審計的生產力完全轉化,未能充分發揮大數據審計的全部潛力。隨著大數據審計研究熱潮的興起,國內外研究成果勢必會得到進一步豐富,研究內容進一步細化,這些研究成果將會為大數據審計的落地提供堅實的理論支撐。

五、結論與展望
大數據時代的到來改變了審計所面臨的數據環境,如果不采取適當的審計方法予以應對,那么審計人員將無法勝任大數據環境下審計帶來的挑戰。本文依據2012—2020年共2 799篇CNKI期刊文章樣本,從大數據審計的發文作者、發文機構、研究熱點關鍵詞、關鍵詞聚類展開分析,得到以下結論:(1)大數據審計研究熱度持續升高。大數據審計研究受到學者的廣泛關注,文獻數量呈倍數型增長,領域內作者成果不斷增多,并且不斷有新的學者加入研究,在一定程度上促進了跨學科、跨區域發展。(2)大數據審計研究領域不斷細化。學者基于審計的特點,與宏觀政策內容和實際需求相結合,尤其是政府審計領域,涉及扶貧審計、經濟責任審計、離任審計、金融審計等多重業務,充分挖掘了大數據審計的發展潛力。(3)作者之間、機構之間合作不深。科研機構與企業、政府機構之間合作有限,難以將理論成果轉化為實際生產工具。(4)大數據審計平臺構建細節不足。大多數學者對大數據審計平臺的構建過于理想化,對實際審計實務中數據格式的復雜性未給予充分考慮,如文本數據的處理,不同單位、跨地區之間材料價格方面的差異等一系列具體細節均語焉不詳或是一筆帶過,同時系統內部各環節之間的銜接轉換問題也并未提及。
綜上,大數據審計的研究熱度一直居高不下,本文針對目前研究現狀提出未來可能的研究方向與展望:(1)跨區域、跨學科之間的合作。大數據審計平臺構建過程中,需要的大多技術來自于工科范疇,因此,與工科學者進行合作有利于平臺算法的優化,解決平臺系統性的問題。(2)理論與實務相結合。大數據審計需要進一步將其具化,將理論成果轉為生產力,其所憑借的依據、證據鏈需要實務界的配合和判斷,與實務界的合作還可以增強系統的完整度。(3)拓寬大數據審計適用主題、客體及業務種類。目前政府審計是大數據審計研究的帶動者與引導者,這與國家宏觀政策密不可分,并可以充分發揮審計的監督職能,未來將大數據審計應用于大型企業內部審計或者注冊會計師審計也是完全可行的。
【參考文獻】
[1] 中華人民共和國審計署網站[EB/OL].http://www.audit.gov.cn/searchweb/.
[2] 李杰.Citespace中文版指南[EB/OL].http://blog.sciencenet.cn/blog-496649-886962.html.
[3] 陳悅,劉則淵,陳勁,等.科學知識圖譜的發展歷程[J].科學學研究,2008(3):449-460.
[4] 王偉,孟焰.西方審計研究的科學知識圖譜分析[J].審計研究,2016(3):32-39.
[5] GEPP A,LINNENLUECKE M,O'NEILL T,et al.Big data techniques in auditing research and practice:current trends and future opportunities[J].Journal of Accounting Literature,2018,40:102-115.
[6] XIANG JIANWEI.Building the audit information system in cloud computing environment[C].2013 3rd International Conference on Packaging and Manufacturing Technology(ICCPMT 2013),2014.
[7] NEST V D,SMIDT L,LUBBE D.The use of generalised audit software by internal audit functions in a developing country:a maturity level assessment[J].Risk Governance and Control:Financial Markets & Institutions,2017,7(4):189-202.
[8] SMIDT L,AHMI A,STEENKAMP L,et al.A maturity level assessment of generalised audit software:internal audit functions in Australia[J].Australian Accounting Review,2019,29(3):516-531.
[9] ROSE? A? M,ROSE? J? M,SANDERSON? K A,et al.When should audit firms introduce analyses of big data into the audit process?[J].Journal of Information Systems,2017(3):81-99.
[10] 張曉東,俞振華.建設項目跟蹤審計中設計審計的探討[J].鐵路工程造價管理,2009,24(2):5-8.
[11] 徐鶴田.國家治理視野下的大數據審計工作模式研究:基于SWOT分析[J].中國內部審計,2017(1):77-82.
[12] 劉星,牛艷芳,唐志豪.關于推進大數據審計工作的幾點思考[J].審計研究,2016(5):3-7.
[13] 牛艷芳,鄧雪梅,陳偉.數據科學工具之R語言在審計數據分析中的應用探索[J].中國注冊會計師,2016(9):93-97.
[14] 裴文華,成維一.大數據環境下財政審計數據分析研究[J].審計研究,2017(3):53-58.
[15] 秦榮生.大數據思維與技術在會計工作中的應用研究[J].會計與經濟研究,2015,29(5):3-10.
[16] 王雪榮,陳國華,申月紅.政府投資項目持續跟蹤審計研究評述[J].科技進步與對策,2011,28(13):90-94.
[17] 梁秀根,黃鄧秋,蔡赟,等.持續審計結合數據挖掘技術在內部審計中的應用[J].中國內部審計,2015(12):66-72.
[18] 鮑朔望.大數據環境下政府采購審計思路和技術方法探討[J].審計研究,2016(6):13-18.
[19] 李強,謝汶莉.大數據審計中的可視分析[J].中國內部審計,2016(2):79-86.
[20] 陳偉,SMIELIAUSKAS WALLY.大數據環境下的電子數據審計:機遇、挑戰與方法[J].計算機科學,2016, 43(1):8-13,34.
[21] 陳偉,QIU ROBIN.面向大型數據庫的審計數據采集方法[J].計算機應用,2008(8):2144-2146,2149.
[22] 林俊.企業內部控制信息化實施相關問題探討[J].企業改革與管理,2016(21):50-51.
[23] 劉國城,王會金.大數據審計平臺構建研究[J].審計研究,2017(6):36-41.
[24] 魯清仿,燕萬年,王開一,等.智慧審計構想與實踐探索:基于解構法律法規條款[J].審計研究,2018(1):28-34.
[25] 陳大峰,陳海勇.大數據環境下信息系統趨勢審計分析[J].財會月刊,2019(17):116-123.