999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

審計知識圖譜構建與推理在審計風險評估中的應用研究*

2023-03-21 02:22:08劉一鳴單鴻濤張高煜張勤濤袁先智
計算機時代 2023年3期
關鍵詞:規則模型

劉一鳴,單鴻濤,張高煜,張勤濤,袁先智

(1.上海工程技術大學,上海 201620;2.上海立信會計金融學院;3.上海機電股份有限公司(資產財務部);4.中山大學管理學院)

0 引言

傳統的人工審計模式存在著流程復雜、審計廣度有限等缺陷,面對大數據下信息量龐大、離散程度高的財務數據,就會產生處理數據耗時長、信息披露不全面等后果,難以支持實體經濟。因此,有效地運用大數據背景下帶來的海量數據,通過智能化的推理方法深度挖掘隱藏信息,成為了審計人員重點關注的問題。

本文基于自然語言處理和審計合規知識,提出并實現了審計知識圖譜構建與推理的新型體系框架輔助審計風險評估,并通過案例公司——WD 醫療,從業務層面具體分析知識圖譜構建與推理如何賦能審計風險評估程序。

本文的創新之處在于:目前審計領域尚未有學者提出普適性的審計語義網絡定義,也未有資料提及審計知識圖譜與規則推理的整個實現流程。本文在這幾方面都提出了創新的解決方案與算法。

1 國內外文獻綜述

在智能審計研究領域,隨著數據挖掘概念的提出與普及,有學者設計了3種數據挖掘方法,對于理論知識和方法實現詳盡描述的同時,嘗試將其運用于實際審計工作之中(McNamee D.and G,1998)[1]。有學者提出了持續審計智能服務(CAIaaS)的新架構,可以幫助審計師充分利用智能技術進行工作(Dai J,Vasarhelyi M A,2020)[2];另有學者提供了用于智能審計的智能檢測引擎,自動實現對合約等模塊的驗證(Chakinam S,Tadepalli B,Pallapolu K C,2021)[3]。

國內對智能審計的研究起步較晚,但已有諸多學者專家進行了理論研究與實踐。有學者針對知識審計提出研究內容與知識圖譜、文獻計量綜合分析的方法,強調借助其他領域的研究成果補充審計理論知識,完善整個審計體系(孟志華,關瑞娣,2017)[4]。還有學者在醫保審計方向進行相關研究與調查,開創性將醫保審計知識圖譜實戰投入到審計實務之中,解決客觀存有的實際問題,發揮了風險識別與監督作用(樊世昊,2018)[5];近兩年,有學者提出關于知識圖譜的未來發展方向主要包括時空多元關系抽取,動態知識的獲取與表示,融合先驗知識的實體鏈接等,基于圖數據的混合存儲,構建多模態知識圖譜(杭婷婷,2021)[6]。

研究評述:在大數據環境下,諸多學者已關注到大數據對于傳統審計帶來的各種變化及影響,也逐漸關注到知識圖譜,但對于將知識圖譜與審計的跨學科研究內容成果匱乏,真正搭建審計業務知識圖譜解析功能模塊的文獻較少。基于此,本文將從知識圖譜構建與推理出發,對其在審計風險評估中的應用進行具體闡述。

2 審計知識圖譜系統構建

審計知識圖譜構建包含九個模塊,模塊間關系及系統設計架構如圖1所示。

圖1 審計知識圖譜構建的模塊及架構

2.1 基于財務和非財務指標的審計語義網絡定義

要構建財務審計的語義網絡,首先要對審計實體、關系以及屬性進行定義。

2.1.1 審計實體

從原始數據集中,抽取出的獨立存在的實體,定義為審計實體,分為財務實體與非財務實體。其中,財務實體依據財政部頒發的《企業會計準則應用指南》中的會計科目名稱直接定義,例如庫存現金、銀行存款、應收票據等;對于非財務實體,由于標準化程度相對較低,所以需要根據搜集的各類企業信息進行歸納整理得出,數據來源包括企業的合同、產權證、憑證、票據、報關單等等,多為非結構化數據。

2.1.2 審計關系

審計實體間的語義關系定義為審計關系,包括數據間及數據與屬性間的關系。

財務與財務數據之間的關系:主要形式為會計科目間的上下級關系,可以直接從被審計單位提供的內部數據中“科目名稱”項作為實體和關系進行提取。

非財務與非財務數據之間的關系:即與經濟活動相關聯的非財務數據間的關系。包括公司的高管任免情況、關聯交易情況等等,這類信息通常是非結構化的。

財務與非財務數據之間的關系:即財務數據與實際經營活動中產生的信息之間的關系。有兩種挖掘方法:第一種根據被審計單位財務軟件中存儲的科目信息、憑證信息、摘要等抽取相關聯的內容;第二種是根據文本信息進行關系挖掘。

2.1.3 審計實體的屬性

審計實體的屬性即被審計單位數據的具體信息,譬如固定資產科目中具體一項資產的編號、原值、折舊情況、購置日期等,作為對于實體的屬性的補充。

2.2 數據獲取

數據獲取階段的流程如圖2所示。獲取原始數據后,整合并建立三個數據庫:被審計單位原始數據庫、審計詞典及法律法規庫。審計詞典庫包含了會計和審計術語,作為財經文本實體關系抽取分詞所需要的詞典備用;法律法規庫包含了上市公司遵循的會計和審計法律法規,作為審計規則庫構建所需要的事實備用。

圖2 數據獲取模塊及流程結構

2.3 數據預處理

由于大數據具有4V(即容量大、多樣性、價值低、速度快)的特性,難以直接作為審計數據,因此需要進行列清洗、轉化、標注等步驟,流程如圖3所示。

圖3 數據預處理模塊及流程結構

2.4 審計實體抽取

由于審計實體較長、專業詞匯復雜、文本定位困難等問題,給信息抽取帶來了極大難度。如圖4所示,本文的實體抽取通過Bert-BiLSTM-CRF模型實現。

圖4 Bert-BiLSTM-CRF模型

Bert-BiLSTM-CRF 模型共分為三層,第一層為Bert 層,Bert 預訓練模型運用了雙向Transformer 的編碼器,引入了自注意力機制以及位置編碼表示。

第二層為BiLSTM(長短時記憶神經網絡)層,在Bert 模型以及LSTM 基礎上以句子為單位建模,解決了只能獲取單向信息的問題,自動提取句子特征。

第三層為CRF(條件隨機場)層,BiLSTM 層僅考量了上下文信息,缺乏對于標注序列間依賴信息的考慮。CRF可以為標簽填寫一些額外的約束予以補充。

2.5 審計關系抽取

關系抽取面向非結構化文本數據,通過抽取實體間的語義關系來組成結構化知識,本模塊嘗試使用依存句法分析和PCNN 神經網絡實現,其在CNN 的基礎上,對卷積層的輸出進行優化,同時運用分段池化取代CNN 神經網絡模型中的最大值池化操作。PCNN的分段池化是指以句中定位的兩個實體的位置分為三個片段,對這三個獨立的片段分別進行池化操作,提煉句中具體精細的語義特征。

在為PCNN構建數據集時,實體基于2.4中的實體抽取結果,關系基于依存句法分析結合關系抽取的規則對句中實體成分和關系成分的抽取,包含句子、關系、實體1、實體1 在句中的位置、實體2、實體2 在句中的位置。

2.6 審計規則庫構建

該模塊運用一階謂詞邏輯表示法構建審計規則,格式為:if(如果)……,then(則)……。規則中的if 部分包含了一個或多個前置條件,作為決策樹的規則劃分,then部分表示如果滿足前置所有的前置條件(即各項指標),則根據前置條件可以推斷出存在某一風險事項(即審計解釋)。

2.7 審計實體關系統一及知識存儲

在審計報告中“WD 醫療”、“WD 醫療科技股份有限公司”、“本公司”等財經文本中抽取出來的實體代表著相同的含義,但卻通過簡稱、全稱、口語化稱呼抽取成為了三個不同的實體,因此需要進行統一。

知識圖譜構建基礎是由實體間的關系組合的“圖”結構,因此在完成實體關系統一后采用適合語義網絡的三元組資源描述框架表示并完成知識存儲。

2.8 知識圖譜生成及展示

基于導入Neo4j 圖數據庫中的實體關系三元組,構建與被審計單位相關的知識圖譜。如圖5 所示,以銀行存款科目圖譜為例,將銀行賬號作為節點,屬性值包括開戶銀行、賬戶性質、幣種、期初原幣金額、期初本位幣金額、本期增加額、本期減少額、期末原幣金額、匯率、期末本位幣金額等10余項信息。

圖5 WD醫療銀行存款科目信息圖譜

2.9 知識圖譜推理

基于構建的知識圖譜和審計規則庫,知識圖譜推理借助決策樹和隨機森林模型實現。由于審計決策樹只能推理評判某一組維度的數據,而對于審計業務而言是由多維度的數據組成的,因此還需要通過隨機森林模型進行全局補充。

3 知識圖譜構建與推理應用分析

本文提出的知識圖譜構建與推理開源代碼在https://github.com/LaffitteZ。

基于第2 節圖譜構建方法,對WD 醫療知識圖譜構建與推理簡要說明:

⑴研讀審計法律法規及規范性文件,結合專家經驗構建審計規則庫;

⑵將采集的數據中結構化部分直接轉換成三元組格式,非結構化數據則通過語句切分和序列標注,使用Bert-BiLSTM-CRF 模型進行實體抽取,使用依存句法分析+PCNN 模型進行關系抽取后轉存,構建WD醫療知識圖譜;

⑶根據企業規章制度以及會計審計準則,列示重點審計項目;

⑷以Neo4j中字段要求將審計規則進行列示;

⑸與財務負責人進行交流,了解字段存在位置,搞清對應名稱關系;

⑹根據審計規則和交流結果設計校驗邏輯,即圖譜推理的過程,確定哪些情況屬于會提示存在風險點的異常情況;

⑺對數據量進行把控,因為整個系統數據量巨大,故測試階段首先以某一審計項目中的一項財務科目為例運行,以保證不會影響審計進程;

⑻從知識圖譜中提取數據,從審計規則庫中提取規則,進行圖譜推理;

⑼對推理中發現的審計風險點在知識圖譜中加以標注并提取;

⑽對于自動化識別評估的風險項追加執行審計程序予以核實。對于可以確認的項目修改后進行再評估,對于無法確認的則判定為風險事項。

以貨幣資金審計為例,實務中從法律法規、權限管理、資產安全、現金盤點、賬務處理、銀行賬戶余額及匯兌、對賬單及余額調節表核對、開戶銀行查驗、銀行存款函證、發生額分析以及雙向核對等10個風險點入手,基于知識圖譜做智能推理。以法律法規項目為例,如果企業受到行政處罰或者刑事處罰,且處罰原因是貨幣資金造假,則說明存在違反法律法規風險,決策樹如圖6所示。

圖6 審計風險點推理決策樹

基于圖譜推理貨幣資金審計的潛在風險點,綜合判斷10個決策樹并進行融合,最終得出貨幣資金審計存在審計風險的評估結論。實現流程如圖7所示。

圖7 貨幣資金審計的隨機森林模型

函證程序發函時發現,存在一項地址不一致的情況,發函地址為財神廣場6 層C14 室,工商查詢為金磊商廈6 層C14 室,是存在風險的。以地址核對舉例來看,通過賬戶屬性推理得出風險,并標注的結果如圖8所示。

圖8 地址核對風險標識

4 結束語

本文提出了一套基于知識圖譜構建與推理的智能審計方法,以WD 醫療科技股份有限公司為案例公司進行應用研究。采集異構數據并進行預處理后,在實體抽取階段運用BERT-BiLSTM-CRF 模型對審計財經文本進行實體抽取,結果準確率為84.94%,在關系抽取階段通過依存句法分析和PCNN神經網絡模型訓練結果準確率為84.27%。通過知識統一和存儲將抽取結果導入Neo4j 后構建審計知識圖譜,結合設計的審計規則庫,運用了決策樹與隨機森林模型將規則推理融入審計風險評估程序,輔助審計人員更有針對性地聚焦潛在風險的同時,從理論和實踐方面為智能審計工作的開展提供參考與借鑒。

猜你喜歡
規則模型
一半模型
撐竿跳規則的制定
數獨的規則和演變
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規則對我國的啟示
3D打印中的模型分割與打包
搜索新規則
主站蜘蛛池模板: 亚洲成人动漫在线观看| 日韩第一页在线| 伊人色在线视频| 国产午夜小视频| a亚洲视频| 99在线观看国产| 欧美一级片在线| 亚洲不卡影院| 精品自窥自偷在线看| 国产jizzjizz视频| 亚洲免费成人网| 黄色a一级视频| 久久99这里精品8国产| 香蕉精品在线| 国产精品手机在线观看你懂的 | 欧美国产综合视频| 九九热免费在线视频| 亚洲成A人V欧美综合| 丁香亚洲综合五月天婷婷| 国产日韩欧美成人| 国产福利不卡视频| 性欧美在线| 欧美精品成人一区二区视频一| 一级做a爰片久久免费| 欧美日在线观看| 专干老肥熟女视频网站| 色欲色欲久久综合网| 激情影院内射美女| 制服丝袜 91视频| 亚洲欧洲日产无码AV| 午夜国产精品视频| 午夜不卡福利| 久久成人国产精品免费软件| 99ri国产在线| 国产偷倩视频| 日韩欧美网址| 18禁黄无遮挡网站| 亚洲天堂网2014| 午夜精品久久久久久久无码软件| 久青草网站| 国产一级二级三级毛片| 久久精品中文无码资源站| 国产精品无码在线看| 欧美中文字幕在线视频| 在线视频精品一区| 国产成人福利在线| 制服丝袜亚洲| lhav亚洲精品| 亚洲精品777| 婷婷综合色| 高清精品美女在线播放| 国产极品美女在线播放| 黄色免费在线网址| 91av成人日本不卡三区| 欧美日韩国产系列在线观看| 综合色区亚洲熟妇在线| 91视频免费观看网站| 2021国产精品自拍| 97久久精品人人| 久久黄色影院| 国产精品 欧美激情 在线播放| 国产精品尤物在线| 九九热精品在线视频| 欧美69视频在线| 亚洲日韩国产精品无码专区| 欧美综合在线观看| 国产精品无码影视久久久久久久| 香蕉视频在线观看www| 亚洲男人天堂网址| 日韩精品欧美国产在线| 亚洲成年人网| 欧美日韩国产在线人| 亚洲欧美成aⅴ人在线观看| 97久久免费视频| 九九九精品视频| 亚洲国产天堂久久综合| 亚洲第一色网站| 亚洲乱强伦| 国产色伊人| 日韩第一页在线| 国产69精品久久久久孕妇大杂乱 | 日本精品视频一区二区|