999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大語言模型在審計判斷中的應(yīng)用研究

2025-03-12 00:00:00黃佳佳朱浩然徐超詹天明
財會月刊·下半月 2025年3期

【摘要】在審計業(yè)務(wù)中,面向?qū)徲嫻ぷ鞯赘宓膶徲嬇袛嗍钱?dāng)前審計工作面臨的共同難題。面對海量繁雜的法規(guī)條款,審計判斷存在審計定性不準(zhǔn)確、定性依據(jù)引用存在困難、依法審計定性的規(guī)則悖反、處理處罰中自由裁量權(quán)使用不當(dāng)?shù)入y題,確保審計判斷的準(zhǔn)確性和客觀性是一個巨大的挑戰(zhàn)。大語言模型通過自然語言處理和深度學(xué)習(xí)技術(shù)深入學(xué)習(xí)領(lǐng)域知識及其潛在關(guān)系,為審計判斷提供了新的解決方案。本文以審計定性與法規(guī)推薦為目標(biāo),微調(diào)大語言模型,使其能夠服務(wù)于審計概念理解、審計定性、審計法規(guī)推薦等任務(wù)。實驗結(jié)果表明,該大語言模型相比通用大語言模型能夠更加恰當(dāng)?shù)厣蓡栴}總結(jié)短語、推薦定性依據(jù)和處罰依據(jù),為提高審計工作質(zhì)量和效率提供了新的實現(xiàn)途徑。

【關(guān)鍵詞】審計判斷;定性依據(jù);智能審計;大語言模型

【中圖分類號】F239.1""""" 【文獻標(biāo)識碼】A""""" 【文章編號】1004-0994(2025)06-0021-8

一、引言

2024年3月5日,習(xí)近平總書記在參加十四屆全國人大二次會議江蘇代表團審議時強調(diào),要牢牢把握高質(zhì)量發(fā)展這個首要任務(wù),因地制宜發(fā)展新質(zhì)生產(chǎn)力。新質(zhì)生產(chǎn)力作為新時代經(jīng)濟發(fā)展的核心動力,在數(shù)字經(jīng)濟背景下對審計工作提出了更高要求,大力推進數(shù)智化轉(zhuǎn)型已成為審計工作實現(xiàn)高質(zhì)量發(fā)展的迫切需求。近年來,大數(shù)據(jù)審計、智能審計等新型審計技術(shù)應(yīng)運而生,推動了審計領(lǐng)域的技術(shù)創(chuàng)新,為審計人員提供了更加高效、可靠的工作手段和方法,也為審計技術(shù)數(shù)智化轉(zhuǎn)型發(fā)展提供了新的路徑。

在審計業(yè)務(wù)中,審計判斷是指審計人員為了實現(xiàn)審計目標(biāo),依據(jù)有關(guān)標(biāo)準(zhǔn),在審計實踐和業(yè)務(wù)經(jīng)驗的基礎(chǔ)上,通過一系列思維過程,對客觀審計對象和主觀審計行為所做出的某種認(rèn)定、評價與決斷(于凌云和吳建新,2012)。審計判斷是審計活動的核心組成部分,是確保審計目標(biāo)實現(xiàn)的關(guān)鍵手段,其直接影響著審計的質(zhì)量和效果。目前,審計人員在審計判斷過程中面臨著一些共同難題: 一是難以用準(zhǔn)確且合理的方式對審計問題進行總結(jié); 二是法律法規(guī)的內(nèi)容體系龐大且不斷更新迭代,合理地運用法律法規(guī)進行審計判斷變得尤為困難。由此可見,審計判斷是一項知識密集型活動,需要審計人員熟知審計領(lǐng)域常見的問題表現(xiàn)形式及與之相關(guān)的法規(guī)制度,方能高質(zhì)量、高效率地開展這項活動。

在人工智能浪潮中,大語言模型(Large Language Models,LLMs,簡稱“大模型”)憑借卓越的自然語言處理能力,正迅速成為人工智能研究與應(yīng)用的新焦點,并引領(lǐng)自然語言處理乃至人工智能領(lǐng)域研究范式的轉(zhuǎn)變(車萬翔等,2023)。大模型技術(shù)是使用大量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型,其在需要語言理解與生成、專業(yè)知識模擬與學(xué)習(xí)等信息密集、需要專業(yè)領(lǐng)域知識的應(yīng)用場景中已展示出較強的應(yīng)用潛力。因此,研究基于大模型的智能化審計判斷技術(shù)具有深遠(yuǎn)的意義,可為推動人工智能技術(shù)在審計領(lǐng)域的實踐應(yīng)用提供新的視角。

本文以審計定性與法規(guī)推薦為目標(biāo),借助人工智能領(lǐng)域的大模型微調(diào)技術(shù),使其服務(wù)于審計概念理解、審計定性、審計法規(guī)推薦等任務(wù)。本文在應(yīng)用層面上,為提高審計工作質(zhì)量和效率提供了新的實現(xiàn)途徑; 在研究層面上,為人工智能技術(shù)賦能審計行業(yè)提供了堅實的基礎(chǔ)知識和實驗支持。

二、文獻綜述

(一)審計判斷相關(guān)研究

目前,學(xué)者們認(rèn)為審計判斷中主要存在審計定性不準(zhǔn)確、定性依據(jù)引用存在困難、依法審計定性的規(guī)則悖反、處理處罰中自由裁量權(quán)使用不當(dāng)四個方面的難題,并從不同角度展開了研究。張樂玲(2018)針對當(dāng)前審計定性中存在的主要問題,提出要規(guī)范審計定性的要點,即準(zhǔn)確確定違規(guī)事項性質(zhì)、恰當(dāng)引用定性依據(jù)、規(guī)范審計定性用語,并建議審計人員加強相關(guān)法律法規(guī)的學(xué)習(xí)和內(nèi)外溝通,同時審計證據(jù)要適當(dāng)充分。班鳳欣(2010)針對規(guī)范審計定性及處理處罰應(yīng)當(dāng)把握或注意的方面,提出審計人員在審計工作中應(yīng)當(dāng)以事實為依據(jù)、以法律為準(zhǔn)繩,準(zhǔn)確運用法規(guī),規(guī)范定性及處理處罰在報告中的表述模式等。鄭石橋和朱霽(2017)分析了依法審計定性可能出現(xiàn)的兩種規(guī)則悖反情形,一是合法但不合理,二是合理但不合法,并提出了救助機制。徐波和廖晨琪(2022)圍繞審計自由裁量權(quán)的濫用行為,討論了自由裁量權(quán)與審計質(zhì)量之間的辯證關(guān)系,分析了規(guī)范審計自由裁量權(quán)制度體系的著力點,并且提出了一些應(yīng)對措施,以期為構(gòu)建完善的審計自由裁量權(quán)制度體系提供參考。

(二)智能審計相關(guān)研究

人工智能技術(shù)在過去幾年取得了令人矚目的發(fā)展,不斷推動著各行各業(yè)的變革與進步。大模型是人工智能領(lǐng)域的一個重要分支,具有廣泛的應(yīng)用場景,能夠為不同行業(yè)賦能,助力行業(yè)發(fā)展。在法律推理領(lǐng)域,大模型具備案例分析、法律問答與審判輔助等實踐能力。其通過自動化處理大量法律文書和案例,幫助法律從業(yè)者更快地找到相關(guān)信息,更準(zhǔn)確地分析案件,從而提高工作效率和服務(wù)質(zhì)量。部分工作的自動化處理能夠減少從業(yè)人員的工作量,從而降低法律服務(wù)成本(張舟和劉文清,2024)。在金融領(lǐng)域,大模型通過先進的自然語言處理技術(shù)和機器學(xué)習(xí)技術(shù),為金融行業(yè)帶來多樣化的能力,從對股票價格的預(yù)測到高級金融分析,這些趨勢正在不斷推動金融科技的發(fā)展(Xie等,2023)。同樣,大模型也可以為審計行業(yè)提供創(chuàng)新性的解決方案(Huang等,2023)。

在智能審計理論研究探索方面,學(xué)者們闡述了智慧審計的概念,并提出了一系列智能化解決方案。在智能審計理論發(fā)展方面,楊道廣等(2022)基于審計工作的系統(tǒng)性與復(fù)雜性以及數(shù)智技術(shù)應(yīng)用的廣泛性與交互性,提出了能夠概括數(shù)智技術(shù)應(yīng)用于審計的本質(zhì)邏輯與核心思維的新概念——智慧審計。在此基礎(chǔ)上,黃佳佳等(2023)提出了面向智慧審計的思維變革,并探討了如何運用大模型、知識圖譜、深度學(xué)習(xí)等人工智能技術(shù)構(gòu)建審計平臺。陳雪嵩(2024)探討了大模型在企業(yè)內(nèi)部審計中的具體應(yīng)用以及其未來發(fā)展前景。在智能審計實踐方面,程平等(2023)構(gòu)建了基于 ChatGPT 的內(nèi)部審計框架模型,為生成式人工智能技術(shù)在企業(yè)內(nèi)部審計領(lǐng)域的智能化應(yīng)用提供了參考和借鑒。

(三)文獻評述

綜上,學(xué)者們針對審計判斷中存在的挑戰(zhàn),主要從人員培訓(xùn)和機制管理方面提出了相應(yīng)措施,這對審計人員的專業(yè)能力和工作態(tài)度提出了更高的要求,其具體實施較為困難。而在審計技術(shù)方法方面,盡管近年來有學(xué)者探討了結(jié)合人工智能技術(shù)特別是大模型技術(shù)的智慧審計的發(fā)展與應(yīng)用,但鮮有研究深入探索人工智能技術(shù)與審計領(lǐng)域?qū)崉?wù)的結(jié)合。本文將審計判斷抽象為一系列大模型學(xué)習(xí)任務(wù),構(gòu)建一系列指令數(shù)據(jù)集,并基于指令數(shù)據(jù)集微調(diào)大模型,同時運用多個指標(biāo)評估大模型的生成結(jié)果,為人工智能技術(shù)賦能審計行業(yè)提供可靠的實驗方案和結(jié)果驗證。

三、當(dāng)前審計判斷中存在的難題

審計判斷是指對審計工作底稿中的潛在問題、異常情況或重要事項進行性質(zhì)評估,包括對財務(wù)報表、業(yè)務(wù)運作等方面的重要問題進行分析和判斷,對照相關(guān)定性依據(jù)確定問題的性質(zhì),根據(jù)審計定性的結(jié)果參照相應(yīng)的法規(guī)體系進行處理處罰。審計判斷的流程如圖1所示。

對于輸入的審計工作底稿,審計人員首先需要進行問題總結(jié)或問題分類; 其次,針對該問題檢索恰當(dāng)?shù)钠髽I(yè)內(nèi)部或國家級制度文件、法律法規(guī)作為定性依據(jù); 最后,若對該問題的定性參考的是某條法律條款(如《稅收征收管理法》第六十三條),則可能存在對應(yīng)的罰則條款作為處罰依據(jù)(如《稅收征收管理法》第六十三條)。若是將該流程智能化,則期望智能系統(tǒng)能夠自動輸出審計問題的總結(jié)短語、相關(guān)定性依據(jù)及處理處罰依據(jù)。

由此可見,審計判斷是一項復(fù)雜且具有一定主觀性的評估活動。審計人員在實踐中進行審計判斷時面臨著一些挑戰(zhàn),主要包括審計定性不準(zhǔn)確、定性依據(jù)引用存在困難、依法審計定性的規(guī)則悖反及處理處罰中自由裁量權(quán)的使用不當(dāng)?shù)取_@些挑戰(zhàn)的存在不僅影響了審計判斷的質(zhì)量和效率,還可能對審計結(jié)果的公正性和透明度造成影響。

(一)審計定性不準(zhǔn)確

由于定性標(biāo)準(zhǔn)尺度不一,不同人員對相同問題的定性可能差別較大,同一人員對不同問題的定性沒有統(tǒng)一標(biāo)準(zhǔn),導(dǎo)致處理處罰上大相徑庭,有的甚至歪曲定性(班鳳欣,2010); 審計人員有時只看表面現(xiàn)象,沒有觸及事項本質(zhì)(張樂玲,2018),這樣的定性結(jié)果無法清晰準(zhǔn)確地表述問題,也有可能與真實情況相偏離。例如,針對圖1審計工作底稿中“某個商業(yè)公司的業(yè)主為了逃避納稅……”的問題,審計人員可能沒有正確定性為“偷逃稅款”,而是定性為其他問題,比如“不規(guī)范的賬務(wù)處理”。對于定性不準(zhǔn)確的問題,一般要求審計人員收集適當(dāng)充分的審計證據(jù)(班鳳欣,2010)、以審計證據(jù)所表現(xiàn)的事實為依據(jù)進行定性、規(guī)范定性在報告中的表述模式(張樂玲,2018)。這對審計人員的工作態(tài)度和工作質(zhì)量提出了更高的要求。

(二)定性依據(jù)引用存在困難

由于非結(jié)構(gòu)化的法規(guī)文件種類繁多、內(nèi)容繁瑣,審計人員在對照問題尋找相應(yīng)審計依據(jù)或處罰依據(jù)的過程中,需要逐行逐段地閱讀大量文件,時間成本較高。并且,審計人員還有可能會引用廢止或失效的規(guī)定(張樂玲,2018)。此外,問題的定性依據(jù)不唯一。例如,針對“少(多)計收入(或者隱瞞、虛列收入)”的問題,《會計法》第二十四條及《企業(yè)會計準(zhǔn)則第14號——收入》第二章均作出了相應(yīng)的規(guī)定。對于定性依據(jù)引用存在的問題,一般要求審計人員加強相關(guān)法律法規(guī)的學(xué)習(xí),關(guān)注各種法律法規(guī)的頒布和更新,拓展自身知識面(班鳳欣,2010;張樂玲,2018)。

(三)依法審計定性的規(guī)則悖反

嚴(yán)格應(yīng)用法律法規(guī)進行問題定性可能會出現(xiàn)兩類規(guī)則悖反的情形: 一是合法但不合理,二是合理但不合法(鄭石橋和朱霽,2017)。例如,某員工利用公司寬泛的報銷政策,以“提高家庭辦公環(huán)境水平”為由購買家居裝飾品進行報銷。雖然合法,但從商業(yè)道德和資源管理的角度來看,這種行為屬于假公濟私,違背了報銷本意和公司的資源管理原則。有學(xué)者提出了規(guī)則悖反的救助機制,即: 對于合法但不合理的情形,實行目的性擴張(鄭石橋和朱霽,2017),在維護合法性的前提下,采用法律漏洞補充方法進行補充,以促進其合理性水平的提升; 對于合理但不合法的情形,實施目的性限縮(鄭石橋和朱霽,2017),在確保合理性的基礎(chǔ)上,通過合法的方式對規(guī)則進行限制,以達到合法性目的。但這要求審計人員在法學(xué)知識、倫理責(zé)任和專業(yè)技能方面具備極高的素養(yǎng)。

(四)處理處罰中自由裁量權(quán)使用不當(dāng)

由于審計系統(tǒng)對于自由裁量權(quán)的使用沒有明細(xì)的規(guī)范(班鳳欣,2010),審計人員一般根據(jù)自己的經(jīng)驗進行處罰,如果對自由裁量權(quán)沒有正確的認(rèn)知,就不能真正發(fā)揮自由裁量的作用,從而導(dǎo)致自由裁量權(quán)的濫用。例如,《稅收征收管理法》第六十三條規(guī)定“對納稅人偷稅的,由稅務(wù)機關(guān)追繳其不繳或者少繳的稅款、滯納金,并處不繳或者少繳的稅款百分之五十以上五倍以下的罰款”。稅務(wù)機關(guān)在確定處罰金額時,對納稅人處不繳或者少繳的稅款百分之五十或者五倍的罰款均符合規(guī)定,但這兩種罰款金額存在一定差距。有專家提出循序漸進地構(gòu)建審計自由裁量權(quán)體系制度(徐波和廖晨琪,2022),但這會進一步增加制度的復(fù)雜性,也需要耗費較多的時間和資源。

四、大模型在審計判斷中的應(yīng)用設(shè)計

(一)大模型技術(shù)概述

大模型的發(fā)展可以概括為三個階段: 基礎(chǔ)模型階段(2018~2021年)、能力探索階段(2019~2022年)和突破發(fā)展階段(2022年至今)(Zhao等,2023)。2020年,由OpenAI發(fā)布的包含千億參數(shù)的生成式大模型GPT-3.0開啟了大模型時代。2022年11月30日,OpenAI發(fā)布了對話式大模型 (Chat Generative Pre-trained Transformer,ChatGPT)。該模型允許用戶使用自然語言對話形式進行交互,可實現(xiàn)包括自動問答、文本分類、自動文摘、聊天對話等各類自然語言理解和自然語言生成任務(wù)。這也引發(fā)了學(xué)術(shù)界和工業(yè)界對大模型的研究。

與傳統(tǒng)人工智能技術(shù)相比,大模型表現(xiàn)出如下優(yōu)越性:

1. 大模型具有較為豐富的世界知識。以BERT(Devlin等,2018)為代表的預(yù)訓(xùn)練語言模型由于模型參數(shù)規(guī)模與數(shù)據(jù)規(guī)模都相對較小,無法充分建模以及利用世界知識信息,需要以微調(diào)為主要手段來解決下游任務(wù)。而大模型在經(jīng)過超大規(guī)模的數(shù)據(jù)預(yù)訓(xùn)練后可以學(xué)習(xí)到較為豐富的世界知識(Bubeck等,2023)。

2. 大模型具有較強的通用任務(wù)解決能力。大模型主要通過預(yù)測下一個詞元的預(yù)訓(xùn)練任務(wù)進行學(xué)習(xí),雖然并沒有針對特定的下游任務(wù)進行優(yōu)化,但能夠建立遠(yuǎn)強于傳統(tǒng)模型的通用任務(wù)求解能力,這也深刻影響了很多研究領(lǐng)域的科研范式。例如,自然語言處理領(lǐng)域的傳統(tǒng)任務(wù)(如摘要、翻譯等)都可以采用基于大模型的提示學(xué)習(xí)方法進行解釋,而且能夠獲得較好的任務(wù)效果,早期任務(wù)特定的解決方案已經(jīng)被逐步替代。

3. 大模型具有較強的復(fù)雜任務(wù)推理能力。除了具有通用性,大模型在復(fù)雜任務(wù)中還展現(xiàn)出較強的推理能力。例如,大模型能夠回答知識關(guān)系復(fù)雜的推理問題,還可以解決涉及復(fù)雜推理過程的數(shù)學(xué)題目。在這些任務(wù)中,傳統(tǒng)方法的性能相對較差,而大模型在經(jīng)過大規(guī)模文本數(shù)據(jù)預(yù)訓(xùn)練后,能夠展現(xiàn)出比傳統(tǒng)模型更強的綜合推理能力。

4. 大模型具有較強的人類指令遵循能力。大模型建立了自然語言形式的統(tǒng)一任務(wù)解決模式,即任務(wù)輸入與執(zhí)行結(jié)果均通過自然語言進行表達。通過預(yù)訓(xùn)練與指令微調(diào)兩個階段的學(xué)習(xí),大模型具備了較好的人類指令遵循能力,能夠根據(jù)自然語言描述下達的任務(wù)指令直接給出結(jié)果,這對于打造以人為中心的應(yīng)用服務(wù)(如智能音箱、信息助手等)具有重要意義。除了以上主要的能力,當(dāng)前大模型還展現(xiàn)出長程對話的語義一致性、較好的人類對齊能力、對于新任務(wù)的快速適配等重要優(yōu)勢。

隨著大模型技術(shù)的迅猛發(fā)展,人工智能相關(guān)研究領(lǐng)域正發(fā)生著重要的技術(shù)變革,同時也對產(chǎn)業(yè)應(yīng)用帶來變革性影響,催生出基于大模型的應(yīng)用生態(tài)系統(tǒng),更多以大模型為基礎(chǔ)技術(shù)架構(gòu)的科技應(yīng)用產(chǎn)品逐漸被開發(fā)出來,進而簡化了原來復(fù)雜的工作處理流程,提高了工作的質(zhì)量和效率。

(二)大模型在審計判斷中的智能推薦框架構(gòu)建

在法律領(lǐng)域有兩種經(jīng)典的推理路徑: 一是規(guī)則推理路徑; 二是案例推理路徑(張舟和劉文清,2024)。其中,規(guī)則推理路徑是基于現(xiàn)有的法律法規(guī)通過邏輯推理分析案件,案例推理路徑是依據(jù)先前的判例和裁決來決定新的案件。這兩種路徑在法律推薦中各有優(yōu)勢和限制,再考慮到人為判斷的影響,想要得出一個公正合理的推理結(jié)果具有一定的挑戰(zhàn)性。在人工智能背景下,大模型可以更好地將兩種推理路徑結(jié)合在一起,以事實為依據(jù)、以法律為準(zhǔn)繩,通過審計法規(guī)并結(jié)合案例進行分析,從而達到審計判斷更恰當(dāng)?shù)男Ч?/p>

本文提出的審計依據(jù)推薦思路是從審計工作底稿和審計依據(jù)同時出發(fā),一方面根據(jù)審計工作底稿進行問題總結(jié),另一方面對審計依據(jù)所描述的問題進行總結(jié),基于相似的短語描述實現(xiàn)審計問題與審計依據(jù)之間的匹配,相似度越高,則該審計依據(jù)被推薦的概率越大,進而輔助審計人員進行審計判斷。通過對審計判斷領(lǐng)域知識的學(xué)習(xí),大模型可以識別出審計工作底稿中的問題,并進行相關(guān)依據(jù)的推薦生成。審計判斷大模型的能力展示如圖2所示。

在法規(guī)推薦方面,審計判斷大模型經(jīng)過微調(diào)步驟掌握了全面、嶄新的法律法規(guī)體系,自動化的法規(guī)推薦過程大大簡化了審計人員的工作流程,使其能夠更好地應(yīng)對復(fù)雜的法律環(huán)境和審計挑戰(zhàn),為審計人員提供了省時省力的解決方案,提高了工作效率,保障了審計工作的準(zhǔn)確性和合規(guī)性。

在審計判斷方面,審計判斷大模型不僅能根據(jù)審計問題簡單地進行法規(guī)推薦,還會綜合考慮法律法規(guī)、管理制度、績效等多方面因素,并從倫理、道德規(guī)范、道德原則等多個角度進行全面評估。對于審計中出現(xiàn)的規(guī)則悖反情況,審計判斷大模型會對其合理性和合法性兩個指標(biāo)同時進行分析,給出相關(guān)的定性依據(jù)以及判斷標(biāo)準(zhǔn)。

在處理處罰方面,審計判斷大模型在識別潛在的違規(guī)行為和異常時,能夠把握一些關(guān)鍵細(xì)節(jié),例如審計問題“挪用資金”的具體情況可能包括金額大小、挪用時間長短等。在判斷違規(guī)行為的輕重時,審計判斷大模型會基于這些因素,不受個人情感、偏見或壓力的影響去評估問題的嚴(yán)重性,提供客觀、基于證據(jù)的處理處罰意見,這確保了處理處罰的一致性,減少了主觀因素對自由裁量權(quán)使用所帶來的影響。

(三)大模型在審計判斷中的任務(wù)構(gòu)成

本文基于審計判斷的實際應(yīng)用場景,結(jié)合大模型微調(diào)學(xué)習(xí)的本質(zhì)特征,抽象出各類型大模型微調(diào)任務(wù),包括審計概念理解、審計定性和審計法規(guī)推薦。

1. 審計概念理解。該任務(wù)側(cè)重于讓模型理解審計的基礎(chǔ)概念、工作流程等,包括: ①審計概念問答。這類問答的內(nèi)容豐富、類型眾多,涉及審計基礎(chǔ)概念、審計工作流程等。②審計知識三元組。該任務(wù)基于黃佳佳等(2022)發(fā)表的《大數(shù)據(jù)驅(qū)動的審計知識庫建設(shè)與應(yīng)用》一文,從中抽取不同類型的審計知識圖譜三元組(實體1,關(guān)系,實體2)構(gòu)建微調(diào)數(shù)據(jù)集,使模型能夠更好地理解實體之間的關(guān)系,如表1所示。

2. 審計定性。該任務(wù)側(cè)重于從審計案例或法律法規(guī)中識別審計問題,并對問題進行總結(jié)和分類。

(1)審計問題總結(jié),即對審計案例描述進行深入分析并用一段或一句話總結(jié)其中存在的審計問題。

(2)審計問題分類,即判斷審計問題屬于哪類審計項目,該任務(wù)涉及的項目類型及若干相關(guān)案例如表2所示。

(3)審計問題表現(xiàn),即對文中所涉及的審計問題進行分析,回答該審計問題有哪些表現(xiàn)形式,例如“私設(shè)小金庫”的表現(xiàn)形式為“在本單位財務(wù)會計部門賬外或未納入預(yù)算管理私存私放資金”。

(4)審計類型判斷,即根據(jù)審計案例描述進行分析,判斷該審計案例屬于哪個類型的審計項目。

3. 審計法規(guī)推薦。該任務(wù)側(cè)重于根據(jù)審計問題表現(xiàn)進行審計定性及處理處罰的法規(guī)推薦。

(1)審計依據(jù)生成,即對文中所描述的審計問題、該問題的表現(xiàn)形式或者審計案例描述進行分析,回答該審計問題可以依據(jù)哪些法律法規(guī)進行定性或處罰,如表3所示。

(2)審計法規(guī)分類,即判斷法律法規(guī)名稱(如《增值稅一般納稅人登記管理辦法》)屬于哪個領(lǐng)域。本文構(gòu)建的法規(guī)類別包括金融、會計、財經(jīng)等10個國家審計涉及的常見類別。

(3)審計法規(guī)問答,即以內(nèi)部審計指南、會計法規(guī)、企業(yè)管理條例等法律法規(guī)的內(nèi)容為基礎(chǔ),通過GPT-4.0(Achiam等,2023)構(gòu)建問答對,并篩選出高質(zhì)量的問答對構(gòu)成該指令數(shù)據(jù)。

五、大模型在審計判斷中的應(yīng)用: 實驗研究與性能評估

(一)數(shù)據(jù)集收集與整理

基于抽象的審計判斷任務(wù),進一步為每個任務(wù)構(gòu)造審計判斷大模型指令調(diào)優(yōu)數(shù)據(jù)集。其中,一些優(yōu)質(zhì)的審計案例來源于各類型審計實務(wù)與經(jīng)典案例書籍,審計定性依據(jù)及處罰依據(jù)來源于《中央部門預(yù)算執(zhí)行審計常用定性表述及適用法規(guī)向?qū)В?023年版)》系列書籍。此外,還運用爬蟲技術(shù)從互聯(lián)網(wǎng)上獲取大量法律法規(guī)條款內(nèi)容,涉及國家級、企業(yè)級等層級。在此基礎(chǔ)上,將收集到的數(shù)據(jù)整理成結(jié)構(gòu)化數(shù)據(jù)。

(二)基于大規(guī)模微調(diào)任務(wù)構(gòu)建指令集

根據(jù)任務(wù)需求構(gòu)造相關(guān)的指令微調(diào)數(shù)據(jù)集,其中,針對法律法規(guī)類原始文本,本文使用GPT-4.0生成關(guān)于法律法規(guī)的提問和相應(yīng)答案(Wang 等,2023)。為此,首先運用網(wǎng)絡(luò)爬蟲獲得大規(guī)模法律法規(guī)文本,并將其轉(zhuǎn)換為結(jié)構(gòu)化三元組形式(法規(guī)名,條款號,條款內(nèi)容); 其次,針對每條輸入的法規(guī)三元組構(gòu)建提示詞并調(diào)用GPT-4.0生成問答對,在此過程中,不斷優(yōu)化提示詞的寫法以提高GPT-4.0生成問答對的質(zhì)量; 最后,運用ROUGE-L、BERT等相似度指標(biāo)評估生成的問答對與原始三元組之間的相似性,并過濾掉與原始法規(guī)內(nèi)容相似度較低的問答對。通過上述步驟,最終可得到一份高質(zhì)量的審計法規(guī)問答的指令數(shù)據(jù)。其中,提示詞寫法如圖3所示。

針對其他各類型任務(wù),通過人工構(gòu)建prompt方式將原始語料轉(zhuǎn)換為指令數(shù)據(jù),指令數(shù)據(jù)示例如圖4所示。

“id”字段表示當(dāng)前任務(wù)類型與數(shù)據(jù)序號; “conversations”字段表示訓(xùn)練內(nèi)容,包含問題和對應(yīng)的答案。在這一對話中,用戶發(fā)出了一條消息“請問什么是審計”,然后模型回答“審計是指由專設(shè)機關(guān)依照法律對國家各級政府及金融機構(gòu)、企業(yè)事業(yè)組織的重大項目和財務(wù)收支進行事前和事后的審查的獨立性經(jīng)濟監(jiān)督活動”。本文參考上述格式構(gòu)建審計判斷大模型微調(diào)與評估的指令集,并依據(jù)7∶2∶1的比例劃分訓(xùn)練集、驗證集、測試集。統(tǒng)計數(shù)據(jù)量如表4所示。

(三)大模型選擇和微調(diào)

在大模型選擇方面,開源的基礎(chǔ)語言模型Qwen系列使用了多達3萬億個不同文本和代碼的令牌,涵蓋了廣泛的領(lǐng)域。這些模型在眾多下游任務(wù)中一直表現(xiàn)出卓越的性能,即使與更大參數(shù)規(guī)模的模型相比也是如此。開源的7B參數(shù)基礎(chǔ)預(yù)訓(xùn)練模型Qwen-7B-Chat旨在為開發(fā)者和應(yīng)用程序提供更全面、更強大的大模型(Bai 等,2023)。

此外,本文在前期工作中通過構(gòu)建審計領(lǐng)域的評測指令數(shù)據(jù)集評估了國內(nèi)外主流開源大模型在審計指令數(shù)據(jù)集上的性能表現(xiàn),包括Llama-2系列、ChatGLM3-6B、Baichuan-7B、Qwen-7B、GPT-3.5和GPT-4.0。從所有任務(wù)的綜合評價結(jié)果來看,不同模型在不同任務(wù)上的表現(xiàn)各有千秋,但Qwen-7B針對審計領(lǐng)域的中文命名實體識別和關(guān)系分類表現(xiàn)最好,適用于審計問題定性的應(yīng)用場景,如從審計工作底稿或法律法規(guī)中抽取審計問題短語。因此,本文最終選擇開源的基礎(chǔ)語言模型Qwen-7B-Chat作為微調(diào)模型。

在大模型微調(diào)方面,微調(diào)數(shù)據(jù)集由表4中的訓(xùn)練集和驗證集組成,本文基于AdamW優(yōu)化器(Loshchilov和Hutter,2019)對Qwen-7B-Chat進行了5次迭代的微調(diào)。批量大小設(shè)置為8,初始學(xué)習(xí)率為3e-4,學(xué)習(xí)率調(diào)度器類型選擇為余弦,步長為0.01,輸入文本的最大長度為2048。在顯存為48GB的A40 GPU上進行LoRA(Hu等,2021)微調(diào),歷時50小時完成大模型微調(diào)。

(四)實驗結(jié)果與評估

本文基于構(gòu)建的大模型測試集評估Qwen-7B-Chat以及微調(diào)過的大模型,即Qwen-7B-Chat_FineTuning。選擇 BERT Score(F1)(Zhang等,2020)和BART Score(Yuan 等,2021)作為文本相似度的度量指標(biāo),該指標(biāo)通過計算兩個句子向量編碼的余弦相似度來評估預(yù)測答案與標(biāo)準(zhǔn)答案之間的相似性,預(yù)測答案與標(biāo)準(zhǔn)答案之間的相似度越高,該數(shù)值越大。此外,對答案準(zhǔn)確度要求較高的任務(wù)采用ROUGE(Lin,2004)指標(biāo)進行評估,該指標(biāo)能夠從標(biāo)準(zhǔn)答案與預(yù)測答案的重復(fù)度和精準(zhǔn)性角度評估大模型生成答案的質(zhì)量。測評結(jié)果如表5所示。

從表5中可以看出,經(jīng)過微調(diào),各項任務(wù)的答案質(zhì)量均有較大幅度的提升,微調(diào)后的大模型對審計任務(wù)的理解更加準(zhǔn)確,生成的答案質(zhì)量更高。就審計判斷任務(wù)而言,微調(diào)后的大模型對問題定性的總結(jié)更加精準(zhǔn),進而生成的推薦法規(guī)更加符合該審計問題的實際情況,大模型與審計領(lǐng)域任務(wù)的適配問題得到了有效緩解。

審計問題總結(jié)和審計依據(jù)生成任務(wù)的具體推理結(jié)果如圖5所示,未微調(diào)大模型生成的內(nèi)容中提到“《中華人民共和國會計法》第八十二條”,實際上《會計法》(2017年修正)一共只有五十二條內(nèi)容,內(nèi)容中提到的“挪用公款與職務(wù)侵占”等問題與實際審計問題“登記賬簿不符合規(guī)定”并不相符。而經(jīng)過微調(diào)的大模型在法規(guī)推薦上的準(zhǔn)確度更高,生成答案與標(biāo)準(zhǔn)答案之間的相似度近乎100%。

六、基于大模型的審計判斷智能系統(tǒng)構(gòu)建探索

大模型技術(shù)的持續(xù)發(fā)展使其在審計判斷實務(wù)中具有廣闊的應(yīng)用前景。例如,基于微調(diào)后的審計判斷大模型可結(jié)合檢索增強生成(Retrieval-Augmented Generation,RAG)(Chen等,2024)搭建審計判斷智能系統(tǒng),實現(xiàn)審計問題抽取/總結(jié)、審計法規(guī)推薦。該系統(tǒng)旨在提高審計法規(guī)推薦的準(zhǔn)確性,同時通過結(jié)合RAG技術(shù)從法規(guī)庫中檢索出最恰當(dāng)?shù)恼鎸嵎ㄒ?guī),從而消除大模型在法規(guī)推薦方面存在的幻覺問題(Leiser等,2024)。該系統(tǒng)的構(gòu)建和應(yīng)用流程如圖6所示。

首先,構(gòu)建大規(guī)模審計相關(guān)法規(guī)知識庫。該法規(guī)知識庫針對收集和整理的法規(guī)三元組(法規(guī)名,條款號,條款內(nèi)容),利用嵌入向量表示模型將法規(guī)三元組轉(zhuǎn)換為高維稠密的語義向量,同時利用大模型對其進行關(guān)鍵詞抽取并構(gòu)建索引。

其次,在系統(tǒng)應(yīng)用階段,大模型針對審計人員輸入的審計判斷相關(guān)問題進行解讀和分析,并生成“偽法規(guī)”結(jié)果。該“偽法規(guī)”存在一定程度的幻覺問題,即該“偽法規(guī)”并非真實存在的法規(guī)條款,但其語義與某個真實的法規(guī)條款具有較高相似度。因此,可利用該“偽法規(guī)”對法規(guī)知識庫進行檢索,以獲取匹配度最高的若干真實法規(guī)作為審計判斷的推薦結(jié)果。相比通用大模型,該系統(tǒng)推薦的法規(guī)條款更合理。

因此,在實踐中,上述結(jié)合微調(diào)大模型與RAG技術(shù)的法規(guī)推薦系統(tǒng)可有效解決審計判斷中存在的審計定性不準(zhǔn)確和定性依據(jù)引用存在困難這兩類難題,也能在一定程度上限制處理處罰中自由裁量權(quán)的使用。

七、總結(jié)

本文創(chuàng)新性地提出了一種基于大模型的審計判斷智能化方案,專注于解決審計判斷過程中所面臨的困難。通過理論設(shè)計與實驗研究,探索了相應(yīng)審計法規(guī)體系構(gòu)建框架,并成功構(gòu)建了基于大模型的審計依據(jù)智能推薦框架。

在理論研究層面,本文將審計判斷抽象為一系列大模型學(xué)習(xí)任務(wù),并構(gòu)建了一套審計判斷相關(guān)的指令數(shù)據(jù)集。在實踐層面,本文基于審計判斷指令數(shù)據(jù)集微調(diào)大模型,并運用多個指標(biāo)評估其生成結(jié)果,為人工智能技術(shù)賦能審計行業(yè)提供了堅實的實驗方案和結(jié)果驗證。在應(yīng)用層面,本文面向?qū)徲嬇袛嗟拇竽P蜆?gòu)建了一套審計法規(guī)體系智能解決方案,該方案能夠深入分析審計案例文本,協(xié)助審計人員進行審計判斷,從而有效解決在審計判斷過程中出現(xiàn)的審計定性不準(zhǔn)確和定性依據(jù)引用存在困難等挑戰(zhàn),進而提高審計人員的工作效率,有效保障審計工作的準(zhǔn)確性和合規(guī)性。在整體層面,本文設(shè)計的方案在審計實踐中以“人主機輔”的形式進行審計判斷,大模型作為輔助工具完成審計問題的識別、總結(jié)與分類以及審計依據(jù)的推薦等任務(wù),而審計人員基于大模型的推薦結(jié)果進行審計判斷。

在未來的工作中,我們將進一步完善和豐富審計判斷方面的知識結(jié)構(gòu)及內(nèi)容。目前,我們將繼續(xù)專注于深入探索審計判斷過程中所面臨的困難,繼續(xù)擴充審計法規(guī)內(nèi)容,并增加更多不同類型的審計案例,以提高推薦的準(zhǔn)確性和多樣性。此外,我們計劃基于各類知識和任務(wù)構(gòu)建更豐富的大模型微調(diào)指令數(shù)據(jù),以更全面地訓(xùn)練審計判斷大模型,推動人工智能技術(shù)在審計行業(yè)中的應(yīng)用。

【基金項目】國家自然科學(xué)基金面上項目“面向國家審計的大模型訓(xùn)練與知識增強研究”(項目編號:62472227);江蘇省高校自然科學(xué)研究面上項目“面向?qū)徲嬓芴嵘念I(lǐng)域知識圖譜構(gòu)建關(guān)鍵技術(shù)研究”(項目編號:23KJB520015)

【作者單位】南京審計大學(xué)計算機學(xué)院,南京 211815

DOI:10.19641/j.cnki.42-1290/f.2025.06.003

班鳳欣.審計定性和處理處罰中存在的問題及其規(guī)范[J].審計月刊,2010(12):24~25.

車萬翔,竇志成,馮巖松等.大模型時代的自然語言處理:挑戰(zhàn)、機遇與發(fā)展[J].中國科學(xué):信息科學(xué),2023(9):1645~1687.

陳雪嵩.大語言模型在企業(yè)內(nèi)部審計中的應(yīng)用研究[J].會計之友,2024(11):23~29.

程平,喻暢,龔悅.基于ChatGPT的智能內(nèi)部審計研究[J].會計之友,2023(20):7~12.

黃佳佳,李鵬偉,徐超.大數(shù)據(jù)驅(qū)動的審計知識庫建設(shè)與應(yīng)用[J].財會月刊,2022(3):101~107.

黃佳佳,李鵬偉,徐超.面向智慧審計的思維變革與審計平臺構(gòu)建研究[J].審計研究,2023(5):11~20.

徐波,廖晨琪.論自由裁量權(quán)與審計質(zhì)量[J].安陽工學(xué)院學(xué)報,2022(5):63~65.

楊道廣,陳波,陳漢文.智慧審計研究:理論前沿、實務(wù)進展與基本結(jié)論[J].財會月刊,2022(11):15~31.

于凌云,吳建新.審計判斷偏誤及其應(yīng)對策略分析[J].會計之友,2012(29):102~104.

張樂玲.審計定性存在的問題及規(guī)范路徑[J].審計月刊,2018(2):26~27.

張舟,劉文清.人工智能背景下法律推理模型建立探究[J].南方論刊,2024(1):70~72.

鄭石橋,朱霽.依法審計定性、規(guī)則悖反與救助機制——兼論新常態(tài)下的依法審計定性[J].南京審計大學(xué)學(xué)報,2017(5):70~77.

【 主 要 參 考 文 獻 】

(責(zé)任編輯·校對: 陳晶" 喻晨)

主站蜘蛛池模板: 久久综合亚洲色一区二区三区| 国产女同自拍视频| 国产日韩av在线播放| 国产美女在线观看| 欧美在线伊人| 国产成人a在线观看视频| 欧美日韩国产系列在线观看| 欧美中文字幕第一页线路一| 久久久精品久久久久三级| 成人午夜福利视频| 免费A级毛片无码免费视频| 久久精品66| 国产熟睡乱子伦视频网站| 亚洲香蕉在线| 国产女人在线观看| 在线精品自拍| AV熟女乱| 青青青国产视频手机| 国产在线观看人成激情视频| 中文成人在线视频| 伊人久久久大香线蕉综合直播| 亚洲美女视频一区| 亚洲天堂日韩av电影| 欧美激情视频二区| 极品国产一区二区三区| 中文字幕首页系列人妻| 欧美第二区| 一区二区三区国产| 国产一区二区人大臿蕉香蕉| 中文一区二区视频| 亚洲精品欧美重口| 国产理论最新国产精品视频| 91久久天天躁狠狠躁夜夜| 久久毛片网| 在线观看免费国产| 婷婷在线网站| 日本道综合一本久久久88| 成人国产免费| 国产xx在线观看| 99伊人精品| 欧美高清日韩| 亚亚洲乱码一二三四区| 欧美曰批视频免费播放免费| 国产美女主播一级成人毛片| 国产91丝袜在线播放动漫| 欧美人与牲动交a欧美精品| 天天色综网| 原味小视频在线www国产| 亚洲第一色视频| 亚洲天堂在线免费| 亚洲色图综合在线| 97视频免费看| 国产女人在线视频| 久久久久国产一级毛片高清板| 国产剧情无码视频在线观看| 美女国产在线| 午夜色综合| m男亚洲一区中文字幕| 熟女日韩精品2区| 欧美 亚洲 日韩 国产| 91尤物国产尤物福利在线| 熟女成人国产精品视频| 爱爱影院18禁免费| 国产成人你懂的在线观看| 亚洲高清中文字幕在线看不卡| 毛片一级在线| 亚洲精品动漫| 色亚洲成人| 精品欧美一区二区三区久久久| 538国产视频| 色综合五月婷婷| 成人免费视频一区| 欧美成人午夜在线全部免费| 一级毛片在线免费看| 日本福利视频网站| 国产在线观看成人91 | 亚洲婷婷六月| 久久久久国产精品熟女影院| 国产成人啪视频一区二区三区| 欧美激情第一欧美在线| 欧美激情伊人| 色综合成人|