蔡昌(教授/博導)龐思誠
(中央財經大學財政稅務學院 北京 100081)
2022 年11 月30 日,人工智能研究實驗室(Open AI)推出了全新的人工智能對話聊天機器人ChatGPT,在全世界產生了巨大的轟動效應。至2023年1月底,僅兩個月時間,ChatGPT的活躍用戶就已經超越1億戶,成為有史以來用戶數增速最快的應用程序模型,世界諸多大企業和科研機構紛紛進軍人工智能產業,如微軟的BingChat、谷歌的Bard、百度的文心一言、復旦大學自然語言處理實驗室的MOSS等。
之所以ChatGPT能引起廣泛的關注,不僅是因為Chat-GPT 能夠順利實現人類與人工智能機器人無障礙的交流,還因為其具有強大的知識整合能力,并能簡單直接地反饋任務、實現結果。ChatGPT 的出現,彌補了人類認知、能力和精力的有限性,通過與大數據、區塊鏈等新興技術的結合,對各個領域發展產生積極的推動作用,引起社會各界的廣泛關注。具體到財稅領域,ChatGPT能解決征稅人、納稅人和中介機構三類主體的不同需求,本文對其解決途徑進行了探討。
ChatGPT(Chat Generative Pre-trained Transformer)是人工智能技術驅動的自然語言處理模型(LLM),它能夠通過理解和學習人類的語言真正像人類一樣與人類用戶聊天交流,甚至能完成撰寫文章、文案和從事翻譯、編寫代碼等任務。ChatGPT 是預先訓練的大型語言模型,本質上是一種生成式人工智能技術。ChatGPT 的核心技術是InstructGPT,如圖1所示。ChatGPT通過基于人類反饋的強化學習,讓人工智能模型產生類似人類一樣的常識、認知、需求和價值觀。

圖1 ChatGPT的核心技術
從技術根源來說,ChatGPT 是GPT(Generative Pre-Training)的一種典型模式,其最大的特點是可以通過已知的信息來預測將要填寫的內容。
2016 年Open AI 發布了GPT-1,雖然該模型采用了具有創新意義的GPT方式進行底層邏輯構建,但該模型仍然具有傳統人工智能模型的缺點:需要根據任務的不同進行調整,通過再訓練才能執行任務。2019 年Open AI 公司發布了GPT-2,該模型除了擁有更大的參數和訓練樣本量之外,更重要的創新就是采用“零樣本設置”(Zero-shotSetting),在模型的訓練中加入暗示,使GPT-2 模型可以在不用微調的情況下直接使用。2020年Open AI公司又發布了GPT-3,該模型擁有海量的參數和訓練樣本,還采用“零樣本設置”(Zero-shot Setting)、“單樣本設置”(One-shot Setting)和“多樣本設置”(Few-shot Setting),使模型能夠更精準地預測下游任務,基本可以根據人類指示比較好地完成任務。但是,GPT-3還存在一定的缺陷,即無法實現類似人類語言的文本輸出。因為GPT-3模型所含有的參數較大,存在多方面過度輸出的問題,可能會產生答非所問的結果,并且GPT-3的訓練數據不夠純凈,導致GPT-3帶有一定的偏見性。為了克服上述缺點,Open AI 公司又對GPT-3 的語言學習方面進行了升級,基本克服答非所問和偏見性回答的問題,目前已升級到GPT-4。
就具體過程而言,ChatGPT 實現模式具有相互關聯又層層遞進的運行機制,具體分為以下三步,如圖2所示。

圖2 ChatGPT的實現模式
第一步,收集示范性數據并采取受監督的方式訓練。想要人工智能以人的方式來回答問題,那么必須人類自己先回答問題,再將回答作為參考供人工智能學習。隨機從提示詞(Prompt)數據集中選擇要提問的問題,然后標注人員(Labeler)對問題進行解答,形成人類偏好的標注數據供機器學習使用。數據量無需太大,只要幾萬條,通過提示詞的方式進行訓練,使模型參數不斷發生變化。在訓練過程中必須采取人工監督的方式,通過人工獎勵和懲罰機制,獎勵符合人類邏輯的回答,懲罰不符合人類邏輯或者不合法的回答,以修正模型的輸出結果。
第二步,收集可比數據并訓練一個獎勵模型。用一個提示詞對模型進行提問,然后讓模型輸出多個不同的回答。標注人員對這些輸出結果進行打分并排序,挑出最好的和最差的解答,并將這些數據用于訓練獎勵模型。在此期間,針對不合法、不合理、不理解的回答,獎勵模型會對其進行懲罰,并剔除出模型回答范圍。相反,對于接受度高的回答給予獎勵,使回答頻率更高。
第三步,使用強化學習算法優化獎勵模型。通過強化學習算法,不需要人工主動干預就能自動實現對輸出結果的評分和排序,并以此優化模型。人工智能通過循環式學習、優化模型、修改輸出結果,實現不斷迭代升級,最終達到人工智能具有人的邏輯,從而能夠以人的方式進行溝通,并且做出令人滿意的行為結果。
本文對ChatGPT的智能性及獨特優勢進行系統分析。
1.ChatGPT具有強大的語言能力。語言是溝通的挑梁,只有雙方都能理解各自表達的含義,才能順利完成合作。ChatGPT 是一種具有優秀語言能力的人工智能模型,它能理解人類所表達內容的含義,并完成任務,再以一種人類可以理解的方式將結果輸出,這為它應用于財稅領域奠定了基礎,使財稅人員和人工智能之間能夠互相知曉任務的內容和要求,并在任務完成時提交理性的輸出結果。它還可以更換不同的表達方式讓不同類型的人更好地理解它所表達內容的意思,這是它優于其他人工智能技術的重要體現。比如針對外行人,通過“簡單表述”這個提示詞,它回答的內容會盡可能淺顯易懂;針對專業人士,通過“詳細表述”這個提示詞,其回答會更專業、詳細、全面。
2.ChatGPT 擁有全面的處理能力。ChatGPT 采用海量的數據進行訓練,并且這些數據涉及到各行各業,使ChatGPT 具備更全面的能力和性能,比如翻譯、撰寫文章和編程等。過去的人工智能僅能在單一領域具有超常的作用,深藍、阿爾法狗等人工智能產品在計算、圍棋等領域取得顯著成果,而ChatGPT能在不進行強化訓練的情況下,參加美國醫學執照考試(USMLE)并獲得美國醫療許可證。
3.ChatGPT 擁有準確的判斷能力。ChatGPT 能夠拒絕提出的不合理要求,通過采用標注人員和獎勵模型的訓練,使ChatGPT 擁有了符合人類邏輯的價值判斷,能對符合人類邏輯錯誤的事情給予否定,這使其可以更好地為人類服務,防止被不法分子利用,避免對社會造成負面影響。比如,它會拒絕納稅人逃稅的提問。
4.ChatGPT 擁有較好的修正能力。ChatGPT 不僅僅是在開發過程中進行訓練,在使用過程中同樣可以進行訓練。當ChatGPT 輸出結果錯誤時,使用人就可對其進行人工修正。在這個過程中,每個使用者都發揮了標注人員的作用,能對模型進行再訓練修正錯誤,并避免以后輸出錯誤結果,使ChatGPT的能力進一步提高。可見,技術的升級能提高ChatGPT應對人類需求的能力。
《關于進一步深化稅收征管改革的意見》指出,要“全面推進稅收征管數字化升級和智能化改造”,將ChatGPT運用在稅務機關的執法、服務、咨詢中,可以助力稅務機關實現數字化升級和智能化改造,更好地提高智慧稅務建設的速度和質量。本文從征稅人端、納稅人端、中介機構端三主體分析ChatGPT在財稅實踐領域的可能應用及具體方式。
1.稅務執法。
(1)指導稅務機關進行規范執法。同一個政策在不同地區的執法執行情況存在一定差別,這是由于不同地區的稅務機關對稅收政策的理解具有差異性,而ChatGPT 對稅收政策的理解是統一的。稅務機關執法人員只需要將存在執法爭議的案例問詢ChatGPT,ChatGPT就會反饋出規范化的執行方法作為參考,防止出現粗放式、選擇式、“一刀切”式的隨意執法行為。
(2)助力稅務人員執法教育。稅收政策會隨著經濟運行變化不斷調整,而每次變動稅務機關都需要耗費大量人力、物力、財力對稅務人員進行教育考核。ChatGPT在經過專業政策的訓練之后,在某些方面會快速達到超越人類的水平。比如可以履行教師職責對稅務人員進行專業化、個性化、精確化培訓,并能用便于理解的語言解釋政策文件的含義,便于稅務人員快速掌握最新政策,理解其中的重點、難點,提高執法的準確性、規范性和有效性。
(3)幫助撰寫通知、公告與文書。ChatGPT擁有強大的通知、提醒、公告、文書等撰寫能力,能夠節省執法人員所耗費的精力。稅務執法人員對納稅人的稽查通知、警示通知、工作報告、執法結果等工作,皆可運用ChatGPT進行文本撰寫,快速高效完成任務,提高稅收執法效率,降低人力成本。
2.納稅服務。
(1)作為助手參與辦稅服務。在納稅申報和稅款繳納方面存在一些繁瑣的流程和手續,導致納稅人需要耗費較多的時間和精力。ChatGPT 通過實現“需求-解答”這種直接的模式,使納稅人無需耗費大量精力學習如何操作稅務平臺各種功能以及納稅手續流程,引導納稅人達到目的。例如,納稅人可以通過12366 納稅服務平臺向ChatGPT 提出“我想了解如何申報增值稅”,ChatGPT 助手可以分析這個問題,提供詳細的申報流程、操作方法、注意事項等內容,并引導納稅人申報納稅。
(2)提供個性化咨詢服務。ChatGPT 具有更全面的能力,能夠很大程度上實現不需要特殊訓練就能實現不同要求的任務。目前雖然機器人廣泛應用于財務、稅務、電信等行業,能代替人工提供一些簡單的便捷服務,但是對于稍微個性化或者復雜性的問題就難以回答,使絕大部分使用者在日常使用中都更傾向于使用人工服務。但是,ChatGPT能夠通過上文的描述進一步修正輸出結果,最終實現輸出能讓納稅人滿意的回答結果。此外,ChatGPT 還是一個強大的信息搜集器,可通過網絡爬蟲搜集大量的有用信息,并對信息進行篩選,以為納稅人提供有用的信息及溯源索引。
(3)提供稅收政策解讀服務。稅收政策的變動比較頻繁,讓納稅人難以及時掌握有用信息,延誤生產經營策略調整時機。ChatGPT能對納稅人想要了解的政策進行解釋和說明,使之更容易理解和運用。此外,還可以提供系統政策信息,如“針對小型微利企業的稅收優惠政策”,使納稅人更快地得到想要的稅收政策信息。
3.稅務監管。ChatGPT能成為稅務風險“警報器”。只要將納稅人申報的財務數據及其來自第三方的數據(如銀行數據、水電費數據、上下游企業數據等)輸入到ChatGPT中,ChatGPT 就會評估該納稅人的稅收逃避風險。如果稅收逃避風險得分超過閾值,就會進行風險預警,提醒稅務機關該納稅人存在逃避稅行為的可能性,稅務機關可以據此進行重點稽查,為稅制完善提供借鑒與參考。
1.運用ChatGPT降低申報難度。納稅人只需要簡單地輸入自己的個人信息、財務信息等基本信息,ChatGPT就可以自動生成相應的稅務申報表,幫助納稅人進行納稅申報,可大大降低納稅人的申報難度和時間成本。此外,ChatGPT還具有強大的糾錯能力,能對人工填寫的納稅申報表進行糾錯。ChatGPT 通過運用自然語言處理技術,分析納稅人需修正問題的申報表,發現其中錯誤并糾正。比如,識別和糾正數字輸入遺漏、文字輸入錯誤等。這些自動化的糾錯功能,不僅可以提高納稅人的申報準確率,還可以幫助稅務機關快速審核和處理納稅人的申報表。
2.運用ChatGPT進行稅收籌劃。對于經營規模較小的企業和收入較低的個人,一般不會花費大量的成本請專業人士進行稅收籌劃,這使他們的經濟利益相對受損,不利于社會公平和企業的成長。同時,企業擔心自身財務數據泄露,影響到自身的生產經營,也不愿意采用人工籌劃。所以,通過用大量稅收籌劃實際案例訓練ChatGPT,使其理解一定數量的納稅籌劃方法,然后納稅人就可將自己需要提供的數據輸入到模型中,ChatGPT就會據此進行判斷,提出稅收籌劃的建議。
3.運用ChatGPT助力企業合規管理。傳統的財稅風險防控需要依賴人工,效率也相對低下,具體分為五個部分:財務憑證審核、財務數據分析、財務政策獲取、財務風險預警和財務風險控制。其中,財務憑證審核需要人工對每一個憑證進行審核;財務數據分析只是進行簡單的儲存和對比;財政政策獲取需要財務人員人工搜索和學習;財務風險控制是由財務人員負責。通過建立運用ChatGPT適應數字時代企業的合規預警機制,實現高效率、高質量和及時性的企業風險防范。第一,通過采用發票ORC 識別技術、合同NLP 語義分析等自動化技術對財務數據進行審核,對審核不通過的數據進行預警。第二,對已審核的財務數據按模塊進行分類儲存,并將財務數據上傳到大數據信息平臺。第三,數據自動導入ChatGPT中,從大數據信息平臺中獲取財務信息、風險指標、財稅政策等信息要素,并對ChatGPT自身進行訓練,并對從該企業獲取的信息根據風險指標和財務邏輯進行智能化評判。第四,ChatGPT 輸出智能風險提醒和財務決策建議,對財務人員進行違規預警。第五,財務人員對輸出的預警和建議信息進行評判,如果不合理則向ChatGPT 反饋不理想之處,ChatGPT 重新進行分析和輸出,直到結果合理為止。最終的結果會上傳大數據信息平臺,為后續訓練提供依據(見圖3)。

圖3 基于ChatGPT的企業合規預警機制
企業合規機制強調自動化、常態化和精準化。通過人工智能、數字識別、自動化程序輸入輸出等技術,識別交易記錄、記賬憑證、財務報表等財稅信息,自動將數據輸入到ChatGPT中,進行合規識別、判斷與預測。它能代替人工處理與分析,常態化監管企業合規狀況。
1.輔助處理業務。中介機構可以借助ChatGPT對客戶企業進行稅務代理、稅務籌劃,然后再利用得到的結果進行二次處理,實現更高水平、更高質量的完成效果。使用ChatGPT可以大大提高中介機構處理業務的效率。一方面對于基礎性的任務,比如代理記賬、財稅咨詢等業務,Chat-GPT 有能力出色地解決問題,中介機構不需要耗費太多的精力來應對這類業務,只需要監督和修正ChatGPT 處理的結果即可。另一方面,對于復雜性的問題,比如稅收籌劃,ChatGPT 可以為中介機構提供思路,輔助中介機構更好更快地想出解決問題的方案。
2.提供新的收入源泉。ChatGPT 的任務能力,很大程度上依靠訓練數據的數量和質量。中介結構的稅務代理、財務咨詢、稅收籌劃等業務的實際案例是訓練ChatGPT 的重要工具,所以對該數據的需求能為中介機構帶來商機。中介機構可以將過去稅收籌劃、稅務代理等業務的案例,經過處理后銷售給大數據平臺,用于訓練ChatGPT 的財稅處理能力。當然,中介機構也需要根據具體情況制定嚴格的保密措施和管理制度,以確保客戶信息和數據的安全和保密。
ChatGPT 目前并非一個完美的人工智能,它在財稅領域的應用會存在一些問題和障礙。
目前,ChatGPT 存在的最大缺陷就是問題生成的結果可能會存在一定的質量隱患。當向ChatGPT提出一系列需要深入了解的文獻問題和任務,它不會拒絕回答,從而產生一些虛假和誤導性的文本信息。當然,信息生成的質量取決于訓練和優化模型的質量,如果采用更多的財稅信息進行訓練,該問題就能得到一定程度的緩解。并且,當生成錯誤信息時,通過人工糾正的方式進一步更正,使人工智能生成結果的質量逐漸得到提高。
1.數據共享問題。首先,數據的兼容性存在問題。不同部門、不同地區、不同企業的數據類型、標準和維度存在較大差異,這提升了對ChatGPT訓練的難度。其次,如何將稅收政策按照ChatGPT 理解的數據模式進行訓練,也是一個難題。再次,目前并沒有一個組織能夠破除政府各部門之間、政府和企業之間、企業和企業之間的信息壁壘,實現數據的統一管理。最后,傳統公共管理范式影響信息共享的環境,如共享平臺建設存在問題,共享模式不透明、不規范等。
2.數據隱私、合法性問題。在隱私和合法性上,商業數據涉及到隱私問題,我國已經頒布一些涉及數據隱私的法律,比如《個人信息保護法》《數據安全法》等,但在實踐中存在執行效果不佳、運用界限模糊等問題。所以,未來如何在合法范圍內利用商業數據來訓練和開發ChatGPT模型是一大難點。在數據安全上,如果企業、政府、個人數據發生泄露,不法人員會利用這些數據進行詐騙、勒索,從而嚴重危害個人、企業和國家安全。
3.數據安全問題。雖然ChatGPT 通過人工的訓練,對人類的道德有了一定認識,形成了自己的道德邏輯,可以拒絕回答不道德或者不合法的問題。但是,以目前ChatGPT的判別能力,人類依然有能力采取多種方式繞過ChatGPT的道德與合法性邏輯系統。另外,ChatGPT是美國Open AI研發的產品,如果使用它作為模型基礎,存在關鍵數據泄露國外的風險,會對國家安全造成很大影響。此外,如果ChatGPT 被廣泛應用到我國關鍵領域中,會產生“卡脖子”的問題,制約我國的發展和進步。
4.數據成本問題。訓練我國自己的ChatGPT式的人工智能,需要耗費大量的成本,包括巨大的算力、大量GPU等硬件和大量電力。國內券商國盛證券對ChatGPT的開發費用和現階段的運行費用進行了推算。在開發成本上,基于參數數量和token 數量估算,GPT-3 訓練一次的成本約為140萬美元。在運行費用上,2023年1月平均每天約有1 300萬獨立訪客使用ChatGPT,對應芯片初始投入成本約為8億美元,而每日的電費也將在5 萬美元左右。同樣,我國開發、訓練和運行自己的ChatGPT 也需要付出巨大的成本。每次財稅政策發生變動,都需要進行一次強化訓練,維護運營的成本也很高。
綜上所述,ChatGPT 在財稅領域的應用還存在諸多方面的問題和挑戰,但是運用人工智能推進財稅領域變革具有積極意義。所以,我們要盡可能在未來實踐中克服這些缺陷,盡可能發揮其對財稅工作的積極作用。
2021 年3 月,中共中央辦公廳、國務院辦公廳印發了《關于進一步深化稅收征管改革的意見》,提出了智慧稅務建設目標。黨的二十大進一步強調了“網絡強國、數字中國”的建設要求,為稅收征管數字化轉型注入了新的思想動能。ChatGPT式的人工智能模型將在未來數字財稅管理中發揮重要的作用。
訓練ChatGPT 需要企業提供自身的財務數據,但是基于經濟利益、財務安全、股東個人利益等多方面考慮,大部分企業不愿對外披露一些重要數據,選擇把數據留存在企業內部或者相關聯的機構中去。因此,政府僅通過市場調節手段實現數據共享可能并不現實。據歐盟委員會的一項調查顯示,參與數據交易的企業僅占受訪企業的4%。為慎重起見,政府可要求企業將其財務數據用統一口徑的方式上傳到政府控制的大數據信息平臺上去,既能保證數據安全,又能實現大數據共享。當然,政府建立數據獎懲機制也非常重要。通常,基礎性數據屬于企業必報數據,國家在財務信息、涉稅信息等方面有強制性要求。但對于一些特殊數據,應建立數據報送激勵機制,即通過交易、獎勵等多種方式鼓勵企業上報特殊數據,比如案例數據、縱向分析數據等,實現政府和企業的數據共享,達到雙贏的效果。當然,政府也要懲罰企業瞞報數據或報告虛假數據的行為,以實現有效的數據管理。
1.明確公民和企業信息隱私的界限,切實保障企業和公民隱私權,對信息泄露問題進行嚴懲。現有的數據運用協議尚未有單獨的規定,對于數據應用的權利和隱私權保護等法律條款分散在《數據安全法》《個人信息保護法》《關于平臺經濟領域的反壟斷指南》等不同文件中。因此,應當建立專門針對數據共享、ChatGPT應用等方面的法律制度,規范數據共享中稅務機關、企業和個人的權利與義務,并為執法機關的規范化執法指明方向,實現ChatGPT 數據訓練及實踐應用中的合規化,為ChatGPT推廣應用掃清障礙。
2.政府應加強數據監管,將數據審核、數據保密、數據追查三個方面作為未來數據監管的重點。數據審核主要是對數據的正確性、合法性進行審核,確保數據能夠干凈可靠;數據保密主要是為了防止數據泄露以及數據濫用,保證數據的安全性;數據追查針對的是當數據存在問題時,能夠及時追查數據錯誤的來源,并能對相關責任人員和企業進行追責。
要想提高ChatGPT 輸出結果的高效性、全面性和準確性,除了開發時提供海量、純凈的數據對其進行訓練,在日常使用中對數據以及輸出結果進行修正也十分重要。所以,應建立反饋式機制,允許稅務機關和企業在日常使用ChatGPT 過程中對反饋輸出答案存在的錯誤予以審核修正,大大提高人工智能訓練的效率,并使其不斷優化,在降低成本的同時又可提高不同環境下的適應性。
訓練我國財稅領域適用的類ChatGPT人工智能成本巨大,所以單純依靠政府或者企業獨自的力量訓練效果較低。政府缺乏足夠多專業的程序人才和人工智能的技術,企業缺乏訓練數據、合法性保障。筆者認為,可采用聯合式開發方式,提高技術開發層次。即成立一家獨立運營財稅人工智能的管理機構,對其模型進行開發、訓練和運營。獨立運營的管理機構為人工智能研發提供資金、財稅人才、財稅數據與設施硬件,保證該企業能夠按照國家政策導向運行。合作企業提供資金和技術,助力模型的研發和訓練,這樣既可以保證效率,調動起全國的人才進行集體開發,又可依托國家力量保證數據的安全性和可靠性,防止數據泄露的問題。值得注意的是,開發、訓練和維護的人員必須簽署嚴格的保密協議,并采取合理的手段對開發人員進行監管,防止財稅數據泄露。
ChatGPT 的確帶給了人類一定的驚喜,我們發現,ChatGPT 本質上還僅是一個統計模型,基于已有的知識經驗輸出結果,某種程度上代表了社會整體的認知,但ChatGPT 缺乏思考力和創造性。一些思考和創新的工作并不能完全交付給ChatGPT 之類的算法。ChatGPT 的創新是基于大數據的,當它的訓練數據一樣時,它只能得出相同的答案,那就不是創新。數據工程師可以開發出更好的算法,但必須構建我國的數據庫,ChatGPT 之類的算法才有用武之地。因此,在大數據時代,構建獨特的、體現個性的數據庫至關重要。可以想象,當我們擁有不同的數據,即使使用同樣的算法,也可得出不同的結果,從而實現創新。當然,創新屬于人類的獨特思維,算法還不能完全取代人類的思維過程。在ChatGPT 應用的早期,我們期待具有個性化特征的多維數據庫支撐起ChatGPT 的實踐應用,提高檢索的速度和精準度,提高決策效率,這樣能夠彰顯出ChatGPT的信息匯聚與挖掘能力;未來我們期待ChatGPT不斷迭代,以人機交互模式融入機器學習,提高ChatGPT 的個性化、人性化,提升其整體運行的效率和決策力,如果能夠在人機交互、機腦協作中綻放出思維之花,那么ChatGPT最終將真正開啟類似人類思維的創造之旅。