999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ChatGPT的問答式財務(wù)知識庫構(gòu)建與應(yīng)用

2023-09-15 16:01:40金源魏振李成智
財會月刊·上半月 2023年9期

金源 魏振 李成智

【摘要】ChatGPT是繼數(shù)據(jù)庫和搜索引擎之后的全新一代知識存儲和調(diào)用方式。本文提出了一種基于ChatGPT構(gòu)建問答式財務(wù)知識庫的可行框架, 并以H公司為例, 展示了該知識庫在財務(wù)部門的實(shí)施路徑和應(yīng)用價值。本文的研究結(jié)論為AIGC時代企業(yè)財務(wù)知識庫的構(gòu)建提供了新視角, 同時也為其他垂直領(lǐng)域的知識庫建設(shè)提供了參考和借鑒。

【關(guān)鍵詞】財務(wù)知識庫;ChatGPT;AIGC;知識管理

【中圖分類號】F275? ? ? 【文獻(xiàn)標(biāo)識碼】A? ? ? 【文章編號】1004-0994(2023)17-0046-6

一、 引言

2022年, 科技部等六部門印發(fā)《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見》, 指出要以需求為牽引謀劃人工智能技術(shù)應(yīng)用場景, 融合人工智能模型算法和領(lǐng)域數(shù)據(jù)知識, 推動人工智能場景創(chuàng)新。2023年7月, 國家網(wǎng)信辦等七部門聯(lián)合公布的《生成式人工智能服務(wù)管理暫行辦法》也指出, 國家鼓勵探索優(yōu)化生成式人工智能技術(shù)應(yīng)用場景, 構(gòu)建應(yīng)用生態(tài)體系。

2022年11月底, OpenAI發(fā)布基于GPT(Generative Pre-Training,生成式預(yù)訓(xùn)練)語言模型GPT-3.5 Turbo構(gòu)建的智能聊天機(jī)器人ChatGPT。ChatGPT是繼數(shù)據(jù)庫和搜索引擎之后的全新一代“知識存儲和調(diào)用方式”, 是當(dāng)前AIGC(AI-Generated Content,人工智能內(nèi)容生成)領(lǐng)域的代表性技術(shù)。ChatGPT憑借精準(zhǔn)的語義理解能力、 強(qiáng)大的語言表達(dá)能力、 嚴(yán)謹(jǐn)?shù)倪壿嬎季S能力, 對新聞媒體、 教育培訓(xùn)、 客戶服務(wù)與支持、 法律服務(wù)、 會計(jì)審計(jì)等行業(yè)均造成一定程度的沖擊, 引發(fā)全社會熱議。

為積極應(yīng)對ChatGPT對會計(jì)領(lǐng)域的沖擊, 已有多位學(xué)者思考并探討了ChatGPT對會計(jì)科技(金源和李成智,2023a)、 會計(jì)行業(yè)變革(劉勤,2023)、 智能財務(wù)(金源和李成智,2023b)等方面的影響, 并且積極探索其在財務(wù)咨詢、 審計(jì)、 稅務(wù)管理等具體財務(wù)場景的應(yīng)用可行性。然而, 現(xiàn)有研究多集中在理論框架構(gòu)建和實(shí)踐構(gòu)想層面, 對ChatGPT在財務(wù)場景中落地實(shí)踐的研究尚存在空白。

在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的時代背景下, 財務(wù)RPA、 數(shù)電發(fā)票、 智能財務(wù)、 ESG等新概念層出不窮, 會計(jì)行業(yè)對于知識更新迭代的要求也越來越高。財務(wù)人員需要及時、 精準(zhǔn)地獲取前沿的財務(wù)知識以更好地完成本職工作, 賦能企業(yè)管理決策。然而, 當(dāng)前財務(wù)人員基于搜索引擎和內(nèi)部知識庫的知識檢索模式存在著信息過載、 檢索質(zhì)量參差不齊、 信息更新滯后、 難以滿足個性化需求等諸多痛點(diǎn), 這些痛點(diǎn)嚴(yán)重制約了財務(wù)人員獲取和使用財務(wù)知識的效率。基于以上背景, 本文提出基于ChatGPT構(gòu)建問答式財務(wù)知識庫的可行框架, 并以H公司的問答式財務(wù)知識庫ChatDoc作為案例, 具體呈現(xiàn)了問答式財務(wù)知識庫在財務(wù)部門的落地路徑及其在賦能財務(wù)知識管理過程中的應(yīng)用價值。本研究為AIGC時代企業(yè)財務(wù)知識庫的構(gòu)建提供了新視角。此外, 本文的研究方法和思路, 也為其他垂直領(lǐng)域知識庫的建設(shè)提供了參考與借鑒。

二、 DIKW視角下財務(wù)知識管理的演變邏輯

DIKW(Data-Information-Knowledge-Wisdom)模型是被廣泛應(yīng)用于知識管理領(lǐng)域的模型, 它指出人類決策智慧的形成經(jīng)歷了從噪聲中分揀出數(shù)據(jù), 再將數(shù)據(jù)轉(zhuǎn)化為信息, 升級為知識, 最終升華為智慧的過程。在這一過程中, 數(shù)據(jù)的“清楚、 簡明、 完整、 正確”程度在不斷提升, 對于數(shù)據(jù)理解的深度也在逐層增加。金源和李成智(2023c)研究指出, 數(shù)據(jù)驅(qū)動下的財務(wù)決策支持工作本質(zhì)上也是從業(yè)財數(shù)據(jù)到?jīng)Q策有用的信息和知識, 最終再到?jīng)Q策智慧的加工收斂過程。在該過程中, 數(shù)據(jù)沿著財務(wù)金字塔(財務(wù)核算、業(yè)務(wù)財務(wù)、戰(zhàn)略財務(wù))由下至上被逐層傳遞, 傳遞內(nèi)容的數(shù)量不斷下降、 質(zhì)量不斷提升(如圖1所示)。

在上述過程中, 財務(wù)相關(guān)工作也經(jīng)歷著從數(shù)據(jù)管理、 信息管理再到知識管理以及智慧管理的演變。數(shù)據(jù)管理主要關(guān)注數(shù)據(jù)收集、 存儲和處理。信息管理則更進(jìn)一步, 關(guān)注如何從海量數(shù)據(jù)中提取決策有用信息并進(jìn)行有效管理。知識管理的關(guān)注重點(diǎn)是將信息轉(zhuǎn)化為可復(fù)用、 可傳播的知識, 以持續(xù)支持組織的決策和創(chuàng)新。智慧管理是知識管理的下一階段, 包括對決策智慧、 高級財務(wù)管理人員經(jīng)驗(yàn)等的管理。在財務(wù)領(lǐng)域, 上述四階段體現(xiàn)如下:

第一階段: 數(shù)據(jù)管理。財務(wù)領(lǐng)域最初的數(shù)據(jù)管理體現(xiàn)為對紙質(zhì)憑證、 文檔的保存和歸檔。自1979年開始, 我國財務(wù)管理進(jìn)入電算化階段, 數(shù)據(jù)開始被存儲在電子表格或小型數(shù)據(jù)庫中, 使得數(shù)據(jù)的存儲、 檢索和分析更加方便, 同時也保障了數(shù)據(jù)的安全性和完整性。

第二階段: 信息管理。20世紀(jì)90年代, 隨著ERP(Enterprise Resourse Planning, 企業(yè)資源管理計(jì)劃)的普及, 我國財務(wù)管理進(jìn)入信息化階段, 業(yè)財數(shù)據(jù)實(shí)現(xiàn)初步整合, ERP系統(tǒng)在財務(wù)管理中的應(yīng)用使得企業(yè)的各項(xiàng)資源配置更加合理, 管理者可以依照多方有效信息來進(jìn)行更為科學(xué)合理的決策。2005年財務(wù)共享模式的興起以及2008年XBRL(可擴(kuò)展商業(yè)報告語言)中國地區(qū)組織的成立, 使得財務(wù)信息管理的標(biāo)準(zhǔn)化程度進(jìn)一步提高。

第三階段: 知識管理。2016年, 德勤和Kira Systems宣布將人工智能引入財會領(lǐng)域, 標(biāo)志著我國財務(wù)管理進(jìn)入智能化階段(劉勤和楊寅,2019)。劉勤(2021)指出, 由于存儲在人類財務(wù)專家頭腦中的財經(jīng)知識大多具有隱性特點(diǎn), 因此如何借助有效的知識表示方式, 將人類專家的知識轉(zhuǎn)化為計(jì)算機(jī)可以自動處理的顯性知識并使之得到有效應(yīng)用, 就成為財務(wù)智能化建設(shè)中的關(guān)鍵問題。為解決上述問題, 部分企業(yè)的財務(wù)部門開始將財務(wù)知識庫、 專家系統(tǒng)和知識圖譜等技術(shù)引入財務(wù)領(lǐng)域以實(shí)現(xiàn)財務(wù)知識管理的集中化、 顯性化。

第四階段: 智慧管理。在DIKW模型中, 智慧是對知識的深入理解和應(yīng)用, 是對復(fù)雜問題的洞見和創(chuàng)新性解決。在財務(wù)管理領(lǐng)域, 智慧管理表現(xiàn)為將決策者的個人智慧與財務(wù)預(yù)測模型、 異常告警與歸因模型的機(jī)器智慧進(jìn)行人機(jī)協(xié)同, 以發(fā)現(xiàn)問題背后的隱藏模式, 預(yù)測未來發(fā)展趨勢, 提出業(yè)務(wù)優(yōu)化建議。

以上從DIKW視角對財務(wù)領(lǐng)域的知識管理模式演變進(jìn)行了梳理, 而ChatGPT的問世為財務(wù)工作拓展了更大的想象空間, 使得財務(wù)知識管理模式從單向管理向雙向智慧問答演變。例如: 在數(shù)據(jù)管理方面, 微軟的Microsoft 365 Copilot(微軟365智能副駕), 可以對Word、 Excel、 PowerPoint、 Outlook、 Teams等應(yīng)用中的數(shù)據(jù)和文檔以對話的形式進(jìn)行增刪改查; 在信息管理方面, 微軟的Dynamics 365 Copilot可嵌入ERP系統(tǒng)中實(shí)現(xiàn)對于庫存信息、 供應(yīng)商信息的交互式查詢; 在知識管理方面, 可將ChatGPT與財務(wù)知識庫結(jié)合構(gòu)建起問答式財務(wù)知識庫; 在智慧管理方面, GPT-4的Code Interpreter(代碼解釋器)插件通過雙向?qū)υ捄土愦a的形式極大地降低了財務(wù)人員進(jìn)行海量數(shù)據(jù)處理的門檻。如表1所示。

三、 基于ChatGPT構(gòu)建問答式財務(wù)知識庫的必要性與可行性

ChatGPT的出現(xiàn)為財務(wù)人員提供了一種通過自然語言與大模型交互進(jìn)行知識檢索的模式, 但ChatGPT直接用于財務(wù)知識檢索仍存在著以下問題: ①對于財務(wù)專業(yè)縱深領(lǐng)域知識的理解不足。ChatGPT在不利用財務(wù)知識進(jìn)一步微調(diào)(Fine Tuning)的情況下, 僅基于其預(yù)訓(xùn)練(Pre-training)所習(xí)得的知識可能無法準(zhǔn)確理解財務(wù)工作中一些復(fù)雜的術(shù)語、 流程和實(shí)踐。②受限于過高的算力成本, 企業(yè)利用財務(wù)領(lǐng)域數(shù)據(jù)對大模型進(jìn)行微調(diào)或訓(xùn)練財務(wù)垂直領(lǐng)域的大模型在當(dāng)前可行性較低。③ChatGPT在中文語境下訓(xùn)練不充分, 該缺陷會進(jìn)一步加劇對財務(wù)術(shù)語的誤解。④對會計(jì)準(zhǔn)則和稅務(wù)法規(guī)溯源不準(zhǔn)確, 該缺陷將影響相關(guān)法規(guī)查詢結(jié)果的可靠性。

由于以上缺陷的存在, 無論是單獨(dú)基于搜索引擎、 內(nèi)部知識庫還是ChatGPT, 均無法較為完善地實(shí)現(xiàn)財務(wù)知識庫功能(如表2所示)。但單獨(dú)看來, 三者又各有所長: ChatGPT相較于傳統(tǒng)搜索引擎和聊天機(jī)器人, 具有深度學(xué)習(xí)、 多模態(tài)理解、 長文本生成、 上下文感知、 自我學(xué)習(xí)和良性價值觀等突出特點(diǎn); 內(nèi)部知識庫具有知識精準(zhǔn)度高、 “實(shí)務(wù)經(jīng)驗(yàn)類”知識豐富、 準(zhǔn)則和法規(guī)溯源準(zhǔn)確等突出特點(diǎn); 搜索引擎具有實(shí)時更新、 覆蓋范圍廣等突出特點(diǎn)。因此, 本文認(rèn)為可將三者的核心優(yōu)勢相結(jié)合, 構(gòu)建基于ChatGPT的問答式財務(wù)知識庫。

四、 基于ChatGPT的問答式財務(wù)知識庫框架設(shè)計(jì)

問答式財務(wù)知識庫的構(gòu)建目的是提供一個自助、 便捷、 精準(zhǔn)的個性化財務(wù)知識查詢平臺, 使得財務(wù)人員可以通過多輪對話, 就日常工作、 管理決策和技能學(xué)習(xí)過程中遇到的各類問題, 依據(jù)個人需求和偏好實(shí)現(xiàn)個性化檢索。

(一)財務(wù)知識庫的系統(tǒng)架構(gòu)

本文認(rèn)為, 基于ChatGPT的問答式財務(wù)知識庫系統(tǒng)至少需由文檔庫、 組件庫、 向量數(shù)據(jù)庫、 OpenAI的API接口、 日志系統(tǒng)和用戶界面六大模塊組成, 如圖2所示。文檔庫是財務(wù)知識庫的核心模塊, 用于存儲財務(wù)領(lǐng)域的相關(guān)知識, 如會計(jì)準(zhǔn)則、 稅法以及財務(wù)理論知識等。組件庫(包含文檔分割、 數(shù)據(jù)連接、 索引構(gòu)建、 查詢接口等相關(guān)組件)用于對文檔庫中的文檔進(jìn)行一系列操作, 將其切分、 加工為計(jì)算機(jī)易于處理的向量格式。向量數(shù)據(jù)庫則用于存儲經(jīng)組件加工而生成的特征向量, 以便后續(xù)高效地依據(jù)文檔相似度進(jìn)行匹配和檢索。OpenAI的API接口是財務(wù)知識庫用于調(diào)用ChatGPT等其他服務(wù)的通道, 從而可以基于ChatGPT的自然語言處理能力, 實(shí)現(xiàn)對用戶問題的解析并給出自然語言形式的回答。日志系統(tǒng)用于記錄用戶的查詢行為和系統(tǒng)的運(yùn)行情況, 以便開展后續(xù)的數(shù)據(jù)分析、 性能優(yōu)化和可追溯審計(jì)。用戶界面是用戶獲得財務(wù)知識庫服務(wù)的系統(tǒng)入口和人機(jī)交互界面。

接下來, 本文將對上述系統(tǒng)架構(gòu)中最為核心的文檔庫、 組件庫中文檔分割組件、 向量數(shù)據(jù)庫展開進(jìn)一步解釋。

1.文檔庫。文檔庫是問答式財務(wù)知識庫最為核心的部分。通常文檔庫至少需包含以下方面的知識: 一是外部的規(guī)章制度, 包括國家和地方政府頒布的各種規(guī)章制度和政策, 以及通行的企業(yè)會計(jì)準(zhǔn)則、 稅法、 會計(jì)人員職業(yè)道德規(guī)范等。二是通用型的財務(wù)知識, 例如財務(wù)經(jīng)典理論知識(會計(jì)恒等式、杜邦分析法、投資組合理論、成本性態(tài)分析法等)和財務(wù)前沿知識(數(shù)電發(fā)票、財務(wù)RPA、智能財務(wù)等)。三是公司財務(wù)部門內(nèi)部總結(jié)的經(jīng)驗(yàn)和知識, 包括財務(wù)人員在日常工作中逐步積累、 總結(jié)和提煉出來的各種財務(wù)管理的技巧、 方法和經(jīng)驗(yàn), 以及財務(wù)管理中一些常見問題和解決方法。

2. 文檔分割組件。受到模型結(jié)構(gòu)、 算力等因素的影響, ChatGPT具有一定的輸入輸出長度限制, 例如GPT-3.5的提問加回答的總長度限制為4096個token, GPT-4擴(kuò)展為32768個token(token是GPT處理文本的基本單位, 指一個句子中的最小詞元, 它可以是一個字、 一個詞或是一個特殊符號)。由于上述限制的存在, 用戶無法將大型文檔一次性發(fā)送給ChatGPT, 文檔分割組件的主要作用是將文檔庫中的大型文檔按照段落、 句子或關(guān)鍵詞等方式進(jìn)行分割, 以便于后續(xù)的向量化操作和問答匹配。

3. 向量數(shù)據(jù)庫。在計(jì)算機(jī)科學(xué)中, 向量數(shù)據(jù)庫是區(qū)別于常規(guī)數(shù)據(jù)庫的一種特殊數(shù)據(jù)庫。常規(guī)數(shù)據(jù)庫以數(shù)據(jù)作為存儲和檢索的對象, 而向量數(shù)據(jù)庫存儲和檢索的對象是計(jì)算機(jī)更容易處理的向量, 并可高效地依據(jù)向量間的相似性進(jìn)行檢索。如果將文檔庫視為一個儲存著海量商品的倉庫, 向量數(shù)據(jù)庫存儲的就是這些商品的“標(biāo)簽”, “標(biāo)簽”與商品間存在著索引關(guān)系, 可以通過“標(biāo)簽”快速地檢索到對應(yīng)商品。

當(dāng)用戶向問答式財務(wù)知識庫提問時, 系統(tǒng)會首先將提問轉(zhuǎn)化為向量表示形式, 并在向量數(shù)據(jù)庫中匹配與該向量最相似的文檔向量, 再根據(jù)索引關(guān)系從文檔庫中提取相應(yīng)的文本段落, 將該段落作為背景知識, 與用戶的提問共同拼裝為提示詞(Prompt)發(fā)送給ChatGPT, 讓ChatGPT基于提示詞里的用戶原始提問以及依據(jù)提問從文檔庫中匹配到的背景知識給出回復(fù)。該方法在提高ChatGPT回答精準(zhǔn)度的同時, 也妥善解除了輸入上限的限制。

(二)財務(wù)知識庫的運(yùn)行過程

本文認(rèn)為, 問答式財務(wù)知識庫的運(yùn)行過程可以分為文檔準(zhǔn)備和用戶問答兩個階段。在文檔準(zhǔn)備階段, 財務(wù)知識庫將各類財務(wù)文獻(xiàn)和報告等信息資源導(dǎo)入文檔庫中, 并通過文檔分割組件和調(diào)用OpenAI的詞句轉(zhuǎn)向量(Word to Vector,Word2vec)API接口, 提取其中的關(guān)鍵信息和特征, 形成文檔的特征向量, 存入向量數(shù)據(jù)庫。在用戶問答階段, 用戶可以通過輸入文本的方式向系統(tǒng)提出問題, 系統(tǒng)將解析用戶的問題并返回最佳答案。在此過程中, 系統(tǒng)會利用向量數(shù)據(jù)庫中存儲的特征向量進(jìn)行相似度匹配和檢索, 以確保返回的答案盡可能準(zhǔn)確和全面。兩階段的具體流程如圖3所示。

1. 第一階段: 文檔準(zhǔn)備階段。文檔準(zhǔn)備階段主要是對文檔庫里的文本進(jìn)行預(yù)處理, 包括轉(zhuǎn)換格式、 分割、 使用OpenAI的Word2vec功能把文本轉(zhuǎn)換成向量。各環(huán)節(jié)的具體操作如下:

(1)轉(zhuǎn)換文檔格式。由于ChatGPT是一個基于NLP(Natural Language Processing,自然語言處理)的大語言模型, 比較擅長理解文本語言, 所以如果文檔庫里存在PDF格式的文檔或電子表格數(shù)據(jù), 則需轉(zhuǎn)換為純文本格式以便ChatGPT理解。以轉(zhuǎn)換Excel電子表格為例, 可以把電子表格另存為csv格式, 這樣電子表格的表頭和每一行的數(shù)據(jù)信息就被轉(zhuǎn)化為一串以逗號隔開的文本。

(2)分割文檔。如前文所述, ChatGPT一次對話可處理的token數(shù)量存在上限, 對于大文檔就需要使用文檔分割組件將其分割成小塊(chunk)。此外, 為了滿足每個小塊都有完整語義的要求, 在分割過程中要使用技術(shù)手段保證塊與塊之間存在一些重合。

(3)使用OpenAI的Word2vec功能把小塊(chunk)的文本轉(zhuǎn)換成向量, 用以表達(dá)該段文本的語義, 處理完成后再將計(jì)算出來的向量存入向量數(shù)據(jù)庫。

2. 第二階段: 用戶問答階段。從用戶向財務(wù)知識庫發(fā)起提問到最后系統(tǒng)將回答呈現(xiàn)在用戶界面的全過程中, 系統(tǒng)內(nèi)部經(jīng)歷了如下流程: ①尋找最相關(guān)文本。系統(tǒng)調(diào)用OpenAI的Word2vec功能把用戶提問文本轉(zhuǎn)換成向量, 通過相似度計(jì)算, 從向量數(shù)據(jù)庫中匹配最相關(guān)的文本向量。②依據(jù)向量數(shù)據(jù)庫和文檔庫間的索引, 查詢相應(yīng)的背景知識。③將背景知識和提問組合成提示詞(Prompt), 通過接口傳輸至ChatGPT。④系統(tǒng)把提示詞發(fā)給ChatGPT, 在獲得ChatGPT的回答后, 將回答呈現(xiàn)至用戶界面。

(三)財務(wù)知識庫的日常維護(hù)

問答式財務(wù)知識庫構(gòu)建后, 后續(xù)還可能面臨外部會計(jì)準(zhǔn)則和稅務(wù)法規(guī)更新、 新文檔入庫以及舊文檔廢棄等情況, 此時就需要建立知識庫的維護(hù)規(guī)范, 持續(xù)對文檔庫進(jìn)行更新。

首先, 在知識入庫時需要對文檔進(jìn)行分類管理, 制定標(biāo)準(zhǔn)化的入庫流程, 以確保知識能夠被高效地記錄和管理。為了保證高頻更新文檔的入庫效率, 可以采用RPA技術(shù), 通過批量下載法規(guī)文檔或者對文檔進(jìn)行預(yù)處理的方法, 將知識快速地錄入文檔庫中。以RPA輔助稅務(wù)法規(guī)入庫為例, RPA可以定期訪問指定網(wǎng)站, 先瀏覽并抓取法規(guī)清單內(nèi)容(包括法規(guī)的標(biāo)題、 正文、 發(fā)布日期等), 再將抓取到的法規(guī)清單與在庫法規(guī)清單對比以形成一張新增法規(guī)清單, 之后依據(jù)新增法規(guī)清單逐個瀏覽法規(guī)頁面、 抓取法規(guī)內(nèi)容并寫入一個文本文檔, 再通過RPA把本次下載的法規(guī)文本文檔上傳到財務(wù)知識庫的文檔庫里, 最后RPA更新在庫法規(guī)清單以便用于下次比對。

其次, 知識更新和棄用也是財務(wù)知識庫維護(hù)的重要方面。在知識更新方面, 可以利用RPA技術(shù)定期檢查法規(guī)的有效狀態(tài), 確保知識庫中的信息始終保持最新、 準(zhǔn)確和可靠。而在知識棄用方面, 需要確保知識庫中的信息經(jīng)過充分的篩選和審核, 將不再適用或不準(zhǔn)確的信息標(biāo)記為棄用, 以避免給用戶帶來誤導(dǎo)或困擾。

五、 H公司問答式財務(wù)知識庫ChatDoc實(shí)踐案例

(一)案例背景

H公司是我國領(lǐng)先的科技公司, 聚焦于為各行各業(yè)客戶提供數(shù)字化解決方案, 助力客戶數(shù)字化轉(zhuǎn)型, 為客戶持續(xù)創(chuàng)造價值, 多年來在數(shù)字化方面積累了大量經(jīng)驗(yàn)。作為財務(wù)數(shù)字化轉(zhuǎn)型的持續(xù)探索者, H公司目前已應(yīng)用多種數(shù)字化技術(shù)構(gòu)建起一套先進(jìn)的財務(wù)管理體系。隨著ChatGPT的推出, H公司同時成立了多個項(xiàng)目組對其應(yīng)用積極地展開探索, 問答式財務(wù)知識庫ChatDoc是其中的一個項(xiàng)目。通過該項(xiàng)目, H公司旨在提升財務(wù)人員檢索知識的精度和效率。

(二)ChatDoc的系統(tǒng)結(jié)構(gòu)

H公司搭建的問答式財務(wù)知識庫架構(gòu)圖如圖4所示。

ChatDoc的系統(tǒng)組件包括: OpenAI的Embedding模型(用于實(shí)現(xiàn)前文所述的詞句轉(zhuǎn)向量功能)、 ChatGPT模型(負(fù)責(zé)基于問題和背景知識給出回復(fù))、 LlamaIndex組件(負(fù)責(zé)讀取并切割文檔資料, 構(gòu)建索引, 檢索并匹配向量相似度, 查詢并轉(zhuǎn)接信息)、 文檔庫(負(fù)責(zé)存儲文檔資料)、 向量數(shù)據(jù)庫(負(fù)責(zé)存儲文本信息的向量)。

1. 知識庫的運(yùn)行過程。H公司ChatDoc系統(tǒng)的運(yùn)作過程如下: ①文檔庫管理員通過財務(wù)知識庫用戶交互界面上傳文檔到文檔庫。②LlamaIndex讀取文檔資料, 把長文檔切割成小塊文本信息, 并建立索引。③LlamaIndex把小塊文本信息發(fā)給OpenAI的Embedding模型, 并接收被Embedding模型轉(zhuǎn)換好的文本向量。④LlamaIndex把文本向量按照之前建立的索引存入向量數(shù)據(jù)庫, 以備用戶提問時查詢使用。⑤用戶通過用戶交互界面提出問題。⑥LlamaIndex把用戶問題發(fā)給OpenAI的Embedding模型, 并接收被Embedding模型轉(zhuǎn)換好的用戶問題文本向量。⑦LlamaIndex根據(jù)問題文本向量, 從向量數(shù)據(jù)庫中找到相似度高的文本向量。⑧LlamaIndex把用戶問題文本與文檔文本組合成提示詞發(fā)給ChatGPT模型, 并接收ChatGPT的回復(fù)。⑨用戶在用戶交互界面接收到問題的答案。

從以上運(yùn)行過程中可以發(fā)現(xiàn), 最終發(fā)給ChatGPT的提示詞(Prompt)不僅包含用戶最初輸入的提問文本, 還包括從文檔庫中檢索出的背景知識。此外, 為了盡可能規(guī)范ChatGPT的回答, 保證輸出結(jié)果的穩(wěn)定性, H公司還在知識庫中內(nèi)置了固定的Prompt模板, 該模板規(guī)定了ChatGPT回答的格式、 依據(jù)和方式。在此基礎(chǔ)上, 將用戶原提問、 從文檔庫中檢索出的背景知識、 固定的Prompt模板三者組合成最終的組合提示詞。組合提示詞的實(shí)例如下:

(固定的Prompt模板)你是一個提供財務(wù)咨詢的專家。你會拿到下面的一段背景知識和一個問題。請基于這些上下文提供一個對話形式的回復(fù)。如果你在這些上下文中找不到答案, 就說“對不起, 我不知道答案。”不要編造答案。如果這個問題與上下文的內(nèi)容無關(guān), 那么就禮貌地回復(fù)你被訓(xùn)練的能力是只能回復(fù)與上下文有關(guān)的問題。請用中文回復(fù)。背景知識和提問信息如下所示:

上述組合提示詞里第一段為固定模板, 背景知識文本和用戶問題文本是LlamaIndex在每次用戶提問后插入進(jìn)去的文本, 其中背景知識文本是借助向量相似度運(yùn)算從文檔庫里匹配出來的。如此一來, 就可以讓ChatGPT基于本地文檔庫進(jìn)行回答, 從而使得ChatGPT在回復(fù)用戶提問時給出一個更加理想的答案。

2. 用戶交互界面的設(shè)計(jì)。ChatDoc的用戶交互界面被設(shè)計(jì)成文檔列表區(qū)、 文檔內(nèi)容展示區(qū)和問答區(qū)三個部分。在文檔列表區(qū), 用戶可以上傳文檔, 并可查看文檔索引的狀態(tài), 在系統(tǒng)完成對文檔的索引后, 用戶就可以選擇多個文檔, 并且基于這些文檔進(jìn)行提問。在文檔內(nèi)容展示區(qū), 用戶可以查看文檔內(nèi)容預(yù)覽。在問答區(qū), 用戶可以提出問題, 問題會被實(shí)時展示在對話框里, 在短時間的延遲后, 用戶就能獲得回復(fù)。

(三)ChatDoc的應(yīng)用場景

1. 實(shí)現(xiàn)公司財務(wù)制度查詢。ChatDoc可作為智能財務(wù)客服, 幫助員工便捷、 迅速地查詢和理解公司的財務(wù)政策, 常用場景包括: ①報銷查詢: 員工經(jīng)常需要報銷工作相關(guān)的餐費(fèi)、 差旅費(fèi)等費(fèi)用, 用戶可通過ChatDoc查詢公司報銷政策涉及的細(xì)節(jié), 如可供報銷的費(fèi)用類別、 差標(biāo)額度、 出差天數(shù)計(jì)算方式、 所需提供證明等。②薪資政策查詢: 員工可以向ChatDoc提問薪資的計(jì)算方式、 發(fā)放日期、 稅務(wù)處理等薪資政策相關(guān)問題。

2. 實(shí)現(xiàn)會計(jì)準(zhǔn)則、 稅法精準(zhǔn)溯源。目前直接使用ChatGPT進(jìn)行會計(jì)準(zhǔn)則、 稅法查詢時, 由于其本身訓(xùn)練數(shù)據(jù)的限制, 會導(dǎo)致ChatGPT回答我國企業(yè)會計(jì)準(zhǔn)則和稅法相關(guān)問題時出現(xiàn)憑空捏造準(zhǔn)則、 法規(guī)的情況, 該問題嚴(yán)重影響了ChatGPT在應(yīng)用于財務(wù)實(shí)務(wù)工作時的可信度。H公司的ChatDoc在回答準(zhǔn)則和稅法相關(guān)問題時可精準(zhǔn)溯源回答所參考的準(zhǔn)則或法規(guī), 包括它是在哪個文件中提及的, 是由哪個機(jī)構(gòu)發(fā)布的, 以及發(fā)布和修改的日期等信息。

3. 實(shí)現(xiàn)跨文檔查詢。跨文檔查詢是指用戶可在ChatDoc文檔列表區(qū)同時勾選多個文件, 讓ChatDoc綜合參考多個文件給出回答。例如, 在進(jìn)行投資決策時, 財務(wù)人員需要對多份公司財報、 行業(yè)報告等進(jìn)行對比分析。通過跨文檔查詢, 財務(wù)人員可以更全面地理解信息, 從而做出更明智的投資決策。又如, 在進(jìn)行會計(jì)分錄編制時, 會計(jì)人員需綜合考慮準(zhǔn)則要求、 適用稅率、 業(yè)務(wù)背景等相關(guān)文檔, 通過跨文檔查詢, ChatDoc可在綜合考慮以上信息的情況下給出編制某一業(yè)務(wù)相關(guān)會計(jì)分錄的參考建議。有研究表明, 目前ChatGPT受限于邏輯能力, 在中文語境下, 其分錄編制能力大約在中級會計(jì)師水平, 因此在上述場景中ChatGPT難以勝任較為復(fù)雜的分錄編制場景。

4. 實(shí)現(xiàn)財務(wù)專業(yè)理論查詢。ChatDoc可用于專業(yè)財務(wù)理論的查詢, 如財務(wù)理論(有效市場假說、莫迪格利亞尼—米勒定理等)、 投資理論(現(xiàn)代投資組合理論、CAPM模型等)、 財務(wù)模型(貝塔系數(shù)、DCF模型等)。ChatDoc還可在此基礎(chǔ)上提供實(shí)例對理論給出進(jìn)一步闡釋, 以便于財務(wù)人員理解。

5. 對公開財報進(jìn)行分析。目前, ChatDoc支持用戶上傳pdf、 xlsx、 csv格式的報表文件, 并可進(jìn)行初步的財務(wù)報表比率分析(營利性分析、流動性分析、償債能力分析、杜邦分析等)和趨勢分析。

(四)ChatDoc的實(shí)踐成效

H公司通過將ChatDoc小范圍投入測試并搜集反饋后發(fā)現(xiàn), 基于ChatGPT的問答式財務(wù)知識庫彌補(bǔ)了原有基于搜索引擎和內(nèi)部知識庫的知識檢索模式存在的不足, 能為用戶提供更精準(zhǔn)的答案, 使用戶獲得更佳的使用體驗(yàn)。具體表現(xiàn)在如下方面:

首先, ChatDoc可以更精確地理解用戶的問題和意圖, 提供更為精準(zhǔn)的答案。傳統(tǒng)的知識庫系統(tǒng)往往只能匹配用戶輸入的關(guān)鍵詞, 無法理解用戶的意圖和上下文, 用戶往往需要多次嘗試才能得到滿意的答案。而ChatDoc則可以憑借ChatGPT的自然語言理解能力, 更好地理解用戶意圖。這不僅有利于提高用戶的滿意度, 還能節(jié)省用戶的時間和精力。

其次, ChatDoc能夠提供更加個性化的答案。傳統(tǒng)的知識庫系統(tǒng)往往只能列出相關(guān)的規(guī)則和條款, 而無法根據(jù)用戶輸入的問題給出符合實(shí)務(wù)場景的答案。ChatDoc不僅可以提供個性化的答案, 還可以根據(jù)規(guī)則庫中的知識, 給出一個詳細(xì)的邏輯推理過程, 用戶可以通過查看推理過程來判斷答案的可靠性。

最后, ChatDoc減輕了財務(wù)人員的工作壓力。在財務(wù)日常工作中, H公司財務(wù)人員除了需承擔(dān)本職工作, 還要為公司員工提供有關(guān)報銷政策、 報銷進(jìn)度等方面的咨詢服務(wù)。通過ChatDoc, 員工可以便捷地咨詢報銷制度等內(nèi)容, 這種自助查詢服務(wù)將減輕財務(wù)人員的工作壓力。例如, 員工可以在知識庫中查詢報銷規(guī)則和計(jì)算出差天數(shù)的方法, 無須等待人工客服的回復(fù)。這種自助服務(wù)不僅可以提高效率, 也可以提高員工對公司財務(wù)規(guī)則的理解和遵守程度。同時, H公司還將ChatDoc集成到辦公軟件中, 用戶可隨時隨地通過手機(jī)、 電腦接入ChatDoc自助獲取服務(wù)。

在研究中, H公司還注意到, 當(dāng)前ChatGPT本身能力的不足也在一定程度上限制了ChatDoc的價值發(fā)揮, 具體體現(xiàn)在如下方面: ①ChatGPT對文本以外的資料理解并不好, 比如在處理復(fù)雜表格數(shù)據(jù)時存在取數(shù)不準(zhǔn)的問題, 在編制復(fù)雜會計(jì)分錄時會存在邏輯錯誤, 這會影響財務(wù)報表編制和財務(wù)分析相關(guān)知識問答的效果。②H公司也注意到用戶提問的提示詞(Prompt)對于答案的可靠性至關(guān)重要。用戶就同一個問題使用不同的提示詞, 從財務(wù)知識庫中獲得的答案有時是對的, 有時是錯的。甚至在使用相同提示詞時也會出現(xiàn)答案不一致的情況, 這種情況被學(xué)界稱為“大模型幻覺”。對此, H公司通過加入要求ChatGPT給出推理過程和嚴(yán)格依據(jù)背景知識的提示詞, 以便用戶核實(shí)所獲得答案的可靠性。

六、 結(jié)論與展望

(一)結(jié)論

本文創(chuàng)新性地將ChatGPT應(yīng)用于問答式財務(wù)知識庫的構(gòu)建, 并通過理論框架搭建和案例研究驗(yàn)證了該方法的有效性和實(shí)用性。通過研究得到以下結(jié)論: ①設(shè)計(jì)基于文檔庫、 組件庫、 向量數(shù)據(jù)庫、 OpenAI接口、 日志系統(tǒng)、 用戶界面的體系框架是當(dāng)前階段構(gòu)建基于ChatGPT的問答式財務(wù)知識庫行之有效的一種方式。②基于ChatGPT構(gòu)建財務(wù)知識庫可以提高財務(wù)知識的管理效率和問答的可靠性, 還可以實(shí)現(xiàn)動態(tài)知識更新, 從而保證知識庫的時效性和全面性, 為財務(wù)人員和其他領(lǐng)域的從業(yè)者提供更加高效和準(zhǔn)確的知識管理和智能問答服務(wù)。

(二)展望

財務(wù)部門作為連接企業(yè)采購、 生產(chǎn)、 運(yùn)營、 銷售等經(jīng)營行為的關(guān)鍵樞紐, 匯集并管理著企業(yè)從業(yè)務(wù)前端到財務(wù)管理后端的海量核心機(jī)密數(shù)據(jù), 因此在基于ChatGPT構(gòu)建財務(wù)知識庫的過程中, 數(shù)據(jù)安全必須引起高度重視。盡管文檔庫和向量數(shù)據(jù)庫可以儲存在企業(yè)本地, 但是在問答過程中系統(tǒng)會把提取的文本發(fā)給ChatGPT, 雖然OpenAI承諾不會使用這些數(shù)據(jù)用于訓(xùn)練, 但不能保證數(shù)據(jù)在傳輸過程中不會發(fā)生泄露。本文認(rèn)為, 解決該問題的第一種可行方案是嚴(yán)格限制可納入文檔庫的資料范圍, 對機(jī)密資料進(jìn)行脫敏處理后再納入文檔庫。第二種可行方案是將ChatGPT替換成其他可以本地化部署的大模型, 從而使得所有的文檔和傳輸均在企業(yè)本地, 然而, 企業(yè)本地化部署大模型的硬件成本、 軟件成本疊加服務(wù)成本通常在千萬元級別, 企業(yè)需要權(quán)衡成本收益后審慎決定。數(shù)據(jù)安全是財務(wù)系統(tǒng)建設(shè)的紅線和底線, 未來企業(yè)知識庫的建設(shè)要注意守住底線、 提升上限、 優(yōu)化體驗(yàn), 朝著助力財務(wù)人員轉(zhuǎn)型升級、 賦能財務(wù)管理的大方向穩(wěn)步探索。

【 主 要 參 考 文 獻(xiàn) 】

陳虎,郭奕.?dāng)?shù)據(jù)價值體系推動財務(wù)數(shù)字化轉(zhuǎn)型[ J].財會月刊,2022(8):37 ~ 42.

金源,李成智.ChatGPT+Acctech:ChatGPT對會計(jì)科技的影響研究[ J].商業(yè)會計(jì),2023a(7):4 ~ 10.

金源,李成智.ChatGPT對智能財務(wù)體系的影響:場景優(yōu)化、技術(shù)革新與人員轉(zhuǎn)型[ J].財會月刊,2023b(15):23 ~ 30.

金源,李成智.?dāng)?shù)據(jù)驅(qū)動下的財務(wù)決策支持研究[ J].財會通訊,2023c(3):140 ~ 147.

劉勤,楊寅.改革開放40年的中國會計(jì)信息化:回顧與展望[ J].會計(jì)研究,2019(2):26 ~ 34.

劉勤.ChatGPT及其對會計(jì)工作的影響探討[ J].會計(jì)之友,2023(6):158 ~ 161.

劉勤.智能財務(wù)中的知識管理與人機(jī)協(xié)同[ J].財會月刊,2021(24):15 ~ 19.

主站蜘蛛池模板: 欧美一区二区三区不卡免费| 国产尤物视频在线| 国产成人乱无码视频| 亚洲三级成人| 国产精品久久久精品三级| 久久情精品国产品免费| 97视频精品全国免费观看| 99国产精品国产高清一区二区| 毛片a级毛片免费观看免下载| 四虎亚洲国产成人久久精品| 97视频免费在线观看| 久久不卡精品| 毛片免费高清免费| 欧美日韩久久综合| 精品无码人妻一区二区| 亚洲无码熟妇人妻AV在线| 又粗又大又爽又紧免费视频| 无码网站免费观看| 久久久黄色片| 欧美色图第一页| 亚洲无码37.| a级毛片免费播放| 青青草原国产免费av观看| 亚洲成人高清在线观看| 97青草最新免费精品视频| 亚洲熟女偷拍| 久久semm亚洲国产| 黄色网站不卡无码| 欧美一区二区福利视频| 亚洲国产成熟视频在线多多| 亚州AV秘 一区二区三区| 亚洲欧美日韩成人高清在线一区| 亚洲女同一区二区| 日韩高清欧美| 国产爽爽视频| www.亚洲色图.com| 九色在线观看视频| 亚洲一区二区三区麻豆| 欧美性精品| 日韩黄色精品| 91在线国内在线播放老师| 久久精品人人做人人爽| 麻豆国产在线观看一区二区| 亚洲精选高清无码| 色综合a怡红院怡红院首页| 色久综合在线| 99热在线只有精品| 91网在线| 国模极品一区二区三区| 国产簧片免费在线播放| 亚洲日本一本dvd高清| 激情在线网| 77777亚洲午夜久久多人| 69av在线| 无码视频国产精品一区二区| 国产熟女一级毛片| 国产精品hd在线播放| 色婷婷综合在线| 伊人久久综在合线亚洲91| 欧美日韩国产综合视频在线观看 | 亚洲国产AV无码综合原创| 日本三区视频| 在线一级毛片| 国产成人免费| 2022国产91精品久久久久久| 91精品亚洲| 999国产精品| 浮力影院国产第一页| 亚洲中文无码av永久伊人| 99热最新网址| 国产成人8x视频一区二区| 综合人妻久久一区二区精品| 欧美中出一区二区| 欧美区国产区| 在线观看国产小视频| 婷婷五月在线| 一边摸一边做爽的视频17国产 | 一本一道波多野结衣av黑人在线| 毛片手机在线看| 九九久久精品免费观看| 欧美日本激情| 97在线免费|