999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于增強大模型的稅收知識問答系統設計探究

2025-05-27 00:00:00徐邵兵
電腦知識與技術 2025年12期

摘要:文章針對當前稅收政策變化頻繁,學習難度加大的問題,設計并實現了一套基于知識圖譜增強的大模型稅收知識問答系統。該系統能夠從多源采集稅收政策數據,構建稅收知識圖譜,并結合大模型技術實現稅收知識問答,為各類涉稅人員學習培訓提供專家級支持。

關鍵詞:大模型;知識圖譜;稅收知識問答;試卷生成

中圖分類號:TP391" " " 文獻標識碼:A

文章編號:1009-3044(2025)12-0040-04

開放科學(資源服務) 標識碼(OSID)

0 引言

當前,隨著我國經濟結構的大規模調整和升級,必然導致各類稅收政策不斷變化和更新,快速變化的稅收政策導致廣大稅務人員開展政策解讀的學習難度不斷加大,也使得廣大社會中介機構和企業財會人員學習培訓難度不斷增加。如何能夠從快速變化的眾多稅收政策中快速獲取關鍵知識點,并構建出穩健的基于稅收知識問答[1]的學習培訓機制,成為當前各級稅務機關亟待解決的難題。為了解決這一難題,借助當下正在興起的大模型技術和知識圖譜算法,本文設計了一個基于知識圖譜[2]增強的大模型稅收知識問答系統,旨在快速、精準地從海量稅收政策中抽取關鍵知識點[3],形成問答試卷,指導各類涉稅人員深入、方便、快捷地學習各類政策變化知識。

1 系統需求分析

1.1 用戶分析

系統面向各級稅務機關教育培訓考試管理者,稅政管理部門稅收政策解釋執行人員,以及社會各類中介機構和企業財會人員。稅務機關教育培訓管理者需要針對不同的培訓班的需求通過系統開展培訓考試出卷工作。稅務機關稅政管理部門人員通過系統快速尋找新舊政策變化關鍵點,為基層稅務機關一線執法人員提供政策口徑權威解釋支持。社會中介機構和企業財會人員通過系統進行稅收政策知識問答,便于相關人員迅速學習最新的稅收業務知識及各類稅收優惠政策的精髓[4],使得各類稅收優惠政策在廣大納稅人中及時落地,讓納稅人盡享優惠,為中小微企業發展壯大提供有效支持。

1.2 功能需求分析

1) 數據采集功能。系統通過爬蟲、ETL工具等方式實現從多個數據來源(如財政部、稅務總局以及各省級稅務局網站獲取最新的稅收政策公告信息,以及各類信息系統政策法規庫數據) 采集稅收政策數據,為數據處理功能提供源數據。同時系統具備手動導入各類文本數據功能,以處理無法自動采集的數據。

2) 數據處理功能。系統具備對各類數據進行清洗、轉換和針對本系統的標準化處理功能,如缺失值處理、重復項刪除、異常值處理、文件類型轉換等,并實現了對所有政策文件進行多來源相互佐證和校驗,確保數據的一致性、完整性和準確性,進一步確保獲取的各類稅收政策數據的權威性,為智能分析功能提供標準化數據。

3) 智能分析功能。系統使用知識圖譜算法對輸入的各類稅收政策進行智能分析,獲取各類關鍵知識,構建稅收政策知識圖譜,并為大模型問答和推理能力提供支持,實現基于知識圖譜的大模型增強[5]。系統通過大模型的人機交互,實現智能獲取相關知識答案,并自動開展關鍵知識的試卷出題工作。系統通過大量的稅收政策變化訓練,為結果展示功能提供最佳的問答和出卷效果。

4) 結果展示功能。系統包含人機對話模塊,實現以消息模式展示問答結果,支持以試卷文檔形式展示出卷結果。系統實現分稅種、分行業、分主題進行問答和出卷,并提供試卷導出功能,便于后期編輯、打印和考試使用。

5) 系統維護功能。系統具備用戶、權限、日志管理等功能,實現用戶注冊、權限分配、日志記錄,以保證系統運行過程中的各類問題的記錄、發現、跟蹤和解決。另外,系統還具有較為完備的數據備份功能,能夠定期、定量開展重要數據的全量、增量備份工作。

2 系統設計構建

2.1 系統架構

本系統采用前后端分離的設計思想,前端使用Java Spring Boot和Vue開發網頁端[6]。后端使用Graph?RAG框架提供數據服務。前后端通過Axios進行通信,確保數據的實時更新和共享。

2.2 功能模塊

基于知識圖譜增強大模型的稅收知識問答系統主要由稅收政策數據采集模塊、稅收政策分析模塊、人機交互三大主要模塊搭建而成。三個主要模塊又分別包含爬蟲獲取、ETL工具獲取、手工導入、數據預處理、圖譜構建、大模型加載、知識問答、試卷出卷等9個子功能模塊,具體如圖1所示。

1) 稅收政策數據采集模塊是整個系統的數據來源,主要包括網絡爬蟲獲取、ETL工具、手工導入等三個部分,實現三種數據獲取方式分別為:使用網絡爬蟲技術(Python的Scrapy) 獲取各類官方網站公開的最新稅收政策數據;使用ETL工具(ODI) 與稅務機關的政策法規庫對接,獲取大量的結構化的稅收政策數據;使用手工導入的方式將各類稅收政策文件單個或批量導入系統。通過以上各種方式采集到的數據被分類別統一存儲到稅收政策數據庫(Oracle) 中,方便系統對其進行后續處理。

2) 稅收政策分析模塊是整個系統的核心,負責對稅收政策數據采集模塊采集的各類數據進行預處理,通過缺失值處理(刪除、填充、插值) 、異常值處理(刪除、修正、分箱) 、重復數據處理(刪除、合并) 對數據進行清洗,通過標準化、離散化方法對數據進行轉化,通過分詞、去除停用詞、詞干提取、詞袋模型等對文本數據進行預加工,形成標準化稅收政策數據。針對統一標準的數據,構建稅收政策知識圖譜,從數據中提取實體和關系構建出結構化的知識表示。在知識圖譜的基礎上引入大模型,并將知識圖譜生成的增強提示、推理結果輸入給大模型,通過大模型為人機交互提供后臺支持。

3) 人機交互是整個系統的結果展現部分,主要包括知識問答和試卷出題兩個部分。本模塊具有可視化展示功能,使用Vue作為前端框架,通過HTTP請求與后端交互,實現人機交互的知識問答;使用瀏覽器原生API生成并下載文本文件,以及實現人機交互的試卷生成和有關文本導出功能,便于各類涉稅人員的便捷使用。

2.3 基于知識圖譜增強的大模型問答

通過組織和結構化垂直領域的知識,知識圖譜可為大模型提供執行準確問答和推理的能力,有助于避免大模型的幻覺問題[7]。本文面向稅務政策構建稅務知識圖譜,并將其應用于大模型增強,如圖2所示。

①基于稅收政策數據構建稅收政策圖譜;②對用戶問題進行意圖分析,提取問題模式;③根據用戶意圖從圖譜中檢索出相關信息[8];④對問題模式與用戶意圖相關信息進行查詢、對齊和修剪;⑤輸入大模型生成相關結果。

1) 稅務知識圖譜構建。一是文檔解析和知識抽取。通過自然語言處理技術(NLP) 識別和提取文檔中的關鍵信息,對稅收政策公告和通知、政策培訓講解、政策問答等非結構化數據進行解析,識別實體(如稅種、納稅人、優惠) 和關系(如納稅人與優惠的關聯) ,如命名實體識別(NER) 和關系抽取模型,確保知識圖譜中節點和邊的準確性。二是知識消歧。解決同義詞、多義詞和領域術語的混淆問題,確保知識語義一致。①同義詞歸一:如“個稅”和“個人所得稅”映射為同一實體;②多義詞消歧:結合上下文區分術語含義,例如“所得稅”是“個人所得稅”還是“企業所得稅”。通過構建行業知識詞典和消歧模型,實現精準的知識匹配和標注。三是實體與關系梳理。實體梳理包括確定實體類別、定義實體屬性和建立實體層級結構;關系梳理包括確定關系類型、定義關系屬性和知識網格化。制定實體和關系的標準化規則,為稅收政策知識管理和應用提供堅實基礎。四是結合大模型的知識圖譜自動構建。利用大模型的強大語言理解能力,對稅收政策的公告、通知、政策培訓講解等進行深度解析,將海量非結構化數據自動轉化為結構化知識。完成實體抽取,關系抽取以及實體消歧后實現知識圖譜的節點、邊的生成和層次化構建。

2) 知識圖譜的增強檢索。本項目采用GraphRAG技術來實現圖譜的增強檢索,通過將知識圖譜與語言模型相結合,利用圖譜中的結構化信息來補充和引導語言模型的生成過程。例如,GraphRAG采用了檢索增強生成的策略,首先利用預定的prompt使大模型對輸入的文本進行實體關系提取、構建知識圖譜、對知識圖譜進行社區檢測和劃分并利用大模型生成社區摘要。在回答全局問題時,利用生成的多層次的社區摘要實現回答綜合性問題的能力。

3) 知識圖譜應用于大模型增強。當用戶進行問答時,用戶的輸入首先通過嵌入模型轉化為高維語義向量,這些向量能夠深入捕捉輸入文本的語義含義、上下文關系以及潛在的隱含信息。隨后,系統使用檢索算法檢索知識圖譜中相關的信息,檢索粒度可以是節點、三元組、子圖等。系統識別出的相關節點及其上下文信息與用戶的原始問題相結合,生成一個包含豐富背景知識和上下文信息的增強提示。并將這些信息反饋給大模型,為大模型生成答案提供素材,避免大模型的幻覺。從而做到針對用戶問題先檢索相關知識,再輔助模型作答,讓系統回答更貼合需求,有效增強實際應用效果。

3 系統應用成效

3.1 數據準備

為了充分驗證系統可用性,本文使用第二種(ETL) 數據獲取方式從某省級稅務機關的政策法規庫獲取了1.2 TB的稅收政策數據,使用缺失值處理、重復項刪除、異常值處理等方式對數據進行預處理。例如對于城建稅申報期限缺失,可使用統計值填充法統計其他稅種的申報期限進行缺失值處理;例如對于增值稅稅率,使用重復項刪除法刪除不同時期的稅率,保留最近時間的稅率等,為本系統構建基礎政策數據庫,為構建稅務政策知識圖譜提供數據支撐。同時,針對政策法規庫更新相對滯后,本文重點收集了最新且與個人相關性較大的個人所得稅政策部分的稅收政策文本文件,共涉及專項附加扣除、個人股權轉讓、科技轉化、通訊費補貼、年金等17個大類136個政策文件(共0.6 TB) ,通過手工批量導入的方式進行數據采集,并對導入文本進行停用詞去除(按時間排序類似的往期個稅政策) 、分詞(使用與稅收元數據詞典正向最大匹配法) 、詞性標注等處理方式對文本數據進行相應的預處理。

3.2 結果展示

一是知識問答。通過輸入當前個人最感興趣的個稅問題,尋求系統給出最佳答案,也可以針對某個特定政策文件進行專項問答。通過采用相關政策文件名+問題模式對系統進行提問,系統能夠更加精準地回答相關問題。圖3展示了系統選擇ChatGPT或本地模型進行問答的界面。

可以通過模型選擇按鈕(紅框標注) 選擇ChatGPT或本地模型來實現模型選擇的切換。為了驗證系統準確性,邀請稅務專家擬定相關熱點問題對系統進行提問,并對回答結果逐個與最新政策文件及官方政策執行解釋對比評測。稅務專家先后挑選了112個熱點個稅問題對系統進行專項提問,110個問題回答完全正確;2個問題回答基本準確,存在表述不完整的情況;由此可得出整個系統問題回答準確率達到98.2%,值得使用者充分信賴。

二是試卷出題。通過手工輸入有關指令,要求系統就個人所得稅專項附加扣除部分進行專項批量出題,試卷出題標準為單項選擇題30題、多選題10題,判斷題10題。指令輸入后,系統會根據指令內容,通過大模型增強能力完成試卷專項出題工作。如圖4所示,系統生成并導出的試卷使用文字編輯軟件打開,并可進行二次編輯以便于打印使用。

本文也對系統出題情況進行了大量數據測試工作,先后就企業所得稅、增值稅、消費稅專題,按照稅收政策針對不同的國民經濟行業門類進行隨機組合出卷12套,共出題600多個,并對出題質量邀請稅務專家進行逐題與實際政策及解釋進行對比定性分析,準確率達到99.8%。個別題目準確率欠缺的原因不是題目問答錯誤,而是題目與出題主題稍有偏差,關聯度不夠緊密。

4 結論與展望

基于知識圖譜識別技術與大模型技術的稅收知識問答系統是一套框架通用,且算法精度高的稅收知識問答系統,能夠為各類涉稅人員提供一套使用快捷的稅收政策變化知識培訓系統和日常在線稅收政策問答專家。但系統還存在一些不足之處,如系統對于海量數據的裝載、計算能力有待提升,系統支持同時在線用戶規模需要提升,語音交互模式缺失等。未來將通過使用分布式數據庫進一步提升數據裝載、系統計算和在線用戶規模支持能力;通過部署OpenAI的Whisper-large-v3實現語音交互功能,進一步提升系統多方面能力和使用便利性,為各類用戶提供高效、快捷、準確的稅收政策知識服務。

參考文獻:

[1] 稅收知識問答[J].遼寧財稅,2003(7):57.

[2] 吳信東,白婷,張杰,等.知識圖譜[M].北京:科學出版社,2022.

[3] 李敬燦,肖萃林,覃曉婷,等.基于大語言模型與語義增強的文本關系抽取算法[J].計算機工程,2024,50(4):87-94.

[4] 黃紀強.稅收優惠政策協同與企業綠色轉型[J].稅收經濟研究,2024,29(5):39-47.

[5] 馮拓宇,李偉平,郭慶浪,等.大語言模型增強的知識圖譜問答研究進展綜述[J].計算機科學與探索,2024,18(11):2887-2900.

[6] 朱芊慧,劉風華,錢進,等.基于Spring Boot+Vue技術的煤礦安全培訓后臺設計與實現[J].現代信息科技,2024,8(18):116-119,124.

[7] 李思蒙.減輕語言模型中的幻覺:知識圖譜的力量[J].科學與信息化,2023(23):90-92.

[8] 金嘉暉.面向大規模知識圖譜的分布式查詢技術研究[D].南京:東南大學,2015.

【通聯編輯:謝媛媛】

主站蜘蛛池模板: 亚洲欧美激情小说另类| 国产第二十一页| 国产av一码二码三码无码 | 国产一级一级毛片永久| 无码有码中文字幕| 欧美一区国产| 日韩精品欧美国产在线| 国内精品免费| 久久香蕉国产线看观看亚洲片| 国产亚洲精品自在线| 毛片久久久| 国产精品毛片一区视频播| 成年午夜精品久久精品| 亚州AV秘 一区二区三区| 成人午夜视频网站| 婷婷午夜影院| 国产精品对白刺激| 日韩色图在线观看| 成人免费一区二区三区| 久久精品国产精品青草app| 成色7777精品在线| 在线观看av永久| 日韩精品毛片人妻AV不卡| 国产微拍一区| 日韩不卡免费视频| 亚洲AⅤ综合在线欧美一区| 在线色国产| 久久狠狠色噜噜狠狠狠狠97视色| 国产亚洲欧美在线视频| 成人免费黄色小视频| 免费无码网站| 免费视频在线2021入口| 亚洲三级视频在线观看| 欧美.成人.综合在线| 五月激情婷婷综合| 亚洲天堂视频在线免费观看| 国产精品999在线| 福利在线免费视频| 好紧太爽了视频免费无码| 日韩AV手机在线观看蜜芽| 国产大片喷水在线在线视频| 国产精品福利尤物youwu| 日韩欧美国产精品| 久久这里只有精品23| 婷婷激情亚洲| 国产尤物视频在线| 人妻无码一区二区视频| 欧美有码在线| 国产小视频在线高清播放| 国产尤物jk自慰制服喷水| 九色在线视频导航91| 亚洲天堂网2014| 黄色三级毛片网站| 国产区网址| 亚洲第一区欧美国产综合| 在线无码私拍| 在线免费无码视频| 国产一级片网址| 99在线观看精品视频| 伊人久久婷婷五月综合97色| a亚洲视频| 国产欧美日韩综合一区在线播放| 国产日本一区二区三区| 91免费观看视频| 中文字幕 91| 丁香六月激情综合| 国产真实乱了在线播放| 亚洲欧州色色免费AV| 欧美午夜理伦三级在线观看| 无码精品福利一区二区三区| 在线观看无码av五月花| 久久无码av三级| 日韩欧美亚洲国产成人综合| 亚洲精品视频网| 午夜久久影院| 少妇精品在线| 2020精品极品国产色在线观看 | 3D动漫精品啪啪一区二区下载| 日韩区欧美国产区在线观看| 国产午夜精品一区二区三| 久久中文无码精品| 少妇高潮惨叫久久久久久|