王冬梅
(北京大學,北京 100871)
為高校師生提供財務報銷、收費及票據管理、學費繳納、薪酬勞務、稅務政策等方面的咨詢服務,是高校財務部門的一項重要工作。然而,由于高校師生眾多、咨詢條目多元化、需求碎片化,財務工作人員通過電話、現場問答、信息共享等手段開展財務咨詢工作具有較大的壓力。首先,不同的財務工作人員難以掌握全部的專業知識及其聯系,無法提供全面的業務咨詢服務;其次,有些復雜業務咨詢通常需要多次反復溝通確認,效率不高。面對上述問題,如何利用信息化、數字化技術手段并結合專家經驗實現財務咨詢工作智能化,是高校需要研究的一個重要課題。
隨著互聯網技術的發展,各高校財務部門開始構建專業的信息管理系統,以實現信息共享,提高服務能力。劉興民提出了要提高信息集成化程度,建立財務信息共享平臺來提升高校財務工作的信息化水平;趙翠萍提出了要通過網絡技術進行各部門的信息共享,將部分財務工作下沉到各院系,提升信息共享的效率;林美佳提出了要通過移動互聯網微信公眾號來關注財務信息,方便信息查詢;李昕等提出要通過自然語言處理(Natural Language Processing,NLP)技術將非結構化文字信息轉化為結構化文字信息,將智能客服機器人引入高校財務服務體系中,上述研究多處于高校財務信息化的研究階段。但是,如何從高校財務信息化轉向智能化,以及助力提高高校財務智能客服的效率和質量,目前相關研究還比較少。本文使用知識圖譜技術,結合已有財務知識和專家經驗,構建財務知識圖譜網絡,通過搜索知識圖譜獲取業務信息,提高財務智能客服機器人問答準確率和效率,以及高校財務客服工作的智能化水平。
本文的高校財務智能客服智能化方案是對現有財務報銷、收費、系統使用等專業知識庫中的知識進行總結抽象,通過知識建模、知識定義、圖譜建模3 個步驟完成各垂直領域知識圖譜構建,為上層知識問答、知識發現、知識推理等應用提供支撐服務。高校財務智能客服知識圖譜體系架構如圖1 所示。

圖1 高校財務智能客服知識圖譜體系架構
2.1.1 知識抽取
知識抽取是對現有的所有業務數據、業務規則進行分類、整理,形成知識實體對象。例如,針對學費相關業務的知識抽取,首先搜集學費相關信息系統文檔和知識庫文檔,對文檔內容進行分詞;其次對分詞結果進行統計,抽取關鍵詞;最后由業務專家確認并形成該業務的知識實體。比如,針對收費相關業務的知識實體有“收費平臺”“收費”“收款”“退款”“入賬”等;針對學費相關文檔,按照上述知識抽取方法抽取后的關鍵詞為“學宿費繳納”“學宿費票據”“退費”“貸款”等。
2.1.2 知識融合
知識融合是在知識抽取的基礎上,對知識實體進行整合、重組來提升知識圖譜的全面性,提升知識圖譜使用的效率。
例如,在“收費”相關文檔抽取中獲取的知識實體為“收費平臺”“校園繳費管理平臺”“收費”“收款”“退款”“入賬”,根據專家經驗,“收費平臺”與“校園繳費管理平臺”是同一對象,故將二者融合為同一實體,在應用中搜索二者任一實體時,可同時獲取“收費平臺”與“校園繳費管理平臺”相關知識,同理,“收費”與“收款”可融合為同一實體,這樣可解決實體全面匹配與實體對齊問題。
針對財務客服問答的碎片化、復雜化問題,可基于知識建模形成的各專業模塊,構建基于知識圖譜的財務客服問答模型,將財務知識實體、知識實體屬性、知識之間的聯系一同存儲起來,構成知識的三元組。將三元組定義為有向圖=[(),(),()],圖中的每個實體節點包括以下3 個部分。
(1)知識實體():財務各專業詞條。例如,“收費”“學宿費”“學宿費繳納”“學宿費票據”均稱為知識實體。
(2)知識屬性():知識實體所屬領域、歸屬部門、負責人、問答題目。例如,“學宿費”屬于收費專業,由財務部門具體業務科室的專業人員負責,表1 中的3 個問答可作為“學宿費”的屬性示例。

表1 “學宿費”相關問題客服回答
(3)知識聯系():表示知識實體之間的聯系,該聯系是各業務專家依據經驗建立。例如,如圖2 所示,“收費”與“學宿費”是兩個不同的知識實體,屬于不同的專業詞條,收費的對象可以是學宿費,故可定義二者之間的聯系為“相關”;“學宿費”對應的業務辦理有“學宿費繳納”“學宿費票據”“學宿費退費”“學宿費貸款”等,故可定義“學宿費”與上述業務辦理的關系為“包含”。

圖2 專業知識實體之間的“相關”“包含”聯系
圖譜建模是將通過知識建模得到的知識用三元組表示后,利用專家經驗構建各知識實體之間的聯系,形成知識圖譜。在業務應用中可以通過搜索相關知識實體和屬性來支撐知識問答。若搜索未成功,可以通過更新知識來完善圖譜,形成閉環流程。
2.3.1 圖譜產生
基于財務知識實體、屬性、關系,本文提出構建橫向融合不同主題知識、縱向擴展主題知識的立體網絡圖譜。橫向的聯系定義為第1 層網絡,如圖3 所示,構建收費、報銷、學宿費、系統之間不同業務知識的相關關系,圖4 是收費的縱向2 層網絡。

圖3 財務知識圖譜第1 層網絡

圖4 收費業務與其衍生知識的縱向2 層網絡
2.3.2 圖譜更新
在圖譜應用過程中,可能會出現無法回答問題的情況,需要進行圖譜更新,主要是知識三元組的更新。例如,通過知識圖譜搜索并未發現“專利費報銷”相關內容,則可增加“專利費報銷”知識實體,建立項目報銷與“專利費報銷”之間的聯系,并在其屬性中增加問答,最終構建全面覆蓋財務業務知識的知識圖譜,如圖5 所示。

圖5 知識圖譜更新增加“專利費報銷”
知識圖譜將專業知識與專家經驗相結合,形成知識網絡,可為知識問答、知識發現提供支撐,將知識圖譜應用于微信等即時通信軟件,能提升知識全面性與使用效率,提高財務智能客服的智能化水平。
由于財務業務具有知識碎片化、關系復雜化等特征,知識圖譜在知識問答實際應用中,高校通常采用Neo4j 等圖數據庫而非關系型數據庫進行知識存儲,以提升圖譜中節點搜索的效率和知識更新的效率,這為知識圖譜的高效應用提供了重要保障。智能客服在問答中通常需要提供“秒級響應”,所以可將知識圖譜應用于高校財務客服智能問答中,能夠有效提升問答響應及時性。
以P 大學為例,由各部門的業務骨干按照知識抽取規則梳理本部門業務,形成財務答疑手冊(專家知識),在本校財務部門公眾號嵌入財務智能客服模塊。業務經辦人通過在對話框輸入要咨詢的業務關鍵詞,系統運用知識圖譜在財務答疑手冊中搜尋業務關鍵詞相關的內容,顯示在公眾號的對話框中。如果業務經辦人咨詢的關鍵詞沒有被收錄在財務答疑手冊中,那么系統會記錄該關鍵詞,并會統計該關鍵詞的頻率,并記錄在后臺,業務骨干會將關鍵詞相關業務知識補充到財務答疑手冊中,以此不斷豐富財務答疑手冊,提高知識問答效率。
利用用戶在圖譜中的搜索序列,發現用戶辦理業務的事件流程及其遇到的問題,構建事件圖譜,貫通系統流程,提升業務辦理效率。
本文針對高校財務客服工作的現存問題,如財務工作人員溝通成本高,在高校財務信息化的基礎上,抽取各業務領域的財務知識,借助專家經驗,構建財務智能客服知識圖譜,該知識圖譜可在財務客服智能問答中發揮作用,能將用戶提問在圖譜中進行匹配搜索,提供秒級精準響應,并依據不同用戶提問意圖提供個性化答案,以提升全校師生對財務客服服務的滿意度。