一、引言
“十四五”數字經濟發展規劃和2035年遠景目標綱要中指出,隨著新一輪科技革命和產業變革的不斷深入,中國各行各業的數字化轉型已經成為大勢所趨,推進數字經濟的發展是應對新一輪科技革命和產業變革新機遇的關鍵戰略決策,需要強化核心數字技術的創新與應用,加快數字產業化的步伐,并推動產業向數字化轉型邁進。而數智化則是數字技術的應用,是在數字化的基礎上,通過智能化技術對數據進行分析、挖掘和應用,以提高企業的決策效率和創新能力。在數智化浪潮的推動下,各行各業都在進行業務模式和運營方式的改革與創新。稽核工作作為監督和保障企業運營活動合規性、有效性和可持續性的重要機制,歷經變革和創新,始終緊隨外部環境變化和企業內部管理需求。在國內,稽核工作的應用領域不斷拓展,涵蓋了金融、電信、能源等多個行業。電信運營商作為信息社會的基石,其運營效率和質量直接關系到社會經濟的發展和人們的生活質量。然而,隨著數智化轉型的發展,電信運營商面臨著日益復雜的業務環境和日益激烈的競爭壓力,因此,稽核工作也面臨著新的挑戰和轉型需求。
本文通過分析稽核工作的歷史演進和應用領域,重點聚焦電信運營商中的稽核實踐,并探討當前稽核工作面臨的問題和挑戰。進一步提出一系列轉型升級的方向,旨在通過智能化、自動化的手段,提升稽核工作效率與質量,為電信運營商及其他行業的稽核工作提供參考和借鑒。
二、稽核工作的歷史演進
(一)手工稽核階段
在改革開放初期,我國的稽核工作主要依賴于手工操作。稽核人員需要翻閱大量的紙質賬本和憑證,進行逐筆核對。這種方式效率極低,且難以應對日益增長的經濟活動。
(二)信息化稽核的起步
自20世紀90年代末以來,隨著我國經濟的快速發展和計算機技術的廣泛普及,信息化稽核工作正式起步。稅務部門在這一時期開始引人計算機系統進行數據處理與存儲,同時,一些基礎的數據分析工具也逐漸被納入稽核工作的范疇中。
(三)信息化稽核的跨越式發展
近年來,特別是2010年以來,我國的信息化稽核工作取得了長足進步。大數據、云計算等技術的應用使得稽核工作更加高效和智能化。此外,我國還加強了與國際社會的合作與交流,學習借鑒國際先進經驗和技術成果,推動稽核工作不斷發展。
三、國內稽核主要應用領域
(一)金融領域
在金融領域,稽核工作扮演著至關重要的角色,如確保金融機構遵守相關法規、保護投資者利益、維護金融市場的穩定等。金融稽核,亦稱“金融內審”,是金融機構內部審計的一部分,包括財務報表稽核、風險管理稽核、內部控制稽核和合規性稽核等。
(二)電信運營商領域
在電信運營商領域,稽核工作的應用廣泛而重要。其中,網絡費用稽核、市場業務稽核和政企業務稽核是三個尤為關鍵的方向。其中,網絡費用稽核主要通過對合同協議的審查和報賬繳費稽核,及時發現和攔截跑冒滴漏、小鬼當家問題,實現降本增效和精細管理;市場業務稽核側重于市場推廣、業務拓展等方面的合規性檢查,防止不正當競爭和欺詐行為,保障市場業務的拓展效率和質量;政企業務稽核主要關注為政府和企業客戶提供的通信服務的合規性和服務質量,確保按照合同約定提供高質量的通信服務,以提升客戶滿意度和忠誠度。
四、稽核工作目前存在的主要問題
(一)稽核工作人力成本高,效率低下
以人力為主的稽核,主要是在數據比對的基礎上,采用人工操作或者人工點算的方式,進行篩選、統計、匹配和判定。從目前的工作效能來看,人工稽核的人力資源耗用是巨大的。同時,由于人工的固有特性對于重復工作的疲勞敏感,稽核類型的工作出錯率較高,統計效率較低。另外,由于圖片和圖像類資料的稽核對于人工識別的專業性和專注力要求極高,因此,在各種實際的應用場景中,對于專業數據的自動化、數智化處理需求顯得尤為迫切。
(二)稽核過程中需要熟練運用參考大量的法規、政策和規則
稽核過程是一個兼顧財會、金融、法律、企業管理規范制度、業務實際流程等綜合內容的復雜過程。其中,對法律法規的解讀和運用、對企業政策制度流程的正確理解,以及對實際案例的正確借鑒,都要求較高的專業認知能力和專業經驗。從目前稽核隊伍的人力資源配置來說,要求高、任務重,亟待優質工具軟件和數智化系統作為重要的技術支撐。
(三)傳統方法風險識別能力有限,依賴人工經驗難以發現潛在風險
傳統方法主要指的是在數據規律、數據表現的具體案例里,通過合理推斷、數據比較、數學模型的擬合等過程,對于實際數據表現進行評估的方法。這種方法符合人工工作的邏輯思維,但是在大范圍、大數據、大時間跨度的條件下,發揮異常困難,而且風險評估的能力非常單薄。AI大語言模型目前已經在各類系統嶄露頭角,但是系統化、規范化的AI稽核工具手段和操作規程,依然是稽核工作的痛點和重大需求。在現有稽核系統已經初步具備AI稽核能力的前提下,如何進一步提質增效,是值得人們深入研究和探討的課題。
在深人研究近年來行業技術革新的基礎上,本文系統地梳理和總結了以網絡費用稽核為代表的稽核工作數智化轉型的幾個方向。
五、數智化轉型浪潮中的稽核工作革新方向
(一)IPA引領智能機器人:數字員工新篇章
網絡費用稽核工作包含大量重復的電腦端人工操作,例如,查看每張稽核單下載附件后關閉附件,對每張工單的每個稽核點逐一進行審核,有些稽核點甚至需要登錄其他系統查找相關數據或資料。在特殊時期如月末關賬和年底沖刺,工單壓力大時需要人工加班,而平時工單量可能并不飽和,導致工單潮汐現象明顯,造成人力資源的浪費。若升級稽核系統,存在系統改造困難且周期較長的問題,因此,亟須通過智能化的小工具、針對具體場景實現IT換人。
機器人流程自動化,即RPA(RoboticProcessAutomation),是IT領域的一種新興技術,它能夠創造高效的自動化工具,用來模擬人工的鼠標點擊、鍵盤輸入等操作,以及跨系統的數據采集和處理等事務性工作,輔助或代替員工完成一些大量的、重復性的工作,相當于企業的“數字化”員工。這有助于提高工作效率、減少出錯情況。IPA即“AI+RPA”的多重融合技術,基于IPA技術可快速構建和管理軟件機器人,使其在軟件自動化能力基礎上具備智能分析、識別、判斷和決策等能力,從而代替人自動完成大部分線上手工操作。
智能機器人數字員工具備“三不一低一能”的特征,即“不改變原有系統、不泄漏用戶數據、不限制操作系統、低成本系統融合和 7 × 2 4 小時在線,能幫助員工減負增值”,從而降低企業運營成本,提升企業生產效率,且避免人為操作錯誤帶來的安全風險。
集團公司已開發磐匠平臺,實現數字員工全生命周期一站式服務。在網絡費用稽核領域,可在此平臺上開發稽核工單附件自動下載數字員工、合規性自動審查數字員工、報表定期自動整理數字員工、風險自動識別標識數字員工、風險提示郵件自動發送數字員工等,構建了一支“有技能、有效能、有動能”的數字員工隊伍,為公司數智化轉型和高質量發展貢獻力量。
(二)機器視覺技術革新:圖片稽核自動化
在網絡費用稽核領域,存在較多需要稽核圖片的場景,例如,網絡電費繳費單需要稽核電表照片;對于用電量超標的站點需要提供鉗表照片;站點租賃費合同稽核需要稽核合同掃描件;網絡維修費稽核需要稽核審批表、結算表掃描件等。存在同一圖片在多個賬期繳費單重復使用、裁剪后重復使用、圖片模糊不清、圖片不合規等情況。
以網絡電費稽核為例,所有繳費單均需要提供電表照片,有時一張繳費單對應幾百個電表照片,依靠人眼稽核難度大且稽核精準度低。受限于人腦記憶能力難以發現跨賬期重復使用的圖片,且在稽核工單盲搶模式下,每個稽核員只處理部分工單而非全量工單,因此,亟須建立圖片稽核規則并通過自動化工具實現。
一是通過機器視覺識別疑似模糊圖像。首先進行圖像預處理,將彩色圖像灰度化、應用濾波算法(如均值濾波、中值濾波、高斯濾波等)以消除噪聲、設置閾值簡化圖像以減少計算量;然后進行頻域分析、使用邊緣檢測算子(如Sobel、Scharr、Laplacian等)進行邊緣檢測來提取特征;接著,可基于邊緣的方法、基于頻域的方法或基于機器學習的方法來評估模糊度\";最后,根據模糊度評估結果進行決策,可將圖片標記為疑似模糊圖像系統自動退單要求提單人重新提供清晰圖片,或使用圖像增強技術來提升清晰度。
二是通過機器視覺識別疑似重復圖像。首先,將彩色圖像灰度化、去除噪聲后進行尺寸歸一化;然后使用關鍵點識別技術(例如SIFT、SURF、ORB等算法)來探測圖像中的關鍵點或興趣點,對每個關鍵點生成一個特征描述子2,并將特征描述子進行編碼,生成特征向量;接著,將待檢測圖像的特征向量與圖像庫中的特征向量進行特征匹配,計算相似度,并設定相似度閾值。若超過該閾值,則可以判斷圖片為重復;最后,對匹配結果進行驗證和過濾,對重復圖像進行標記和輸出。
三是通過機器視覺識別疑似無效盯防圖像。首先通過灰度化、去噪、對比度增強和邊緣檢測等對圖像進行預處理;然后使用目標檢測、圖形分割算法(如YOLO、SSD、FasterR-CNN等)來定位目標位置,區分目標物體和背景;接著提取目標特征,包括形狀、大小等視覺特征,以及運動軌跡、速度等動態特征;最后使用分類器(如支持向量機、決策樹、隨機森林等)或深度學習模型(如卷積神經網絡CNN),對提取的特征進行分類和識別[3],并將測試圖像的特征與訓練得到的模型進行匹配,實現對目標的準確識別和分類。
一個開源的、支持多平臺的計算機視覺和機器學習庫OpenCV(Open Source Computer Vision Library),已經集成了超過500種圖像處理算法。同時提供了Python和MATLAB等語言的接口,并且支持Windows、Linux和MacOS等多個主流操作系統。因此,可以引入OpenCV實現疑似模糊圖像檢測、疑似重復圖像檢測和疑似無效盯防圖像檢測[4,達到對網絡費用稽核圖片進行自動稽核的目標。
(三)大語言模型驅動:智能知識庫的研發
隨著業務的迅速發展,網絡費用稽核領域的稽核規則也在不斷調整和優化。為有效提升工單質量,降低費用風險,需及時將稽核規則同步至省市稽核工單提單人員和審核人員。傳統的知識庫存在系統建設和維護成本高、知識分類和歸檔難度大、交互性差、信息一致性和準確性低等問題。為了克服這些缺點,需要更加智能化、個性化、交互化的現代智能知識庫系統,以提高用戶體驗和工作效率。大語言模型強大的泛化能力和表達能力、在通用任務上的優越表現,以及在零樣本環境下表現出的出色的學習能力,使得面向特定領域應用的大語言模型遷移學習研究成為熱門,使大語言模型強大的能力逐漸滲透到各個領域[5]。
企業需要根據自身的業務特點,采用基礎模型和領域模型分層規劃。基礎模型為預訓練大模型,提供通用能力。在此基礎上,通過后預訓練、精調等技術手段開發面向特定應用場景的領域模型。最后,基于這些領域模型、面向各場景打造不同應用。
基于大語言模型的知識庫是一個包含大量語言模型的數據庫,這些語言模型具有廣泛的知識和能力,可以用于各種自然語言處理任務,能更深入理解語言的復雜性,同時可以根據需要進行擴展和更新,保持與時俱進。此外,用戶可以通過評論或討論等方式參與知識庫的建設和維護,使得知識庫更加活躍和有效。構建一個基于大語言模型的專門用于網絡費用稽核的智能知識庫,可以按照以下步驟進行:
1.數據收集與處理。從不同系統收集和整合網絡費用稽核所需的數據,包括賬單、合同、服務協議、費用標準等,對收集到的文本數據進行清洗,并進行必要的標注,為后續的模型訓練提供高質量的數據集。
2.模型選擇與訓練。可以選擇現有的開源大模型如GPT、BERT等,或其他先進的自然語言處理模型。根據網絡費用稽核的特點,通過定制化訓練使模型熟悉相關的稽核知識和規則,提高模型在網絡費用稽核領域的理解和生成能力。
3.知識庫構建。將訓練好的模型與知識庫系統結合,將知識以結構化的方式存儲在數據庫中,便于檢索和利用。同時,開發能夠處理自然語言查詢的接口,使得用戶可以通過自然語言提出需求,系統能夠理解并做出相應的響應。
4.持續學習和更新。實施機制以不斷更新模型,適應新的稽核規則和不斷變化的環境。通過對用戶反饋的分析,不斷優化模型的性能和知識庫的內容。
5.安全與合規性評估。確保在數據處理和存儲過程中遵守相關的數據保護法規,保證用戶數據的隱私和安全,且符合行業規范和政策要求,避免違規操作。
6.系統集成和測試。將智能知識庫集成到現有的網絡費用稽核系統中,并在實際應用場景中進行測試,收集反饋,不斷優化模型的理解和響應能力,提升準確性,確保稽核人員能夠有效地使用智能知識庫來輔助工單處理。
在知識庫問答領域,任務被細分為兩大類:簡單問答和推理問答。簡單問答處理的是較為直接的問題,通常只涉及單個三元組信息。然而,推理問答則更具挑戰性,它要求系統不僅具備集合操作的能力,還需處理多跳路徑和屬性比較等復雜推理技巧[7]。
針對這一任務,目前的主流解決方案涵蓋了有監督的語義解析法,這種方法依賴于大量標注數據進行模型訓練;弱監督的語義解析法,它在標注數據有限的情況下依然能發揮一定效用;還有關系路徑法,它通過構建關系路徑來實現推理過程等。[8]
這樣,知識庫能具備識別用戶自然語言提問的能力,并能自動捕捉和存儲相關知識,以便后續精準識別其他用戶不同表達方式的提問并檢索到問題的答案,從而有效減少知識庫歸檔和維護成本,同時顯著提升效率。
(四)多模態數據挖掘:風險識別的新動能
傳統的大數據分析和數據挖掘技術雖然為企業和組織帶來了許多價值,但也存在一些缺點和弊端:一是過于依賴數據的質量和完整性。如果原始數據存在缺失值、異常值、重復值等,分析結果可能會受到影響,進而導致錯誤的決策;二是難以應對非結構化數據。傳統的大數據分析和數據挖掘技術主要關注結構化數據,但在實際應用中,非結構化數據占據了很大的比例,例如,網絡費用稽核中存在大量文本和圖片等非結構化數據。傳統技術對這些非結構化數據的處理和分析能力有限,難以充分利用這些數據的價值。
自然語言處理、計算機視覺和數據挖掘是三個獨立的技術領域,各自有不同的研究方法和應用場景[5,這三個技術領域結合起來的多模態數據挖掘技術能綜合處理并分析不同模式的數據,如文本、圖像、聲音等,以提取有用信息和知識。這項技術通常涉及以下幾個關鍵步驟:
數據集成:將來自不同源的多模態數據進行整合,構建一個統一的數據集,以便進行后續處理。
特征提取:針對每種模態的數據,提取能夠表征數據本質特性的特征。例如,在文本數據中,可以提取詞頻、詞向量等特征;在圖像數據中,可以提取顏色、形狀等特征。
跨模態特征轉換:由于不同模態的數據具有不同的表達形式,需要通過一定的算法將一種模態的特征轉換為另一種模態的特征,以實現跨模態的信息融合。
數據分析和挖掘:應用統計學習、機器學習、深度學習等方法對集成和轉換后的數據進行分析和挖掘,以發現數據之間的關聯性和潛在模式。
知識表示和應用:將挖掘得到的知識進行表示,如構建語義網絡、生成知識圖譜等,進而應用于諸如智能搜索、自動化摘要、圖像分類等。
在網絡費用稽核工作中,應用多模態數據挖掘技術,能充分整合不同來源、不同格式的數據,包括結構化數據、非結構化數據,以及多媒體數據等,如電表照片、賬單信息、備注信息、審批表、結算表、說明文件等,通過對這些數據進行融合分析,可以更加全面、深入挖掘風險線索和風險案例,彰顯稽核價值。同時,結合數據和文本的挖掘結果,可以構建更加精準的風險預測模型,從而提前發現可能的風險,及時進行干預。這樣不僅提高了稽核工作的效率,也大幅提升了稽核工作的準確性。
六、結束語
在數智化轉型的浪潮中,網絡費用稽核工作的轉型升級勢在必行。相信通過深度整合IPA工具、大語言模型、機器視覺,以及多模態數據挖掘等尖端技術,稽核工作的效率和準確性將實現質的飛躍,為企業風險管理和內部控制筑牢堅實防線。展望未來,稽核工作將持續邁向智能化、自動化的新高度,為企業的穩健發展和價值創造注入源源不斷的動力。
作者單位:羅金花 陽耀黃實秋中國移動通信集團廣東有限公司