李雅潔++陳正華++楊立東



摘 要 隨著國家電網公司SG186信息工程接近尾聲,信息化工作的重點將逐步由大規模建設轉向運維,信息通信客戶服務中心對外服務窗口的作用日益顯現,快速、便捷、準確的識別用戶需求并提供自助解決方案成為運維服務的標準,探索基于運維知識庫的自助式服務是構建上述標準的重要環節。本文從運維實際工作出發,對信息通信本體知識庫構建、用戶的提問分析、解決方案抽取進行了詳細闡述。
【關鍵詞】信息運維 本體知識庫 知識庫檢索
隨著國家電網公司SG186信息工程接近尾聲,信息化工作的重點逐步由大規模建設轉向運行維護,信息通信客戶服務中心對外服務窗口的作用日益顯現,當前客戶服務中心面臨的挑戰主要體現在如何提高服務質量和運維效率,保障了信息交流業務的順利進行和系統運行的穩定性,提高了信息通信系統的運營維護水平,同時對優化服務水平和提高自身的管理水平有一定的積極意義。
1 運維知識庫構建思路及背景
運維知識庫作為知識核心部分,是管理中心,有著極其重要的功能,運維知識庫的本質就是知識遵循一定的規則表示方法存放的數據庫,它是一個完整的知識管理解決方案的不可替代部分,具備極強的知識處理功能,可分為集成、分類、存儲、發布、決策支持等功能。構建運維知識庫可以方便人們進行知識的交流、積累、共享、增值、利用和保存,同時也有利于促成基于運維知識庫的用戶問題自助解決。如圖1所示。
運維知識庫是實現業務活動的一種工具,構建過程中應堅持以業務流程、規范業務、方便客戶、方便運維人員、數據價值最大化以及數字管理為導向。在構建運維知識庫過程中,首先,要依據業務種類和特點對知識進行分類,從而快速實現知識的清晰分類、層次分明;其次,人們要更好地依賴于各種技術方法,以便實現知識的便利、迅速、精準的檢索;第三要形成一套完善的知識管理體系,使之符合客戶服務中心知識密集、更新快速的要求,最大限度的實現客戶服務中心知識庫的動態采集、管理、利用。所以研究基于信息系統運維知識庫具有重要的意義和應用價值。
本文是在目前靜態的知識庫建設基礎上進行的,由于目前運維自動化還沒有包括業務運維方面自助解答研究,而該功能又是制約客戶服務效率提升的瓶頸,所以本項目以“業務運維自動化”作為研究的領域背景。本文深入研究了基于運維知識庫構建及應用的基礎理論,擁有以下幾大優點:
(1) 運維知識庫的檢索源是結構化的信息系統業務解決方案、經驗庫,而不是無結構或者半結構的文檔。運維知識庫可以完整的描述特定的業務場景的知識及知識之間的關系,還可以對知識進行推理,所以通過運維知識庫的構建實現用戶問題提報過程中的解決方案自動關聯,從而實現用戶問題的自助解決。
(2) 運維知識庫主要應用于對業務的支撐,相對于傳統的知識庫管理,本課題所研究的基于運維知識庫的用戶問題和自助解答,更加適合于用戶知識需求的表達方式,并且能很好的理解用戶的查詢意圖;
(3) 本文研究的運維知識庫構建具有較強的實用性和通用性,不僅可以用于業務運維場景,實現業務運維的自動化,而且可以移植到其他類型知識庫的構建。
2 運維知識庫的構建
運維知識庫是客戶服務中心QA的關鍵組成部分,結合關鍵檢索技術,能根據用戶提報問題時的分析結果進行推理,自動關聯問題的解決方案。
2.1 運維知識庫構建
運維知識按照知識的來源可以劃分為靜態知識和動態知識兩類。
靜態知識,通過定制標準化文檔模版,盡可能的細化知識分類,從而提高檢索效率;如系統操作手冊、典型案例、特殊業務解決方案等基于標準化管理,實現知識的結構化存儲。
動態知識,日常運維過程中主要有兩種途徑:一條途徑是根據用戶問題提報,針對既有知識庫中無法匹配的問題進行標記并將標記結果實時反饋給運維人員,運維人員定期根據系統反饋組織開展評估,并形成詞條,從而完善知識庫;一條途徑是根據用戶熱線反饋,針對新生成的問題或疑難點進行總結、提煉,形成最終解決方案,從而進一步完善知識庫,為用戶問題的自助解決奠定堅實的基礎。
2.2 用戶提問分析
用戶提報的問題,需經過專業術語識別、語義匹配等基本分析、轉換后對問題進行語義表達,使之成為便于機器識別的語句。
(1)問題模版庫的建立,實際運維過程中用戶的問題提報多種多樣,且針對相同的問題,不同的人也存在語義差異極大的表述,因此需結合不同用戶的提問習慣進行梳理、提煉并建立問題模版庫,在用戶問題提報過程中使系統能準確的定位用戶的提問。
(2)結構化問句實例庫,結合大數據分析,對問題模版庫中的問句進行語義分析,根據分析結果建立結構化的問句實例庫。問句語義通過三個層次進行標記,第一層次是系統主分類,第二層次是業務點二級分類,第三層是功能點三級分類。要把分析好的問句歸納到每種語義的問法下,才能構成半結構化文檔。
2.3 知識庫檢索算法
在關系數據庫的存儲方式前提之下,知識對象可以結構化的表示為不同類別的特征向量的集合。在進行知識案例搜索時,這里使用基于特征相似度的計算方法來計算檢索詞與知識案例之間的接近度,即相似度,接近度越大,則說明最終結果越接近最終的檢索目標。在一個分類知識庫中,它所包括的知識對象則可以進行結構化表示,具體如式(1)(2)(3)所示。
其中,Ci={i=1,2,...,n}可以看作某分類知識庫KD中的對應的知識對象;它所包含的特征向量fik與知識本體中該類別第k個屬性的取值一一對應;另外,檢索條件q的值fci就是用戶輸入對應的檢索值。
不同種類屬性對概念整體相似度的影響也不盡不同,可以采用加權的方式對目標知識進行檢索。設Simcq為某個知識對象Ci與檢索特征向量q之間的相似度,fcqi為它們之間第i個特征fci與fqi的相似度,i為它們第i個特征的權重,則檢索特征與目標對象的相似度Simcq計算如公式(4)所示。
由式(4)可知,相似度的計算將依賴于屬性相似度的值。在實際中的維護知識屬性值大致可分為三類:文本類型、模糊值類型和數值類型。各種類型的屬性相似距離計算方法過程如下。
2.3.1 數值類型屬性相似度計算
其中,fimax表示此種類的知識庫中知識對象第i個元素的最大值;fimin表示此類知識庫中知識對象第i個元素的最小值。
2.3.2 模糊值類型屬性相似度計算
模糊值可以用來表征模糊評價、模糊等級等一系列問題。在維護知識中,涉及到的對象有很多屬性值就是模糊值,如對6S方案評價就可以使用“五星級”、“四星級”、“三星級”、“二星級”、“一星級”等來說明。在這里,我們對于這種屬性值,則能把這種模糊值轉化為對應的精確值,例如,可以把6S方案的實施結果評價標準的模糊值{五星級、四星級、三星級、二星級、一星級}映射如表1所示。
對于此類屬性,其相似度按公式(6)進行計算。
2.3.3 文本類型屬性相似度計算
這里,所用的文本屬性的相似度如式(7)。
其中,s(ci,qi)為屬性ci和屬性qi之間的語義重合度;d(ci,qi) 為屬性和屬性qi之間的語義距離;h(ci)和h(qi)分別為屬性ci和屬性qi所對應的層次深度;τ為調節系數。
在上面的公式中,涉及到的權重系數的確定方法有2種:手工確定和自動獲得。手工確定時,則根據前人認知基礎或者專家的先前經驗,需要此領域專家根據不同的環境進行合理合情的選擇。第二種方法即為自動獲得法,常采取sigmoid函數進行計算,如式(8)。此算法不僅能夠對各相似度算法進行加權,而且可以對每一個相似度進行函數計算,能把數據轉換滿足[0,1]的輸入。
2.4 解決方案抽取
通過上節用戶提問分析,在用戶問題提報過程中,用戶提報的問題和實例庫中的問句完全匹配率不高,所以,在計算用戶問句與運維知識庫中問題答案的相似度時可以使用改進的向量空間模型算法,以便能夠提高了系統效率和精確度,從而幫助用戶自助問題的解決。
3 建成后的效果分析
信息通信客戶服務中心基于信息系統運維知識庫的用戶問題的自助解決功能的實現,不僅提升了客戶服務效率。此外,用戶滿意度的提升,進一步提高了客戶服務中心的運營管控能力,從而推進客戶服務中心從單純的問題受理中心向問題管理中心的戰略轉型。
4 總結
基于信息系統的運維知識庫構建,在實際運維場景中,對2014年、2015年運維數據進行了分析,其中常規性操作問題占比可達到75%,進而可以推論完善的運維知識庫管理及快速的知識檢索可以充分的解決該類問題。運維知識庫結構的優化、檢索效率及準確性的提高還需要我們的繼續努力。
參考文獻
[1]王元卓,賈巖濤,劉大偉,等.基于開放網絡知識的信息檢索與數據挖掘[J].計算機研究與發展,2015,52(02):456-475.
[2]王河堂,吳慧韞.基于ITIL架構的高校一卡通運維管理體系的研究[J].計算機學報,2014,37(12):19-22.
[3]陳立瑋,馮巖松,趙東巖.基于弱監督學習的海量網絡數據關系提取[J].計算機研究與發展,2013,50(09):1825-1835.
[4]王延翠,楊麗麗,吳冬華.動車組故障知識管理系統技術的研究[J].北京交通大學學報(自然科學版),2014,38(02):141-146.
[5]王昊,谷俊,蘇新寧.本體驅動的知識管理系統模型及其應用研究[J].中國圖書館學報,2013,39(02):98-110.
[6]張紅國.ITIL在電信運營商面向政企客戶服務體系中的探索[J].中國管理信息化,2015,18(04):219-220.
作者簡介
李雅潔(1987-),女,新疆維吾爾自治區阿勒泰市人。碩士研究生,工程師。主要研究方向為信息系統業務運維。
作者單位
1.國網新疆電力公司信息通信公司 新疆維吾爾自治區烏魯木齊市 830000
2.國網信通億力科技有限責任公司 福建省福州市 350003