李一男
摘 要:人工智能,大數據,網絡,物聯網作為當今信息技術的新發展,越來越接近我們的生活,如果他們被視為我們的身體,大數據是觸覺存儲的外部信息的集合,數據庫就像人類的大腦的記憶系統,沒有數據庫,就沒有記憶系統。近年來,國家加大了對公共圖書館公眾服務系統的建設,提供便捷的閱讀服務。如今在城市里,也可以看到馬路上出現了公共圖書館的身影,它們不需要你遠去到圖書館或書店,在你家附近也許就有,帶著手機前去,通過點擊柜端上的屏幕,掃碼免費借閱,通借通還,打造了便捷的服務網點,受到市民的關注。公共圖書館打通所有實體書店,自助共享圖書館,做到數據相互打通,方便讀者,為高效的公共圖書服務行業奠定堅實的基礎,提高了老百姓的閱讀水平。要高效的進行圖書、報刊采編、借閱等工作,就需要提供舒適的閱讀體驗,讓讀者能自助借閱圖書。而“知識庫”包含兩個不同的領域,即傳統的知識傳統數據庫和人工智能及其分支-知識工程,所謂的智力知識基礎。本文將重點討論公共圖書館咨詢知識庫的建設。
關鍵詞:大數據時代;咨詢知識庫;公共圖書館;研究
1 大數據特征分析
盡管不同業界對“大數據”(Big Data)的定義充滿分歧,但都強調首先必須從數量維度去理解“大數據”的“大”。也就是說,大數據的首要特征就是數量大。國外學者一般把大數據的量級限定在10 TB 到1 PB 之間。中國學者一般不主張所謂的“大”做具體規定。“一般認為,大量級的數據應該是‘TB級,我們也不需要‘什么是大來解決特定的‘尺寸,因為隨著技術的進步,這個尺寸本身還在不斷地增大。此外,對于各個不同的領域,‘大的定義也是不同的,無需統一”。張興旺曾經通過梳理大數據的發展歷程展示了“大”的語義。認為:GB級別的數據是“超大規模數據”(Very Large Data),TB級別的數據是“海量數據”(Massive data),只有PB級別的數據才稱得上是“大數據”。鑒于此,從縱向維度來把握大數據的基本特征是非常可取的,因為它可以充分彰顯大數據增長量大的特征。根據國際數據公司IDC監測,僅在2010年,人類生產的數據量是1.4ZB(引注:1ZB=1024PB),2011年增長到1.8ZB,到2012年達到2.9ZB。如果按照目前60%的增長速度,這意味著數據的關于世界的量每兩年翻一番所述數據;到2020年,全球將有35ZB的數據,增長近30倍。數據呈幾何級數增長,完全超出人類世界目前的IT體系結構和可攜帶范圍的存儲容量。為此,世界權威的IT研究與顧問咨詢公司Gartner大數據將被定義為“超越了傳統的信息處理技術,在極端的信息管理能力和處理問題或多個維度”,大數據是“不能用常規軟件工具,為他們的內容采集,數據管理和收集的處理在一定時間內。”不言而喻,與人類的能力有限,以控制數據的新興數據之間的矛盾關系一直是大數據時代的基本矛盾。因此,圖書館館際之間的競爭是館藏資源和空間建筑方面競爭的傳統觀念已經不適應大數據時代發展的需求了。
2 圖書館存儲能力面臨的挑戰
1)基本矛盾關系決定了圖書館不可能存儲所有數據。該結論不僅對單個圖書館存儲容量適用,而且對整個圖書館事業的存儲能力也適用。在這種情況下,無論是讀者根據自己的需要,還是圖書館根據自身辦館特色和發展定位,選擇性記憶“有意義”的數據。但是,這并不意味著你可以忽略其他數據,因為所有的數據都有它的潛在價值,只是相對于不同的對象來說。
2)圖書館不得不存儲非結構數據,目前圖書館還習慣于存儲結構數據,但非結構數據的所占有比例遠遠高于結構數據的比例。而這些來自人類日常生活世界且占主要份額的非結構數據同樣是人類生存體驗、社交對話和情感互動的縮影,同樣是人類智慧的“呈現者”,因而在很大程度上更富有“隱性知識”的價值和意義。從人類生存論上看,大數據時代已經悄然來臨,不管你是否意識到都已經身臨之中,都必須借助數據與世界“打交道”。可見,非結構數據具有不可或缺和不可忽視的價值,因此,在后臺不僅要注意結構大數據庫,但也應注意非結構化數據。目前,圖書館也應順應大數據時代,進入大數據領域。大視野看圖書館的數據建設,會發現今天的數據存儲挑戰:一方面是不能完全控制大數據卻不得不嘗試將其保存;另一方面,如果你想保存它,我們不得不面對的半結構化數據存儲的難題。
3 大數據時代下公共圖書館咨詢知識庫的可能性路徑
在大數據時代,圖書館的數據存儲問題主要是“怎樣對非結構數據進行存儲”。解決該問題,學界有兩種可能路徑:一是寄托信息工程技術領域的突破,能夠構建出與非結構數據性質相適應或相兼容的數據庫,亦即IT界所說的“非關系型數據庫”;二是借用可資利用的“大數據技術”,通過專業化的數據處理,把半結構數據和非結構數據勾連、轉換或改造為結構型數據,使之與現存的關系型數據庫同質化。
坐等數據存儲技術成熟是一項消極被動的路徑選擇,圖書館界學人大多主張走第一條路徑,但他們卻又無時無刻不在感嘆圖書館的基礎設施建設的滯后。按照這樣的思維邏輯推演可以預見,在大數據帶來的巨大契機面前必將碌碌無為。原因有3點:一是非關系型數據庫建構觀念能否轉變為現實還是一個未知數。很多 IT 界權威機構以及資深人士預計,還需要再經歷10年以上時間,大數據存儲技術的應用前景才能基本清晰。如果把解決問題的方案寄托于一個似是而非的設想,那是非常不可取的。二是建構出的非關系型數據庫也不一定能解決所有數據存儲問題。如前所述,大數據之“大”是因為數據總量超出人類存儲、管理和處理能力。該矛盾關系始終構成大數據時代存在的現實基礎,因為假如當人類有能力把控所有數據之時,數據也就無所謂“大”了。三是非結構數據還不是完全意義上的知識,不能直接運用。即使人類擁有了非關系型數據庫,如果不加整理地把全部非結構數據都裝了進去,仍然不是知識形態的數據。圖書館的基本職責不僅要存儲知識,而且還要提供知識服務。“傳統意義上的數據、信息和知識具有完全不同的概念。數據是信息的載體、信息是有背景的數據,而知識是經過人類的歸納和整理,呈現規律的信息。”這也就是說,數據要成為知識還需要一個復雜的轉換過程。按照當代圖書情報學的觀念來講,圖書館存儲的文獻資源如果是零利用率則屬于資源的浪費。這不僅對紙質書籍適用,而且對數據也同樣適用。這即是說,大數據給圖書館的數據存儲管理提出了更高的要求。首先,要有針對性地采擷、提取、挖掘能夠滿足讀者需求的數據。這與大數據本質完全契合,即我們不可能存儲全部數據,但可以有選擇地存儲有用數據。其次,要把特定的非結構數據“知識形態化”。
3.1 傳統咨詢知識庫
呼叫中心的咨詢知識庫截至目前其實是屬于傳統知識庫,或者叫做知識庫管理系統。主要是用來管理我們常用的一些咨詢的結構化知識以及其它文檔、圖紙、視頻和音頻等信息的非結構化知識。
3.1.1 操作員管理
每個運營商使用自己的運營商代碼到系統中,操作員的操作來實現權限管理:運營商的不同操作權限是不同的,系統操作員的操作權限,可以分為三種類型:瀏覽知識,搜索權限,添加和修改權限知識庫,提交權限,修改權限,最終的審計權限。
3.1.2 知識庫管理
知識集錦:知識,包括數量,標題知識類,小類,關鍵字,發布時間,意見,發行人,是否審核,知識內容的詳細介紹,最后一次瀏覽,筆記等。
知識來源:直接錄入、坐席的【我的知識】模塊的知識轉入、服務受理模塊的知識轉入。
知識維護:修改知識的題目、發布時間、發布人、備注、歷史記錄等。同時可以刪除該需求。
知識審核:由擁有審核權限的操作員對知識進行審核。只有當該知識通過審核后,該知識才能在知識庫生效。
3.1.3 搜索和瀏覽
搜索和預覽是咨詢知識庫管理系統的關鍵,運營商需要找到答案,在有限的時間內找出問題。在這種壓力下,該系統提供了尋找答案的快速且有效的方法是非常重要的。
搜索和瀏覽主要功能如下:
1)浮動搜索:對知識的稱號即時搜索。這種搜索方式非常類似于谷歌的搜索和,只要你輸入一個有效的關鍵字浮點立即下拉顯示相關的答案,選符合客戶給出的答案信息的需求。
2)快速搜索:可分別根據標題、關鍵字、內容快速匹配,便于客服人員快速找到答案。
3)自定義搜索:操作員可以根據需要,自定義結構化的搜索
方式。
4)排行榜:將一段時間內,訪問最大的知識呈現給坐席,清晰明了,便于客服人員在其中選擇合適的答案。
3.1.4 報表統計
系統提供按照知識登記日期、知識大類、知識小類統計報表。
可以看出來傳統的知識庫其實是管理系統的一種,也是增刪改查為核心的傳統IT應用(偏向于管理結構化數據和知識)。起碼運營商的知識庫管理系統在每個省的應用是規模較大的IT系統,涉及的人員多、流程多,需求調整頻繁,用戶滿意度低。傳統知識庫系統對于坐席來說非常重要,最新的資費、業務、政策或者營銷活動都通過知識庫系統傳遞給坐席,沒有一個坐席是可以掌握這么多結構化知識的,所以傳統知識庫對于坐席來說非常重要的,但是重要意義僅限于“咨詢知識庫”,通過這個工具來學習、掌握和使用業務知識。
3.2 智能咨詢知識庫研究
3.2.1 知識智能輔助
結合語音識別系統,通過識別實時通話內容,確認服務場景,分析用戶意圖,主動、智能提供知識內容,支持人工服務與智能服務結合,減少坐席手動操作步驟。
3.2.2 智能自我進化
能夠通過自我學習,完成知識庫引擎的自我進化,能夠自我升級語義分析能力,提高搜索準確率以及自動采編識別率。
3.2.3 自動采編
支持知識自動采編,能夠將多種非結構化素材進行結構化轉換,并自動采編為知識,具有學習能力,能夠逐步提升采編的準確性,減低知識采編壓力。
3.2.4 服務智能融合
將知識和服務進行結合,為客戶提供智能化的知識服務,能夠為客戶提供實時的相關業務操作,提高服務效率。
3.3 下一步規劃
1)咨詢知識庫在傳統客服、文本服務機器人、語音導航里面都將得到更好的應用,起碼語音導航的語義理解知識庫(小型知識庫)我們是必須統籌建設的。
2)針對傳統客服的傳統知識庫,通過提升搜索、跟隨能力提升知識庫的利用率。
3)希望統一做的知識庫可以考慮融合坐席的需求,建設更加強大的知識庫系統。智能咨詢知識庫作為智能服務系統中的獨立且關鍵的一環,對效率和效果有決定性作用。
4 結語
對于大數據時代而言,知識庫就是能量源。能量產生于知識的創造、匯集、利用、共享這一動態過程,先進的知識庫能夠讓知識的價值形成勢能,最終驅動智能化系統實現高效、精準的運行,為用戶提供極致的服務體驗。隨著用戶量和服務頻次的快速增長,智能客服系統的數據量暴漲,將海量的數據和知識進行更科學的管理和利用,使其反哺于客戶服務和業務管理成為新的方向。
參考文獻
[1]宮春梅.大數據時代公共圖書館咨詢知識庫研究[D].湘潭大學,2016.
[2]王麗慧.關于大數據時代公共圖書館圖書資料管理的改革與創新[J].才智,2020(18):247.
[3]寇月蘭.大數據時代公共圖書館微服務研究[J].傳媒論壇,2020,3(11):121-122.