王祥麗
(1.隆昌市圖書館 四川隆昌 511083)
隨著大數據和人工智能時代的到來及發展,機器學習的研究重心已開始從感知領域轉移到認知領域, 如何提升對大規模數據的認知能力已成為智能科學與技術的一大研究熱點。開發具備感知、理解和行為能力的信息系統和應用程序, 進而實現對萬物世界的情景感知與智能計算,已成為IT 界乃至相關領域探索并已取得巨大進展的一大新領域。 作為人工智能認知計算技術代表的IBMWatson 技術平臺,自推出以來就被世界所嘆為觀止,并被譽贊為“讓世界正變得更健康、更安全、更富創造力”。 從功能層面上講, 認知系統具備人類的某些認知能力, 能夠出色完成對數據的發現、理解、推理、決策等特定認知任務,主要由認知計算來完成,而對數據的認知價值也就決定了認知計算將在當前大數據與人工智能時代具有的光輝未來。 根據麥肯錫預測,到2025 年,移動互聯網、知識工作自動化、物聯網、云、先進機器人、自動汽車這六大技術領域相關的產業,經濟規模將達到數以十萬億美元, 而這些產業都離不開認知計算。 一直緊跟著技術而推動學科及事業發展的圖書情報學界也看到了認知計算的價值與潛力, 早在2002 年就提出了認知情報學這一認知計算與圖書情報學交叉結合的前沿領域。人工智能時代的到來,以及認知計算在人機交互、 分析洞察和決策支持等領域的深度應用, 都預示著認知計算這一前沿技術將成為圖書情報學學術研究的下一個熱點。
認知計算是代表一種建立在神經網絡和深度學習之上的全新計算模式,集成了信息分析、自然語言處理和機器學習等創新技術,德勤咨詢(Deloitte Consulting)首席分析師Paul Roma 指出,認知計算能夠借助技術和算法自動從數據中提取概念、 梳理關系和理解含義, 并獨立地從數據模式和先前經驗中進行學習,最終拓展人或機器可以自行完成的工作。基于這一認知,Roma 細分了認知計算的三種主要應用方式:
(1)認知自動化,借助于機器人或自動化設施自動執行重復性任務,從而提高效率、質量和準確性。
(2)認知洞察力,可揭示隱藏在大數據中的數據模式和發展關系,從而找到新的創新與發展機遇。
(3)認知參與,可通過大規模提供超個性化設置改善客戶關系、提升用戶體驗,進而推動客戶行為。
認知計算是一個機器通過與人的自然語言交流及不斷學習, 從而最終幫助人類從海量復雜的數據中發現更多規律或本質, 從而做出更為科學精準決策的系統。 而人工智能則是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。 人工智能與認知計算密不可分但又有所區別,事實上,兩者就像是兩個部分重疊的圓圈,彼此聯系又有所差異(見表1)。
總體來說, 人類追求人工智能的目標是追求機器的類人邏輯和完美, 即一方面讓機器盡可能的具有人類的邏輯思維,直至完美,讓機器等于人類;另一方面讓機器盡可能只學習人類思維中的有益部分,從而形成更加完美的機器邏輯,讓機器大于等于人類。 認知計算雖然借鑒了機器學習、 自然語言處理、語音/視覺識別、人機交互等人工智能技術,卻追求機器在軟硬件設計上變得更具情感和影響力,以幫助人類進行更加專業化的思考和科學決策。
大數據社會及人工智能時代的到來, 加速了社會對數據、信息的關注與挖掘,一方面傳統的信息科學得到了極大的發展, 研究的內涵與發展的邊際得到了極大的提升與擴展; 另一方面, 由信息科學交叉、衍生發展而來的計算科學、數據科學、生物信息科學等也在技術、數據、應用的多重驅動下得到了飛躍發展。 圖書情報學作為一門兼具有信息科學與管理科學屬性的科學, 自然離不開對信息、 技術的追隨, 也借大數據、 人工智能時代的發展而在數據挖掘、情感分析、用戶計算等領域有了巨大的發展,認知計算也被圖書情報學界視為新的發展驅動, 并發展而成為認知情報學這一交叉發展分支。 在圖書情報學特別是情報學界的探索下, 認知計算對圖書情報學的發展影響、應用場景等逐漸清晰。
龐娜在2018 年分析了認知情報學對情報分析帶來的新機遇新場景, 認為認知情報學為情報分析帶來了豐富的解決方案、重新定義知識發現、全新的人機交互環境。毋庸置疑,這些影響也依然是認知計算帶給圖書情報學的影響, 并在新的數據密集型科學研究環境下蘊含了更為豐富的內涵及內容。
(1)豐富情報分析解決方案。大數據時代情報科學及情報工作對數據的分析和挖掘, 讓情報分析成為了情報學在大數據時代發展最為活躍的分支領域之一。 然而,情報學研究者和實踐者均為重視的大數據由于數據量之大、數據類型之廣、生產速度之快、數據質量之痛,這就為情報人員對數據的利用和價值發現提出了挑戰, 大量的數據特別是非結構化數據、半結構化數據并未得到充分應用。 主要用來設計和分析大數據集的認知計算, 則可以通過創建特定的應用場景和不斷的人機互動、人與環境互動,模擬人類的思維快速的對大數據集進行學習、 推理和分析,以作出無偏倚的科學決策建議,最終對大數據的情報分析及應用提供新的解決方案。 如依托認知計算對海量文獻中的藥物、疾病、事件等實體進行分析,自動推理出實體間的關系及事件的發展規律。 諸如此類對海量文獻、音視頻、圖像、自媒體、富媒體等海量數據的處理, 都可為數字圖書館及情報服務機構的資源建設及圖情事業發展轉型提供新的可能及思路。

表1 認知計算與人工智能的差別[4]
(2)重新定義知識發現。 早在10 年前,我國情報學家冷伏海就指出在情報分析方面, 傳統的基于數據計算的數據挖掘技術正向基于內容的知識發現技術發展。 隨后10 年的發展也證明了這一科學論斷的前瞻性與科學性,以Alma、Primo 等為代表的圖書館新一代知識服務系統得到了普及應用, 面向各類知識內容(領域、主題、學者、機構、傳媒、資助等)做唯一標識、粒度分析、關聯呈現,得以實現從情報分析視角對隱含知識關聯做深入挖掘, 同時支撐客戶的學科評估、人才評估、研究方向分析、競爭情報動態連續追蹤等知識服務成為了圖書情報機構近年來知識服務的增長點。 但在基于內容的知識發現實現過程中, 捕捉非結構化數據中蘊含的深層含義一直是一大難點,自然語言處理面臨著多重困難。認知計算由于借鑒了人的思維模型和過程, 可以通過對某個特定領域的語言、術語進行人機交互、人與環境的互動交互來分析和理解, 最后實現基于情報分析的自動知識發現和含有細粒度實體的知識圖譜繪制。這對圖書情報機構而言無疑是非常重要的, 因為其不但能幫助圖書情報機構實現對期刊論文、 論文實證數據、參考文獻、專利、實驗標本、作者、主題領域等細粒度知識的自動發現, 還可以對細粒度實體間關系的關聯及發現來對整個篇章知識結構進行知識發現,幫助用戶迅速發現文章的研究目的、方法、手段、工具、結論等脈絡,運用關聯數據等技術幫助圖書情報機構的用戶在數據密集型環境下高效地獲取及利用文獻,加快知識服務的發展。
(3)新型的人機交互環境。數據密集型科研第四范式對圖書情報領域的技術應用提供了更多可能與場景,借助于人機交互的情景感知如智能咨詢、機器問答等也便成了人們在復雜、混沌、不確定的現實世界中對海量、 異構和難以理解的數據處理的幻想。追尋圖書情報學領域的人機交互歷史, 可以發現從較早信息檢索到近年來發展的視覺搜索, 都注重對用戶認知的感知與理解, 人工智能助推的問答式服務、無人智能服務、在線智慧系統等也均提升了情報服務的人機交互水平, 并創新出了越來越多的服務應用場景。認知計算利用深刻的理解能力,可以輔助圖書情報機構在為用戶進行服務時提供更佳的解決方案,如既可將解決方案嵌入到用戶的搜索、瀏覽等行為中去,也可以在智能問答系統、導航機器人程序中提前植入,讓用戶與機器進行深度的交互,并為用戶提供更加高效、合理的決策建議。
發展于20 世紀50 年代、主要包含計算機科學、心理學、教育學等多個學科知識的認知科學,在信息時代和大數據時代隨著對數據和信息的計算處理而發展形成了認知計算這一技術綜合體。 目前學界對認知計算的定義因不同的視角而存在差異, 但認知計算具有的輔助、理解、決策、洞察與發現功能還是得到了公認。 在圖書情報學領域,情報分析、資源組織等工作如信息組織、知識咨詢、智能檢索從一出現就以人的邏輯思維去探索對信息、 知識乃至數據的管理與應用,可以說認知計算早被引用到了圖書情報領域。 2002 年,正式提出了“認知情報學”這一獨立概念的第一屆認知情報學國際會議在美國召開,則標志著認知計算與圖書情報學真正走到了一起。
作為一個主要對計算機科學、情報學、認知科學和智能科學進行跨學科研究的多學科交叉研究領域,自認知情報學提出以來便受到了圖書情報學界的關注。 認知情報學國際會議自2002 年召開以來已召開了17 屆, 國際學者對認知情報學的研究也從認知情報學的基礎理論發展到了面向大數據應用的語義化處理、自動推理等領域。 在國內,索傳軍、冷伏海、龐娜、孫坦等學者也開展了認知情報學研究。
在2017 年年初IBM 內部分享的一份趨勢報告《AI/Cognitive Computing Trend Report,2017》中,IBM認為, 我們已經來到了認知計算這一計算科學新紀元時代,認知計算作為一個變革型的技術,將助推機器與人類之間的互動方式發生徹底轉變, 并顯著提高機器的價值。 有學者認為認知計算未來的主要應用領域為語言理解、互聯網搜索、認知數據挖掘和人機交互。 很顯然,圖書情報學與這四個領域有著緊密的關系和聯系。從更寬泛的視角來看,認知計算將對圖書情報學的科學理論、 應用研究及未來發展產生重要的影響, 因此可以預計在數據密集型第四范式環境下, 認知計算將為圖書情報學提供了從信息組織、數據挖掘到場景應用的諸多研究、應用增長點。如在信息檢索、知識發現、信息組織等方面,借鑒于人類思維邏輯的認知計算可以有效支持智能問答、無人服務,并借助于對情景感知來獲取人類信息行為大數據, 實現人機交互模式下用戶認知意圖精準刻畫和機器自動問答, 覆蓋從信息采集、 意圖精煉、問題完善、語料獲取、深度洞察到探索式分析的認知計算完整迭代過程。
基于上述認識與分析, 筆者認為認知計算將繼續依賴其在感知、 理解和行動三個方面具有的技術優勢, 在圖書情報學的知識表達等場景中得到應用及研究,并提供新的或完善的已有的解決方案(具體見表2)。
認知計算正成為新一代計算中不可獲取的一部分, 但由于整個社會及科技還處于計算新時代的前期, 大眾對認知計算的理解及研究應用尚不足以讓認知科學得到足夠的價值與應用展現。 認知情報學作為認知計算與圖書情報學的研究交叉領域,自21世紀初提出以來就引起了學者的關注, 但總體而言研究成果還不豐富, 研究內容也還不足以支撐與構筑起這一交叉領域豐富的內涵及外延。 本文在概述相關概念、研究進展的基礎上,對認知計算在圖書情報領域未來的研究及應用場景進行了探索。 在此需要強調的是,盡管認知計算具有自我增值、協助用戶的能力, 以及由靜態系統轉向動態系統的能力都在圖書情報領域具有相當大的吸引力, 但圖書情報領域對認知計算的研究要以服務應用為導向, 理解認知計算即服務這一基本定位, 讓認知計算推動圖書情報學精細化、智能化、智慧化發展。

表2 認知計算在圖書情報學的應用/研究場景[14]