勇美菁,鐘永恒,劉 佳,王 輝
(1.中國科學院武漢文獻情報中心,湖北武漢 430071;2.中國科學院大學經(jīng)濟與管理學院圖書情報與檔案管理系,北京 100190;3.科技大數(shù)據(jù)湖北省重點實驗室,湖北武漢 430071)
人工智能(Artificial Intelligence,AI) 是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新技術(shù)科學[1]。隨著大數(shù)據(jù)、信息及網(wǎng)絡(luò)技術(shù)的發(fā)展,學術(shù)界開始越來越重視人工智能發(fā)展對各領(lǐng)域的影響。強大的數(shù)據(jù)處理與分析能力使人工智能在國內(nèi)圖書情報領(lǐng)域發(fā)揮越來越重要作用的同時,也帶來新的機遇和挑戰(zhàn)。
本文利用軟件CiteSpace,檢索并分析CNKI 收錄的國內(nèi)圖書情報領(lǐng)域人工智能的文獻研究,探討人工智能在國內(nèi)圖書情報領(lǐng)域的研究主題熱點與未來發(fā)展趨勢,梳理人工智能在國內(nèi)圖書情報領(lǐng)域的研究演化過程,為進一步探索圖書情報領(lǐng)域人工智能的理論與實踐研究提供參考和借鑒。
2019 年2 月,以主題為“人工智能”,文獻分類目錄為“圖書情報與數(shù)字圖書館”,分別在CNKI的期刊論文數(shù)據(jù)庫、碩博論文數(shù)據(jù)庫及會議論文數(shù)據(jù)庫進行檢索,檢索結(jié)果為764 條。去重并篩選檢索結(jié)果,剔除征稿通知、選題指南及相關(guān)度較低等類型的論文,最終剩余682 條文獻記錄,其中,276篇收錄在《CSSCI(2017—2018)收錄來源期刊目錄》包含的期刊,占總數(shù)的40.47%。
某一主題發(fā)文量隨發(fā)文時間的變化直觀反映該主題研究的趨勢變化與研究進展。據(jù)統(tǒng)計,國內(nèi)圖書情報領(lǐng)域人工智能方向的研究論文年度分布如圖1。

圖1 國內(nèi)圖書情報領(lǐng)域人工智能研究論文年度分布
國內(nèi)圖書情報領(lǐng)域最早關(guān)于人工智能研究方面的探索始于20 世紀80 年代。1984 年夏培德[2]首次在國內(nèi)期刊論文上提出將“新技術(shù)革命”與圖書情報工作聯(lián)系起來,對知識進行系統(tǒng)化、標引化和信息化處理,形成文獻系統(tǒng)、目錄系統(tǒng)和檢索系統(tǒng)。蔡曙光[3]在國內(nèi)圖書情報領(lǐng)域明確提出“人工智能”,并探討作為人工智能研究成果的“專家系統(tǒng)”在圖書情報工作中的應(yīng)用。這一階段的研究主要從理論層面展開,少數(shù)基于實驗方法進行研究。此后,隨著計算機技術(shù)的逐漸發(fā)展,人工智能開始融入各個領(lǐng)域,但在國內(nèi)圖書情報領(lǐng)域人工智能的研究一直較少,處于緩慢發(fā)展階段。研究方向是語義網(wǎng)絡(luò)、機器學習等技術(shù)更新領(lǐng)域的研究文獻出現(xiàn)一定程度增長。王麗華[4]基于語義網(wǎng)的數(shù)字圖書館關(guān)鍵技術(shù),對本體開發(fā)、元信息及元數(shù)據(jù)等關(guān)鍵問題進行必要闡述。陳紅梅[5]提出構(gòu)建圖書館網(wǎng)絡(luò)知識服務(wù)的5個重點以及面臨的8個問題。張玉峰等[6]在信息管理、人工智能和認知科學等多學科理論與技術(shù)基礎(chǔ)上,提出基于機器學習的知識檢索模型。從2016 年至今,國內(nèi)圖書情報領(lǐng)域人工智能相關(guān)文獻數(shù)量增長迅速,開始進入高速發(fā)展環(huán)節(jié)。除利用文獻計量方式研究我國人工智能的發(fā)展現(xiàn)狀與發(fā)展趨勢之外,對人工智能的研究也拓展到圖書情報領(lǐng)域的方方面面,逐步進入縱深化研究發(fā)展方向[7]。國內(nèi)圖書情報領(lǐng)域人工智能研究在不斷發(fā)展相關(guān)技術(shù)的基礎(chǔ)上進行擴展與延伸,更加重視如智能閱讀[8]、智能圖書館[9]、深度學習與情報分析[10]、用戶行為[11]、知識服務(wù)[12]等實踐與服務(wù)層面的應(yīng)用。
除期刊論文之外,2000 年以后,圖書情報領(lǐng)域開始出現(xiàn)以“人工智能”為主題的碩博學位論文,共30 篇,占總數(shù)的4.40%。碩博學位論文主要集中圍繞智慧圖書館、信息智能服務(wù)、知識庫構(gòu)建、智能化資源檢索等。而各類會議也十分關(guān)注圖書情報領(lǐng)域人工智能研究的發(fā)展,就智慧服務(wù)與圖書館發(fā)展、人工智能技術(shù)在情報領(lǐng)域的應(yīng)用、知識組織的方法與工具等方向不斷展開深入探討。例如,2002年江浙滬晉圖書館中青年論壇開展“擴大知識工程內(nèi)涵,確立圖書館知識中心地位”及“實施知識工程,推動圖書館建設(shè)”等方面的探討;2018 年北京科學技術(shù)情報學會學術(shù)年會“智慧科技發(fā)展情報服務(wù)先行”論壇從文獻計量、論文專利視角,討論人工智能的發(fā)展及人工智能反過來作用于知識服務(wù)、情報服務(wù)的新走向。
利用1984—2018 年的文獻數(shù)據(jù),通過CiteSpace生成機構(gòu)合作圖像,如圖2。依圖所示,目前國內(nèi)圖書情報領(lǐng)域人工智能研究方面發(fā)文較為分散,機構(gòu)合作情況較少,鮮有的合作關(guān)系比較單一、固定。結(jié)合表1 的研究機構(gòu)發(fā)文量排名,可以看出國內(nèi)圖書情報領(lǐng)域人工智能研究主要學術(shù)研究機構(gòu)類型以各高校信息管理學院(武漢大學信息管理學院、南京大學信息管理學院等)為主,其次是信息類科研院所(北京市科學技術(shù)情報研究所、中國科學院文獻情報中心等)及各高校圖書館(南京大學圖書館、東南大學圖書館)。除此之外,各省市公共圖書館也在國內(nèi)圖書情報領(lǐng)域人工智能方向的研究中占據(jù)重要地位,例如上海圖書館等。其中,在論文數(shù)量排名前30 的機構(gòu)中,42.28%論文來源于高校信息管理學院,信息類科研院所與高校圖書館分別占20.81%和18.12%。

圖2 人工智能研究機構(gòu)網(wǎng)絡(luò)圖譜

表1 研究機構(gòu)發(fā)文量排名
通過軟件CiteSpace 分析文章作者,如圖3 所示,國內(nèi)圖書情報領(lǐng)域人工智能研究方面的作者分布較為分散,其中,南京大學信息管理學院邵波(7 篇)和河北大學信息管理系賈同興(6 篇)等是該領(lǐng)域的領(lǐng)軍人物。前者的研究重點在于智慧圖書館、圖書館機器人、機器學習與用戶行為,后者的研究重點在于自然語言理解、標引詞表、專家系統(tǒng)、情報檢索等。其次較為關(guān)注國內(nèi)圖書情報領(lǐng)域人工智能研究方向的學者還有方平(5 篇)、邱均平(4 篇)、胡德華(3 篇)等。
在作者合作方面,20 世紀后期開始出現(xiàn)作者合作,其中包括國內(nèi)學者之間的合作以及國內(nèi)學者、華裔作者與國外作者的合作。在1988 年和1989 年岸美雪等[13-14]合作探討“人工智能與圖書館”的關(guān)系;1991 年Croft W B 等[15](美國馬薩諸塞大學計算機信息系)合作探討“智能情報檢索”。之后圍繞人工智能在國內(nèi)圖書情報領(lǐng)域中研究的作者合作研究進一步發(fā)展和加深,出現(xiàn)一些合作關(guān)系較為密切的團體,例如:北京郵電大學信息工程系的李蕾、王楠、鐘義信、郭祥昊、韓鵬、賈自燕、高清霞;吉林大學管紀文、黃祥喜、邱滌虹、張成奇;哈爾濱工業(yè)大學計算機系王建波、唐正偉、杜春玲、王開鑄;北京市醫(yī)學情報研究所龔文濤、徐國桓、武立瑩、劉會霞、張世紅等。但是,國內(nèi)圖書情報領(lǐng)域人工智能研究方面的作者合作關(guān)系與其他領(lǐng)域相比仍較少,研究力量分散,獨立性較高,主要原因可能在于“人工智能”這一方向在國內(nèi)圖書情報領(lǐng)域剛剛興起,尚未形成穩(wěn)定合作網(wǎng)絡(luò)與研究體系。

圖3 人工智能研究作者網(wǎng)絡(luò)圖譜
突變詞分析用于探索某一時期學術(shù)發(fā)展的前沿主題,是指通過分析某一時期的詞頻變化來判斷突然涌現(xiàn)或正在興起的新興熱點。檢索到的文獻數(shù)據(jù)經(jīng)過軟件CiteSpace 處理后,共16 個突變詞,如表2。

表2 國內(nèi)圖書情報領(lǐng)域人工智能研究突變詞列表
從突現(xiàn)詞開始出現(xiàn)的時間來看,人工智能關(guān)鍵詞突現(xiàn)最早出現(xiàn)在1984 年,開啟了國內(nèi)圖書情報領(lǐng)域人工智能研究的新方向,但早期研究大多停留在理論層面,并且與圖書情報領(lǐng)域結(jié)合并不緊密。隨著人工智能不斷發(fā)展,情報檢索、知識工程、語義網(wǎng)絡(luò)、深度學習等相關(guān)技術(shù)逐漸發(fā)展,成為國內(nèi)圖書情報領(lǐng)域人工智能研究的前沿內(nèi)容。其中,2000—2004 年突現(xiàn)的關(guān)鍵詞多而頻繁。例如,2004年深度學習、知識組織、本體成為重點關(guān)注內(nèi)容,研究除追求基礎(chǔ)技術(shù)的突破之外,開始從系統(tǒng)、方法等方面尋求切入點,從根本上提高人工智能在圖書情報領(lǐng)域的應(yīng)用效果與效率。從突現(xiàn)詞持續(xù)時間來看,目前超過10 年的突現(xiàn)詞有語義網(wǎng)絡(luò)、專家系統(tǒng)、本體與人工智能。其中,語義網(wǎng)絡(luò)在2003 年和2005 年出現(xiàn)兩次,并且每一次都持續(xù)10 年左右,可見作為人工智能程序運用重要的表示方式之一,其在國內(nèi)圖書情報領(lǐng)域人工智能研究中發(fā)揮重大作用。尤其是自然語言處理、神經(jīng)網(wǎng)絡(luò)、知識圖譜的進一步應(yīng)用為語義網(wǎng)絡(luò)的發(fā)展提供了可靠保障。從突變強度來看,人工智能、知識工程等宏觀層面的基礎(chǔ)性關(guān)鍵詞由于其總結(jié)性與代表性最明顯,突變強度最高,代表某一階段的總體研究目標。其次,信息檢索、搜索引擎等優(yōu)勢性技術(shù)在2000 年左右早期應(yīng)用于圖書情報領(lǐng)域的人工智能研究時的突變強度較高。但近年來出現(xiàn)的突現(xiàn)詞普遍突變強度不高,表明國內(nèi)圖書情報領(lǐng)域人工智能的研究更加豐富與多元,在理論、技術(shù)及應(yīng)用等各方面都有更加廣泛的研究與布局。
關(guān)鍵詞的出現(xiàn)頻次是某一主題文獻研究熱度表現(xiàn)的重要指標。利用軟件CiteSpace 中的“term”與“keyword”進行分析,并將top50 的關(guān)鍵詞排序,發(fā)現(xiàn)共126 個頻次在2 以上的關(guān)鍵詞,部分如表3。

表3 關(guān)鍵詞詞頻降序排名
表3 中關(guān)鍵詞可以分為三類:第一是宏觀概念主題,包括:人工智能、知識工程、智慧、大數(shù)據(jù)、智能、AI,詞頻共358 頻次。此類關(guān)鍵詞主要是對人工智能在國內(nèi)圖書情報領(lǐng)域發(fā)展方向的宏觀描述,具有高度概括性,貫穿研究演進的整個過程。第二類是技術(shù)發(fā)展主題,包括數(shù)字、語義網(wǎng)絡(luò)、搜索引擎、知識組織、深度學習、本體、技術(shù)、文獻計量、語義網(wǎng)、機器學習、數(shù)據(jù)挖掘、知識圖譜、自然語言理解,詞頻共167 頻次。此類關(guān)鍵詞種類較多,關(guān)鍵詞階段性變化比較明顯,技術(shù)的不斷發(fā)展促進國內(nèi)圖書情報領(lǐng)域人工智能的研究深度與應(yīng)用方向。第三類是服務(wù)與應(yīng)用主題,包括機器人、信息檢索、情報檢索、專家系統(tǒng)、情報工作、高校、服務(wù)、CiteSpace、智慧服務(wù)、物聯(lián)網(wǎng)、智能機器人、互聯(lián)網(wǎng)+、知識服務(wù),詞頻共151 頻次。此類關(guān)鍵詞主要圍繞人工智能的應(yīng)用實例(機器人、專家系統(tǒng)、物聯(lián)網(wǎng)等)、服務(wù)形式(智慧服務(wù)、知識服務(wù)等)以及服務(wù)對象(高校等)3 個方面展開,表明國內(nèi)圖書情報領(lǐng)域人工智能研究實踐的進一步豐富。需要說明的是這3 個類別并非涇渭分明,而是彼此交叉重疊的。技術(shù)發(fā)展是服務(wù)與應(yīng)用的基礎(chǔ),而這兩者都是在人工智能等宏觀描述框架下不斷發(fā)展和演進的,因此進行詞頻統(tǒng)計時不能簡單合并這些詞語。總結(jié)來看,人工智能等宏觀概念主題是關(guān)鍵話題,貫穿始終;而“技術(shù)”“應(yīng)用與服務(wù)”則是衍生出的高關(guān)注話題,也是當前的研究前沿與熱點。
中心度是除詞頻外,描述節(jié)點重要性的又一重要指標。中心度高的點作為引文網(wǎng)絡(luò)中的關(guān)鍵節(jié)點,一般連接兩個不同的聚類。按中心度排序的關(guān)鍵詞部分結(jié)果如表4。

表4 關(guān)鍵詞中心度排名
對比表3 和表4 數(shù)據(jù)發(fā)現(xiàn)多數(shù)關(guān)鍵詞的詞頻與中心度成正比關(guān)系,二者相輔相成。例如,人工智能、知識工程、信息檢索、機器人、數(shù)字等詞頻和中心度雙高的關(guān)鍵詞,一直是人工智能在國內(nèi)圖書情報領(lǐng)域發(fā)展過程中重點關(guān)注的方向。此外,部分關(guān)鍵詞詞頻較高,但是中心度較低,例如專家系統(tǒng)、本體、情報檢索等,這種關(guān)鍵詞一般并不獨立作為主題,而是從屬于某一個特定中心聚類。而機器學習、深度學習、數(shù)字參考咨詢服務(wù)、數(shù)字人文等詞頻較低而中心度較高的關(guān)鍵詞,表明圍繞這種關(guān)鍵詞已開展一定程度的研究,但是研究數(shù)量尚少,討論并不充分,有成為未來關(guān)鍵研究主題的潛力。
軟件CiteSpace 一般采用平均輪廓值(silhouette,S 值)與模塊值(modularity,Q 值)兩個指標評價詞語聚類的清晰度。其中,S 值反映類內(nèi)相似性和關(guān)聯(lián)性是否明顯及是否受其他類影響,取值范圍為[-1,1];Q 值反映類間差異性是否明顯,取值范圍為[0,1]。
本文利用軟件CiteSpace 進行“keyword”分析,最終選取閾值為top 50 為最優(yōu)聚類結(jié)果,如圖4,目前人工智能在國內(nèi)圖書情報領(lǐng)域的研究主要有8 類。這種條件下,Q=0.539 7,S=0.583 8,二者均大于0.5,可認為分類結(jié)果成立,但可以看出各類間仍存在一定聯(lián)系,關(guān)鍵詞的類間差異性和類內(nèi)相似性不夠突出。

圖4 關(guān)鍵詞聚類
對關(guān)鍵詞聚類結(jié)果進行時間軸劃分,如圖5。在國內(nèi)圖書情報領(lǐng)域人工智能的研究早期發(fā)展比較緩慢,進入2012 年,隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量迅速膨脹,人工智能在圖書情報領(lǐng)域的重要作用也更加明顯。這8 類中,對搜索引擎的研究最早開始,并持續(xù)發(fā)展,主要包括情報檢索系統(tǒng)、人工智能搜索技術(shù)、索引技術(shù)等。2010 年之后開始更加重視發(fā)展技術(shù),語義網(wǎng)絡(luò)、知識工程、數(shù)據(jù)挖掘開始成為國內(nèi)圖書情報領(lǐng)域人工智能研究的主流。其中,對語義網(wǎng)絡(luò)的研究主要包括神經(jīng)網(wǎng)絡(luò)、自動標引、虛詞表構(gòu)建等領(lǐng)域;知識工程重點關(guān)注知識組織、知識表示、知識服務(wù)以及本體的研究;數(shù)據(jù)挖掘充分發(fā)揮專家數(shù)據(jù)庫、自然語言處理等數(shù)據(jù)挖掘技術(shù)的優(yōu)勢。近年來,尤其是2016 年之后,國內(nèi)圖書情報領(lǐng)域在進一步提升人工智能技術(shù)的基礎(chǔ)上,更加重視人工智能所帶來的數(shù)據(jù)服務(wù)與應(yīng)用。數(shù)字(數(shù)字圖書館、數(shù)字學術(shù)、大數(shù)據(jù)等)、智能(智能空間、機器學習、智能倉儲及物聯(lián)網(wǎng)等)、機器人(數(shù)據(jù)服務(wù)、智能機器人、圖書館機器人)等利用人工智能技術(shù)實現(xiàn)的具體應(yīng)用與服務(wù)研究熱度提高,相關(guān)領(lǐng)域越來越廣。但高校圖書館、高校圖情工作仍作為重要的研究對象貫穿國內(nèi)圖書情報領(lǐng)域人工智能研究的發(fā)展。就關(guān)鍵詞互引關(guān)系來說,人工智能、信息服務(wù)、數(shù)字、知識、數(shù)據(jù)分析等是基礎(chǔ)性關(guān)鍵詞,在各類研究中引用關(guān)系密切,類間互引頻繁。

圖5 關(guān)鍵詞聚類時間軸
目前,國內(nèi)人工智能在圖書情報領(lǐng)域的研究主題彼此重疊、關(guān)系密切,交叉領(lǐng)域的研究較為多見。主要分為早期的理論基礎(chǔ)研究、中期的技術(shù)進步、及目前的實際應(yīng)用與個性化服務(wù),其中,智慧圖書館、智能數(shù)據(jù)服務(wù)、大數(shù)據(jù)技術(shù)、知識工程、物聯(lián)網(wǎng)等是近年來的研究熱點。中心度較高的主題又稱為新研究方向的潛力,例如,機器學習、深度學習、數(shù)字人文、數(shù)字參考咨詢服務(wù)等。
智慧圖書館是一種公共智慧服務(wù),通過融合價值、理性與實踐智慧建立更廣泛的信息共享空間與更具吸引力的公共文化環(huán)境,是圖書館發(fā)展的新模式。目前,智慧圖書館的研究主要停留在圍繞智能搜索、推薦服務(wù)等技術(shù)為核心,提高圖書館工作效率和效果的“智能”階段[16]。未來,人工智能在圖書館的應(yīng)用將更加趨向“智慧化”,主要將圍繞三方面:(1)構(gòu)建智能管理體系。結(jié)合圖書館內(nèi)容和人工智能技術(shù),構(gòu)建自動借閱系統(tǒng)、圖書全幀系統(tǒng)等,智能化整合圖書館文獻資源,升級智慧化管理模式及服務(wù)流程[17]。(2)重新審視閱讀與圖書館服務(wù)。對海量異構(gòu)文獻實現(xiàn)快速總結(jié)型閱讀、發(fā)現(xiàn)型閱讀、知識構(gòu)建型閱讀及建構(gòu)與評價型閱讀等,使閱讀服務(wù)貫穿“數(shù)據(jù)-信息-知識-智慧-解決方案”發(fā)展的全過程,形成主動、雙向、創(chuàng)建的服務(wù)模式[18]。(3)提供智慧圖書館個性化智能服務(wù)。不斷加大重視用戶數(shù)據(jù)與信息的力度,加快更新分析技術(shù)與工具的速度,為讀者提供更高效的個性化信息服務(wù)[19]。這要求圖書館員為用戶提供可計算、可操作、可分析的知識資源,使用戶逐步具備自主分析與挖掘知識的能力[20]。(4)將人工智能的智能語音及計算機視覺等技術(shù)連接圖書館資源,利用智能機器人為圖書館用戶提供智能、精準、有效服務(wù)的同時,提升圖書館各項服務(wù)的人性化和智慧化[21]。
大數(shù)據(jù)時代,信息數(shù)據(jù)以爆炸式速度增長。傳統(tǒng)數(shù)據(jù)處理與分析技術(shù)已不能適應(yīng)當前數(shù)據(jù)分析處理及可視化等一系列需求。與此同時,人工智能開始在智能數(shù)據(jù)服務(wù)中占據(jù)越來越重要的地位,尤其是社交網(wǎng)絡(luò)數(shù)據(jù)的挖掘與分析成為國內(nèi)圖書情報領(lǐng)域人工智能研究的熱點和趨勢。社交網(wǎng)絡(luò)以其數(shù)據(jù)量大、更新速度快、表現(xiàn)形式多樣的獨特性為人工智能技術(shù)的發(fā)展提出新的挑戰(zhàn),研究可以從以下兩個方面展開:(1)對社交網(wǎng)絡(luò)數(shù)據(jù)的文本挖掘與情感分析,實現(xiàn)偏好預(yù)測。社交網(wǎng)絡(luò)產(chǎn)生大量復雜、多樣的數(shù)據(jù)信息,出現(xiàn)多種基于社交網(wǎng)絡(luò)準確識別并預(yù)測用戶情感偏好的模型[22]。基于社交網(wǎng)絡(luò)用戶在線評論的屬性特征,通過程序語言量化分析評論文本情感極性[23]。(2)對社交網(wǎng)絡(luò)數(shù)據(jù)的用戶行為與關(guān)系分析、傳播分析,實現(xiàn)數(shù)據(jù)可視化。基于自我建構(gòu)理論、自我決定理論、計劃行為理論等,構(gòu)建社交網(wǎng)絡(luò)知識共享行為動機模型[24]。通過語義網(wǎng)、自然語言處理等技術(shù),結(jié)合可視化及數(shù)據(jù)聚類技術(shù)實現(xiàn)社交網(wǎng)絡(luò)數(shù)據(jù)信息交互式可視化[25]。
隨著國內(nèi)圖書情報領(lǐng)域人工智能研究對知識工程需求的不斷增加,其關(guān)鍵技術(shù)創(chuàng)新也從早期的專家系統(tǒng)、知識庫、本體等簡單、單一技術(shù)朝知識融合、知識圖譜、機器學習等綜合性、系統(tǒng)性方向發(fā)展,并成為知識工程研究的趨勢之一。其中:(1)知識融合成為知識化和智能化過程的關(guān)鍵環(huán)節(jié)。在大數(shù)據(jù)環(huán)境和人工智能技術(shù)發(fā)展的雙重因素作用下,知識融合為完善知識服務(wù)、智慧服務(wù)、催生高級智能形態(tài)提供重要理論和技術(shù)支撐[26]?;谙到y(tǒng)論、相關(guān)性原理和三螺旋理論提出科學知識結(jié)構(gòu)融合主題表征方法,定義“主題指紋”概念并構(gòu)建知識結(jié)構(gòu)模型[27]。(2)重新定義知識發(fā)現(xiàn)。一方面在大數(shù)據(jù)和機器學習的支持下,智能檢索越來越普遍[28]。例如,Google Scholar、我國國家科技圖書文獻中心的智能搜索引擎等,支持知識組織與關(guān)聯(lián)檢索。另一方面出現(xiàn)了越來越豐富的知識挖掘方法。通過機器學習、文本分析、知識對象抽取等方法,對數(shù)字化可計算化內(nèi)容進行知識計算,從而實現(xiàn)深度的知識發(fā)現(xiàn)[29]。(3)知識表達需要重新定義。知識內(nèi)容正逐步建立與完善從獲取數(shù)據(jù)、抽取特征與規(guī)范、解析對象與關(guān)系、構(gòu)建圖譜的知識圖譜機制(Knowledge Graph)[20]。知識圖譜自2012 年被谷歌首次提出以后,迅速成為知識工程領(lǐng)域關(guān)注的研究熱點。知識圖譜支持識別對象、推理關(guān)系、理解文本等方法,同時進一步支持智能檢索、知識管理與推薦及各類智能應(yīng)用。知識推理是知識圖譜補全的重要手段,基于神經(jīng)網(wǎng)絡(luò)的知識推理方法具備更強的推理能力和泛化能力,對知識庫中實體、屬性、關(guān)系和文本信息的利用率更高,推理效果更好[30]。(4)當前機器學習在國內(nèi)圖書情報領(lǐng)域的研究熱點主要在于文本分類自動化、數(shù)據(jù)信息檢索智能化、推薦服務(wù)個性化等方面[31]。
本文將CNKI 中圖書情報領(lǐng)域人工智能方向的研究論文通過軟件CiteSpace,從發(fā)文力量和研究演進角度進行分析,探究國內(nèi)圖書情報領(lǐng)域人工智能研究的演化過程,將圖書情報領(lǐng)域的人工智能研究分為智能、語義網(wǎng)絡(luò)、高校、機器人、數(shù)據(jù)挖掘、知識工程、搜索引擎、數(shù)字8 類。自2016 年起人工智能在國內(nèi)圖書情報領(lǐng)域方面的研究進入快速增長階段,現(xiàn)有研究主題聯(lián)系密切、彼此重疊,存在領(lǐng)域交叉現(xiàn)象。智慧圖書館、智能數(shù)據(jù)服務(wù)、知識工程等主題作為近年來國內(nèi)圖書情報領(lǐng)域人工智能的研究熱點仍有深入探討的空間。機器學習、知識圖譜、語義網(wǎng)絡(luò)等人工智能技術(shù)的發(fā)展也拓展了國內(nèi)圖書情報領(lǐng)域的研究潛力。
與此同時,在推進國內(nèi)圖情領(lǐng)域人工智能研究發(fā)展的過程中,還需要從人文、政策、法律等方面為構(gòu)建人工智能全球治理機制貢獻力量。另外,積極推進圖書情報領(lǐng)域人工智能應(yīng)用的產(chǎn)學研協(xié)同合作,不斷豐富和延伸圖書情報領(lǐng)域的研究方法,推動學科之間深度交叉融合,在大數(shù)據(jù)與人工智能環(huán)境下發(fā)揮我國圖書情報領(lǐng)域更大的作用。