◎盧 春
(山東財(cái)經(jīng)大學(xué)圖書館,山東 濟(jì)南 250014)
作為國(guó)家文化發(fā)展的重要標(biāo)志,圖書館的現(xiàn)代化建設(shè)是推動(dòng)全民閱讀、文化強(qiáng)國(guó)的重要環(huán)節(jié)[1]。然而,圖書館的現(xiàn)代化建設(shè)必然要依托于當(dāng)前已有的或是在未來中可以預(yù)見的技術(shù)條件才能推進(jìn)。隨著科技水平的進(jìn)一步提升,信息領(lǐng)域已經(jīng)大踏步進(jìn)入人工智能大數(shù)據(jù)時(shí)代,圖書館系統(tǒng)也已經(jīng)迎來新一輪技術(shù)革新[2]。本文將聚焦于人工智能在大學(xué)圖書館的應(yīng)用現(xiàn)狀,通過調(diào)查統(tǒng)計(jì)進(jìn)一步闡釋人工智能技術(shù)在大學(xué)圖書館領(lǐng)域應(yīng)用的優(yōu)勢(shì)和可能會(huì)遇到的實(shí)際問題,對(duì)于我國(guó)大學(xué)圖書館轉(zhuǎn)型和進(jìn)一步提升拓展服務(wù)功能具有較強(qiáng)的借鑒意義。
人工智能一直是計(jì)算機(jī)領(lǐng)域重要的分支之一,發(fā)展歷程起起伏伏,例如在20世紀(jì)80年代隨著計(jì)算機(jī)行業(yè)的迅猛發(fā)展出現(xiàn)了一段高潮期后便進(jìn)入沉寂期,直到21世紀(jì)初,在神經(jīng)網(wǎng)絡(luò)領(lǐng)域的重大突破才讓人工智能再次突破瓶頸而興起。正是由于個(gè)人終端(如個(gè)人電腦、手機(jī)、數(shù)碼相機(jī)、錄音設(shè)備、存儲(chǔ)設(shè)備等)和互聯(lián)網(wǎng)云技術(shù)在近20年的迅速發(fā)展中形成了海量數(shù)據(jù),為訓(xùn)練和提升人工智能的各種算法提供了基礎(chǔ)大數(shù)據(jù)。人工智能技術(shù)已經(jīng)廣泛進(jìn)入公眾生活,以圖形、聲音識(shí)別為代表的一系列高新技術(shù)為民眾生活帶來了便利,盡管各個(gè)行業(yè)都開始關(guān)注人工智能領(lǐng)域,但苦于沒有相關(guān)人才,導(dǎo)致技術(shù)轉(zhuǎn)化相對(duì)緩慢。目前,人工智能領(lǐng)域的發(fā)展對(duì)圖書館建設(shè)將帶來何種影響尚未有定論。在部分實(shí)際操作方面,人工智能毫無疑問通過優(yōu)化搜索功能、人機(jī)互動(dòng)、文本挖掘,已經(jīng)開始改變圖書館的服務(wù)模式。
人工智能已經(jīng)被公認(rèn)為信息領(lǐng)域的重要發(fā)展方向,但在圖書館領(lǐng)域的應(yīng)用尚處于嘗試階段。目前可以確定的是人工智能將會(huì)深度影響學(xué)者的文獻(xiàn)搜索過程,并且人工智能的兩個(gè)重要分支人機(jī)互動(dòng)和數(shù)據(jù)挖掘,已經(jīng)在學(xué)術(shù)圖書館領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力[3]。人機(jī)對(duì)話指的是可以通過文本、聲音等方式開啟智能對(duì)話,即圖靈檢驗(yàn)中所指的人類無法分辨與之對(duì)話的一方究竟是人類還是機(jī)器。人機(jī)對(duì)話目前已經(jīng)可以利用關(guān)鍵字提取等方法回答一些方向性較為明確的問題,對(duì)于提升讀者的文獻(xiàn)查詢效率目前已取得了一定的效果,其優(yōu)勢(shì)在于可以全天候服務(wù)讀者、回復(fù)結(jié)果相較于人類具有更高的一致性,利于監(jiān)管和提升服務(wù)水平。但人機(jī)對(duì)話目前尚有不少局限,例如,互動(dòng)過程中表現(xiàn)出遠(yuǎn)遠(yuǎn)低于人腦的靈活性,回復(fù)過于機(jī)械化,無法維持或者提升讀者的用戶體驗(yàn)感和親和力。涉及語(yǔ)音互動(dòng)的系統(tǒng)在方言、口語(yǔ)表達(dá)等方面缺少大數(shù)據(jù)積累,無法讓人工智能進(jìn)行大數(shù)據(jù)學(xué)習(xí),自我提升算法的準(zhǔn)確度和運(yùn)算效率,而這一模塊又是圖書館領(lǐng)域較為欠缺的領(lǐng)域,人工智能技術(shù)尤其是高效的語(yǔ)音識(shí)別系統(tǒng),可以迅速解決這方面的發(fā)展瓶頸問題,但這一功能往往僅被年輕讀者所接受,而在年齡較大或者殘障讀者群體中流行程度偏低[4]。數(shù)據(jù)挖掘指的是通過算法對(duì)文本、圖像、聲音等信息進(jìn)行大規(guī)模整理、搜索和再編排,這一技術(shù)特別適用于當(dāng)下的信息爆炸時(shí)代,大量學(xué)術(shù)發(fā)表迫使讀者花費(fèi)大量時(shí)間排除無關(guān)文獻(xiàn),但這一技術(shù)往往受到知識(shí)版權(quán)和相關(guān)軟件的限制。對(duì)于絕大多數(shù)的出版物,僅有題目、作者。出版相關(guān)信息(地點(diǎn)、出版商、年份)等可以公開查詢,在沒有得到版權(quán)所有者許可的情況下不可以提供公開的渠道對(duì)出版物未公開內(nèi)容進(jìn)行查詢。作為連接出版物和讀者的紐帶,圖書館在獲取相關(guān)證書、區(qū)別不同軟件等方面具有更大的發(fā)揮空間,但現(xiàn)在絕大多數(shù)圖書館尚未開啟這方面的調(diào)研或?qū)嶋H應(yīng)用。此外,人工智能的重要性在以大學(xué)等為代表的高等教育機(jī)構(gòu)中日趨明顯,主要集中于個(gè)人精細(xì)化學(xué)習(xí)方式、學(xué)習(xí)效果監(jiān)督、智能導(dǎo)師等方向,這一趨勢(shì)也開始影響圖書館的服務(wù)模式,隨著人工智能技術(shù)不斷深入各個(gè)領(lǐng)域,使用者也開始逐漸意識(shí)到其潛在的弊端。首當(dāng)其沖的問題是如何保護(hù)使用者的隱私。人工智能不同于傳統(tǒng)軟件技術(shù),其各種軟件算法可以通過獨(dú)立學(xué)習(xí)大量數(shù)據(jù)不斷完善自身,因此獲取大量數(shù)據(jù)用以學(xué)習(xí)是達(dá)到智能化的前提,但這也提出了新的挑戰(zhàn),如何保護(hù)個(gè)人數(shù)據(jù)不會(huì)被用于其他用途以及如何劃分商業(yè)服務(wù)與公共服務(wù)之間的界限,成為法律、科技倫理、學(xué)術(shù)界所共同關(guān)注的焦點(diǎn)[5]。人工智能所面臨的第二個(gè)主要問題是如何保證其運(yùn)算結(jié)果的可信度,以及過程的透明化。人工智能的運(yùn)算過程是一個(gè)變化的學(xué)習(xí)過程,取決于基礎(chǔ)數(shù)據(jù)的不斷收集和算法的更新。這就造成了整個(gè)運(yùn)算過程不夠透明,導(dǎo)致最終呈現(xiàn)在讀者面前的搜索結(jié)果趨同化,進(jìn)而影響某個(gè)領(lǐng)域的多樣化發(fā)展,抑或是大型出版商可以通過干預(yù)基層算法的設(shè)置來直接影響讀者所搜索到的出版物而從中獲利。但是,這些觀察基于定性分析,依然存在很大的不確定性。
本文研究的對(duì)象集中于學(xué)術(shù)型大學(xué)圖書館,這些圖書館往往具有相似的管理模式和資金來源,由于學(xué)校本身的學(xué)術(shù)研究能力較強(qiáng),因而其學(xué)術(shù)資源也相對(duì)更加豐富,工作人員的專業(yè)素養(yǎng)相對(duì)較高,對(duì)于人工智能等新型技術(shù)也更加具有開放性,具有更好的橫向比較意義。本文通過這些大學(xué)或者圖書館網(wǎng)站對(duì)以下關(guān)鍵詞進(jìn)行搜索:人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、文本發(fā)掘。同時(shí),通過訪問圖書館工作人員或者收集這些大學(xué)圖書館近期發(fā)展總體規(guī)劃白皮書(2017—2022)、研究規(guī)劃、相關(guān)課程、學(xué)生團(tuán)體、初創(chuàng)公司和企業(yè)合作等相關(guān)信息,通過定性或者定量分析,總結(jié)人工智能在大學(xué)圖書館的應(yīng)用程度,進(jìn)而分析人工智能技術(shù)在圖書館領(lǐng)域的應(yīng)用前景和目前遇到的主要問題。
統(tǒng)計(jì)結(jié)果中最引人注目的是沒有幾家大學(xué)圖書館在最近五年的總體規(guī)劃中提到人工智能。大部分單位提到了數(shù)字創(chuàng)新技術(shù),或者大規(guī)模數(shù)字化書籍。盡管大學(xué)圖書館在總體規(guī)劃中并沒有明確提及人工智能,但這些大學(xué)都在不同程度上推動(dòng)了人工智能在當(dāng)下的發(fā)展。最明顯的例證是,全部大學(xué)均開設(shè)了大量不同形式的人工智能課程,這些課程不僅僅局限于計(jì)算機(jī)系,而是面向全校師生,并提供暑期學(xué)校、創(chuàng)業(yè)培訓(xùn)等多種學(xué)習(xí)模式。部分頂尖高校還會(huì)調(diào)撥專項(xiàng)資金為人工智能領(lǐng)域下的各種學(xué)生團(tuán)體和研究小組提供場(chǎng)地及資金來推動(dòng)創(chuàng)新。雖然這些大學(xué)都對(duì)人工智能領(lǐng)域表現(xiàn)出了極大的關(guān)注,但僅有極少數(shù)大學(xué)的圖書館提供相關(guān)培訓(xùn),而且這些培訓(xùn)往往集中于已有的算法或者軟件的調(diào)用,常常與計(jì)算機(jī)編程培訓(xùn)合并進(jìn)行。在調(diào)研過程中,尚未發(fā)現(xiàn)有大學(xué)圖書館主導(dǎo)的人工智能科研項(xiàng)目、學(xué)術(shù)會(huì)議或者工作坊。這一現(xiàn)象的根本原因在于高校圖書館目前的信息管理——查詢依然采用傳統(tǒng)的文獻(xiàn)學(xué)管理模式,主要依靠關(guān)鍵詞(包括題目、主題、文章關(guān)鍵詞、出版年份、作者、出版商、文獻(xiàn)所屬領(lǐng)域等)進(jìn)行精確或者模糊匹配。圖書館的文獻(xiàn)整理和查詢往往通過圖書卡片進(jìn)行,互聯(lián)網(wǎng)興起之后則通過電腦、手機(jī)等個(gè)人終端進(jìn)行操作,毫無疑問查找效率極大提高,但底層邏輯依然遵循關(guān)鍵信息配備,而非人工智能所提倡的動(dòng)態(tài)學(xué)習(xí)模式。不過,這些高校擁有的大量?jī)?yōu)質(zhì)人工智能團(tuán)隊(duì)是其他業(yè)界(例如出版界)所無法比擬的,高校圖書館應(yīng)該更加積極地參與到人工智能的發(fā)展當(dāng)中,向人工智能界充分闡釋圖書館的客戶需求以及客戶特點(diǎn),并整合提供多年來服務(wù)于學(xué)校不同專業(yè)所積累的經(jīng)驗(yàn),通過數(shù)據(jù)分享和算法研發(fā),尋找最新的解決方案。
調(diào)研過程中發(fā)現(xiàn),有部分大學(xué)已經(jīng)開始利用手機(jī)圖書館APP、微信小程序、公眾號(hào)等服務(wù)在校師生,極大地提高了圖書信息搜索的便捷程度,也因此產(chǎn)生了大量用戶數(shù)據(jù)。而這些用戶數(shù)據(jù)恰好為發(fā)展個(gè)人精細(xì)化學(xué)習(xí)、終身學(xué)習(xí),甚至是研究學(xué)校不同專業(yè)的發(fā)展趨勢(shì)等提供了重要的一手資料。對(duì)于在校師生而言,實(shí)時(shí)獲取最新的出版物(包括期刊、書籍等)是增強(qiáng)科研競(jìng)爭(zhēng)力的關(guān)鍵,對(duì)于學(xué)校校圖書館而言,如何利用有限的資金進(jìn)行合理分配,最大程度地滿足師生科研教學(xué)的需要是重中之重。由于不同學(xué)校、不同專業(yè)的人數(shù)和研究方向不同,還要同時(shí)考慮到科研教學(xué)的動(dòng)態(tài)變化,大學(xué)圖書館很難全面、實(shí)時(shí)地跟蹤每一個(gè)專業(yè)領(lǐng)域配置的資料。人工智能的引入勢(shì)必會(huì)幫助學(xué)校圖書館更加系統(tǒng)地提供服務(wù)。例如,通過人工智能程序監(jiān)督學(xué)習(xí)某一特定專業(yè)本科生的借閱模式,輔以該專業(yè)本科教育的課程大綱,結(jié)合該專業(yè)重要期刊最新的研究成果,便可以實(shí)時(shí)根據(jù)學(xué)生的學(xué)習(xí)進(jìn)度推薦相關(guān)書籍或?qū)I(yè)文章。這一模式也可以推廣到教師的科研備課過程中,例如,根據(jù)教師的專業(yè)方向和教學(xué)內(nèi)容,及時(shí)推薦與之相關(guān)的最新科研成果(書籍、科研文章、專利等),教師也可以根據(jù)所推薦的內(nèi)容做出相應(yīng)反饋,表達(dá)相關(guān)推薦能夠在何種程度上幫助自身的科研教學(xué)、項(xiàng)目申請(qǐng)完成等,這樣量化反饋同樣是珍貴的算法學(xué)習(xí)數(shù)據(jù),通過自動(dòng)上傳并加以學(xué)習(xí)后可以進(jìn)一步優(yōu)化系統(tǒng)所推薦的科研信息,形成良性循環(huán),在節(jié)省大量圖書館人力物力的同時(shí),更加精確地優(yōu)化圖書館的資源配置,全方位提高讀者的學(xué)習(xí)效率和圖書館的服務(wù)質(zhì)量。
人工智能的另一個(gè)重要數(shù)據(jù)來源是圖書館的主動(dòng)采集,主要方式是三位立體掃描或者高清二維掃描。這一方法最早源自對(duì)于竹簡(jiǎn)、甲骨文等古代書籍或者近代報(bào)紙、檔案、書信、地方志等重要的不可再生信息的保護(hù),即讀者不用接觸實(shí)體書報(bào)便可查找信息,而這些珍貴資料也可以交付專業(yè)的文物保護(hù)機(jī)構(gòu)妥善保存。再過去的十年中,許多高校十分注重對(duì)于文物古籍以及校史檔案的保護(hù),多數(shù)圖書館也采購(gòu)了相關(guān)儀器進(jìn)行信息電子化,為人工智能的引入奠定了重要的基礎(chǔ)。目前這些信息往往以圖片的形式保存,且很多資料以古代字體為主,無法通過關(guān)鍵字直接搜索,導(dǎo)致查詢十分不便,但通過人工智能的圖片識(shí)別則完全可以實(shí)現(xiàn)查詢自動(dòng)化,為人工智能在圖書館服務(wù)方面創(chuàng)造新的應(yīng)用領(lǐng)域。
調(diào)研的另一個(gè)發(fā)現(xiàn)是大學(xué)圖書館在人工智能的外延領(lǐng)域,例如在大數(shù)據(jù)庫(kù)的建設(shè)和公眾宣傳方面依然具有巨大的發(fā)展?jié)摿ΑW鳛榇髮W(xué)里的重要基礎(chǔ)設(shè)施之一,圖書館肩負(fù)著保存和傳承知識(shí)、全方位服務(wù)師生等多種重要使命。目前高校的人工智能團(tuán)隊(duì)多以項(xiàng)目為中心,項(xiàng)目負(fù)責(zé)人帶頭,中堅(jiān)力量為博士后研究員,實(shí)行聘任制,可以集中團(tuán)隊(duì)力量進(jìn)行攻關(guān),但是項(xiàng)目一旦結(jié)束,在科研過程中搜集或者創(chuàng)造的大量科研數(shù)據(jù)則會(huì)面臨無人監(jiān)督的窘境,盡管科研成果可以通過各種形式予以發(fā)表,但是這些珍貴的元數(shù)據(jù)往往難以全部發(fā)表,而這些數(shù)據(jù)大多具有多重應(yīng)用價(jià)值,如果能夠整合保存起來,可以很大程度上減少未來科研人員的重復(fù)勞動(dòng)。同時(shí),這些數(shù)據(jù)也可以為人工智能的自我學(xué)習(xí)提供幫助,預(yù)測(cè)某一個(gè)領(lǐng)域的發(fā)展方向。圖書館在這方面有得天獨(dú)厚的條件,管理人員接受過相關(guān)專業(yè)訓(xùn)練,對(duì)于信息的保存和管理駕輕就熟,將高校科研團(tuán)隊(duì)收集或者產(chǎn)生的大量數(shù)據(jù)加以整合,為科研提供長(zhǎng)期數(shù)據(jù)支持,可以作為圖書館參與人工智能領(lǐng)域發(fā)展的重要結(jié)合點(diǎn)。圖書館不僅要為學(xué)校師生整合最優(yōu)質(zhì)便利的學(xué)術(shù)資源,同樣也可以提供設(shè)施完善的會(huì)議場(chǎng)所。人工智能的從業(yè)者往往以年輕人為主,工作模式也非常多樣化。我們發(fā)現(xiàn),人工智能以編程愛好者為主,在校學(xué)生居多,運(yùn)行模式即是在主要的人工智能大學(xué)、企業(yè)或者社會(huì)公益單位等現(xiàn)場(chǎng)舉辦編程競(jìng)賽,而這些活動(dòng)往往缺少基礎(chǔ)設(shè)施完善的大型場(chǎng)地,這種形式新穎且模式靈活的競(jìng)賽活動(dòng)已經(jīng)被人工智能界廣為接受,但對(duì)于圖書館依然陌生,通過協(xié)助舉辦人工智能相關(guān)的學(xué)術(shù)會(huì)議、主題講座、編程競(jìng)賽等活動(dòng),展示人工智能領(lǐng)域最新的研究成果等,同樣可以為圖書館和人工智能領(lǐng)域搭建起更加多樣化的溝通橋梁。
人工智能為高校圖書館現(xiàn)代化提供了重要契機(jī)的同時(shí),也提出了新的挑戰(zhàn),在圖書館領(lǐng)域擁有巨大潛力,可以幫助圖書館全面提升在大學(xué)科研教學(xué)過程中的服務(wù)效率。目前急需解決的問題是在圖書館與人工智能專業(yè)之間建立有效的溝通機(jī)制,讓雙方充分了解各自的優(yōu)勢(shì)。圖書館所屬大學(xué)擁有世界一流的人工智能教學(xué)和創(chuàng)業(yè)環(huán)境,或可借助圖書館長(zhǎng)期積累的用戶數(shù)據(jù)和成熟的人工智能算法體系實(shí)現(xiàn)井噴式發(fā)展。通過長(zhǎng)期合作實(shí)踐,建立完善相關(guān)的規(guī)范和法律,從制度上實(shí)現(xiàn)系統(tǒng)開發(fā)、版權(quán)、知識(shí)分享、個(gè)人精細(xì)化學(xué)習(xí)、終身學(xué)習(xí)等一系列社會(huì)目標(biāo)。這對(duì)于人工智能和整個(gè)圖書館行業(yè)今后的發(fā)展具有一定的借鑒意義,如果能在二者之間迅速架起一座溝通的橋梁,不僅可以擴(kuò)展人工智能的應(yīng)用領(lǐng)域,幫助圖書館行業(yè)加速實(shí)現(xiàn)現(xiàn)代化,同時(shí)也可以幫助我國(guó)在這一領(lǐng)域建立國(guó)際規(guī)范,進(jìn)一步提升國(guó)際領(lǐng)導(dǎo)力。