摘? ?要:近年來(lái),在算法、數(shù)據(jù)和算力的綜合推動(dòng)下,生成式人工智能(AIGC)的發(fā)展進(jìn)入爆發(fā)期,AIGC的應(yīng)用在各行業(yè)迅速展開。對(duì)圖書館行業(yè)來(lái)說(shuō),AIGC的應(yīng)用可大大提升用戶體驗(yàn),為圖書館創(chuàng)新服務(wù)模式和內(nèi)容帶來(lái)無(wú)限可能,但也潛藏著諸多不利因素。如何規(guī)避風(fēng)險(xiǎn),最大化利用AICG助力圖書館發(fā)展,需要圖書館提前謀劃,制定出有效的應(yīng)對(duì)策略。
關(guān)鍵詞:生成式人工智能;AIGC ChatGPT;圖書館
中圖分類號(hào):G251? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2023021
Abstract The advent of Artificial Intelligence Generated Content(AIGC), exemplified by OpenAI's large-scale model ChatGPT, has garnered global attention and sparked a new wave of AI revolution. While AIGC offers opportunities for intelligent information retrieval, transformative library experiences, and the development of metaverse libraries, it also has the potential to alter readers' search and reading habits, amplifying the existing technology and talent shortages in libraries. There are also risks involved, including copyright infringement and privacy breaches. To address these challenges, libraries can begin by enhancing and expanding their services through the implementation of chatbots and exploring the use of open-source models to train on existing library literature data. It is crucial for libraries to proactively address and mitigate the risks associated with the application of AIGC.
Key words Artificial Intelligence Generated Content(AIGC);ChatGPT; intelligent libraries, intelligent retrieval;opportunities; strategies
2022年11月30 日,由美國(guó)人工智能研究公司OpenAI研發(fā)的生成式人工智能聊天機(jī)器人程序ChatGPT正式上線,短短5天內(nèi)注冊(cè)用戶數(shù)就突破百萬(wàn),到2023年1月末,其活躍用戶數(shù)已達(dá)到1億,成為史上活躍用戶增長(zhǎng)最快的應(yīng)用程序。ChatGPT的推出引發(fā)了相關(guān)領(lǐng)域企業(yè)的強(qiáng)烈反映。2月2日,OpenAI的合作伙伴微軟公司宣布旗下所有產(chǎn)品將全線整合ChatGPT,包括搜索引擎必應(yīng)、Office以及云計(jì)算平臺(tái)Azure等,使微軟的所有產(chǎn)品具備AI能力。在國(guó)內(nèi),2月8日,阿里巴巴確認(rèn)正在研發(fā)“阿里版聊天機(jī)器人ChatGPT”;2月10日,京東宣布了其產(chǎn)業(yè)版ChatGPT——智能人機(jī)對(duì)話平臺(tái)ChatJD的落地應(yīng)用路線圖;3月16日,百度正式發(fā)布其生成式AI產(chǎn)品“文心一言”。與此同時(shí),ChatGPT更是引發(fā)了各行各業(yè)對(duì)生成式人工智能應(yīng)用場(chǎng)景及其對(duì)各行業(yè)影響的大討論,甚至已經(jīng)在為AIGC可能帶來(lái)的社會(huì)變革做好準(zhǔn)備。可以預(yù)見(jiàn),作為通用型多任務(wù)人工智能對(duì)話系統(tǒng)的一個(gè)里程碑,ChatGPT的推出將引發(fā)更多的機(jī)構(gòu)加入到AIGC的應(yīng)用及開發(fā)中來(lái),對(duì)包括圖書館在內(nèi)的各個(gè)行業(yè)也必將產(chǎn)生深遠(yuǎn)影響。本文通過(guò)分析生成式人工智能(AIGC)的特點(diǎn)、發(fā)展趨勢(shì)及圖書館應(yīng)用AIGC面臨的機(jī)遇與挑戰(zhàn),提出圖書館的應(yīng)對(duì)策略,以期為業(yè)界的相關(guān)研究和實(shí)踐提供參考。
1? ?AIGC的特點(diǎn)及發(fā)展趨勢(shì)
2014年,由前谷歌大腦研究科學(xué)家Lan Goodfellow等首次提出的生成對(duì)抗網(wǎng)絡(luò)模型(GAN)被認(rèn)為是生成式人工智能發(fā)展的開端[1]。GAN使用兩個(gè)相互對(duì)立的神經(jīng)網(wǎng)絡(luò)即生成器和識(shí)別器經(jīng)過(guò)交替周期訓(xùn)練賦予了人工智能深度學(xué)習(xí)模型以想象力,使其更接近人類思維[2]。而近幾年來(lái),隨著新的模型結(jié)構(gòu)如Transformer等的出現(xiàn)以及硬件能力的不斷提升,具有龐大數(shù)據(jù)參數(shù)的生成式人工智能大模型逐漸代替了之前的小模型,如OpenAI的GPT-3已經(jīng)具有1750億參數(shù)、96層Transformer解碼器[3]。由于參數(shù)越多的模型其表現(xiàn)越出色,加上軟硬件技術(shù)的發(fā)展提供的巨大算力,2022年ChatGPT的出現(xiàn),使生成式人工智能的發(fā)展迎來(lái)了爆發(fā)期[4]。綜合來(lái)看,目前AIGC有如下特點(diǎn)及發(fā)展趨勢(shì):
(1)基礎(chǔ)生成算法模型的不斷突破創(chuàng)新使AIGC能夠創(chuàng)造和生成內(nèi)容的類型日益多元,質(zhì)量也在不斷提升。除初期的GAN之外,近幾年涌現(xiàn)出一大批性能穩(wěn)定、各具特色的基礎(chǔ)生成算法模型,如2015年Stability AI推出的能夠根據(jù)文本描述生成高質(zhì)量圖像的diffusion模型,2017年谷歌推出的可并行、通用性強(qiáng)的Transformer模型,2021年初OpenAI推出的擁有強(qiáng)大特征抽取能力、能夠?qū)D像和任意文本聯(lián)系起來(lái)CLIP模型等。尤其是2022年,AI生成模型更是層出不窮,如文本-圖像生成模型Stable Diffusion、Imagen、DALL-E2,文本-3D生成模型Magic3D、Dreamfusion、Point·E,圖像-文本生成模型VisualGPT、Flamingo,文本-視頻生成模型Soundify、Phenaki,文本-音頻生成模型Whisper、AudioLM、Jukebox以及文本-代碼生成模型、文本-科學(xué)知識(shí)模型等[5]。這些強(qiáng)大的算法生成模型使得目前AIGC可生成文字、圖像、語(yǔ)音、視頻、程序代碼甚至3D物體和交互內(nèi)容等等多種類型的數(shù)據(jù)。
(2)大型預(yù)訓(xùn)練模型和遷移學(xué)習(xí)技術(shù)只需標(biāo)記少量數(shù)據(jù)就可實(shí)現(xiàn)微調(diào)預(yù)訓(xùn)練,很多情況下無(wú)需開發(fā)人員從頭開始訓(xùn)練,因而有效降低了AI訓(xùn)練成本[5]。同時(shí),預(yù)訓(xùn)練模型可以通過(guò)增加數(shù)據(jù)集和模型優(yōu)化來(lái)不斷擴(kuò)展其應(yīng)用場(chǎng)景和反應(yīng)的準(zhǔn)確性。理論上講,人類可以將世界上所有可獲得的文本、圖片等不同類型的數(shù)據(jù)加入預(yù)訓(xùn)練數(shù)據(jù)集即可自動(dòng)學(xué)習(xí)其中蘊(yùn)含的知識(shí)點(diǎn)而無(wú)需人工介入。而預(yù)訓(xùn)練模型在特定任務(wù)或領(lǐng)域上的微調(diào)模式也使其具有更大的伸縮和適應(yīng)性,因而能夠適用于多任務(wù)、多場(chǎng)景、多功能需求。成本的降低和適應(yīng)性提升了AIGC的通用化能力和內(nèi)容生產(chǎn)能力,使得同一個(gè)AIGC模型可以高質(zhì)量地完成多種內(nèi)容輸出任務(wù),成為數(shù)字內(nèi)容生產(chǎn)的“流水線”。
(3)多模態(tài)人工智能成為AIGC重要的發(fā)展和應(yīng)用方向。多模態(tài)技術(shù)能夠?qū)⒉煌B(tài)數(shù)據(jù),如圖像、文本、視頻進(jìn)行關(guān)聯(lián)從而實(shí)現(xiàn)跨模態(tài)檢索或不同模態(tài)數(shù)據(jù)的相互轉(zhuǎn)化和生成,大大提升了AIGC生成內(nèi)容的多樣性和AIGC的通用化能力[6]。如OpenAI推出的DALL-E2模型、CLIP&DALL-E模型,谷歌的Imagen模型等均可將用戶的自然語(yǔ)言轉(zhuǎn)化為圖片,根據(jù)用戶的描述生成逼真的圖像,CLIP&DALL-E模型還可實(shí)現(xiàn)跨模態(tài)檢索;DeepMind的Gato模型能夠同時(shí)執(zhí)行多達(dá)600多項(xiàng)任務(wù),可以一邊視頻游戲,一邊聊天,同時(shí)通過(guò)機(jī)械臂堆疊積木等[7]。現(xiàn)實(shí)世界中,人們很容易根據(jù)圖像、文本、視頻等多模態(tài)數(shù)據(jù)全面而準(zhǔn)確地學(xué)習(xí)和理解知識(shí),因而多模態(tài)技術(shù)的應(yīng)用也使得AIGC向接近人類思維邁了一大步。
(4)在算法、數(shù)據(jù)和算力的綜合推動(dòng)下,AIGC應(yīng)用已迅速展開。目前的應(yīng)用模式主要分為三大部分:一是基礎(chǔ)生成算法模型和通用預(yù)訓(xùn)練大模型應(yīng)用,往往由實(shí)力較強(qiáng)的企業(yè)推出,通過(guò)受控API、開源等方式提供模型應(yīng)用,如Stability.ai、OpenAI;二是按需對(duì)大模型進(jìn)行“專業(yè)訓(xùn)練”和調(diào)試形成定制化的小模型,使其成為能夠?yàn)榻逃⒔鹑凇髅健⒂螒虻雀餍袠I(yè)提供服務(wù)的技術(shù)平臺(tái);三是在上述基礎(chǔ)模型和定制化小模型的基礎(chǔ)上進(jìn)一步開發(fā)面向個(gè)人和企業(yè)用戶的應(yīng)用,形成最終產(chǎn)品,如聊天機(jī)器人、圖像生成軟件等。
2? ?AIGC應(yīng)用給圖書館帶來(lái)的機(jī)遇
2.1? ? 多模態(tài)技術(shù)助力全新的智慧檢索體驗(yàn)
AIGC中多模態(tài)技術(shù)的應(yīng)用不僅解決了信息檢索中的“異構(gòu)鴻溝”問(wèn)題,還可將多模態(tài)數(shù)據(jù)進(jìn)行更深層次的精細(xì)關(guān)聯(lián),從而實(shí)現(xiàn)精準(zhǔn)的跨模態(tài)信息檢索而為用戶帶來(lái)全新體驗(yàn)。自媒體時(shí)代,圖像、文本、視頻等多模態(tài)數(shù)據(jù)呈爆炸式增長(zhǎng),圖書館文獻(xiàn)資源載體也日益多元,通過(guò)多模態(tài)技術(shù)實(shí)現(xiàn)以圖搜文、以文搜圖,使用戶更方便、快捷地找到自己想要的文獻(xiàn)。如用戶可通過(guò)輸入文字找到自己想要的視頻或圖片,也可通過(guò)輸入圖像找到文字或進(jìn)行混合搜索,改變了傳統(tǒng)的用文字搜文字、用圖片搜圖片的單一檢索模式。這不僅能有效提高文獻(xiàn)利用率,還可為圖書館的資源建設(shè)、資源組織和知識(shí)管理提供新的思路。首先,檢索方式的改變,使得圖書館館內(nèi)資源、網(wǎng)絡(luò)資源、館外機(jī)構(gòu)資源和其他資源的整合與共享更加容易,囿于用戶無(wú)法統(tǒng)一檢索而帶來(lái)的資源整合障礙有望盡快消除;其次,AIGC在文本、圖像、視頻等多模態(tài)數(shù)據(jù)間建立精細(xì)關(guān)聯(lián)的功能也有助于建立資源結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù)之間的關(guān)聯(lián),從而實(shí)現(xiàn)文獻(xiàn)資源的重新聚類和分類揭示,為用戶提供更精準(zhǔn)和多樣化的信息。目前,跨模態(tài)檢索技術(shù)已經(jīng)在公安、傳媒及醫(yī)學(xué)領(lǐng)域展開應(yīng)用,但模態(tài)數(shù)據(jù)特征表示還不夠精細(xì)、不同模態(tài)特征之間細(xì)粒度對(duì)應(yīng)關(guān)系的聯(lián)想捕捉等問(wèn)題,導(dǎo)致其在真實(shí)場(chǎng)景下的泛化能力受限[8]。2022年以來(lái)AIGC的爆發(fā)性發(fā)展使得業(yè)界對(duì)多模態(tài)技術(shù)向著更深的領(lǐng)域探索,其應(yīng)用領(lǐng)域也在逐步擴(kuò)展,在圖書館行業(yè)的應(yīng)用也指日可待。
2.2? ? AIGC應(yīng)用助力智能圖書館向智慧圖書館轉(zhuǎn)變
事實(shí)上,人工智能技術(shù)早已被廣泛應(yīng)用于圖書館,如智能檢索、智能咨詢、智能導(dǎo)航等,相較于傳統(tǒng)圖書館服務(wù),智能技術(shù)的應(yīng)用使圖書館服務(wù)更加專業(yè)化、智能化、人性化。建立在基礎(chǔ)算法模型、預(yù)訓(xùn)練模型等通用大模型基礎(chǔ)上,并經(jīng)過(guò)專業(yè)訓(xùn)練和調(diào)式的AIGC應(yīng)用則會(huì)給圖書館服務(wù)帶來(lái)更大的變革,有望推動(dòng)圖書館服務(wù)由智能化向智慧化轉(zhuǎn)變。以圖書館聊天機(jī)器人為例,目前的圖書館聊天機(jī)器人采用的是基于規(guī)則的模型,通過(guò)規(guī)則來(lái)匹配最正確的答案,因而僅能根據(jù)預(yù)設(shè)規(guī)則回答用戶有限的問(wèn)題,對(duì)于用戶提出的新問(wèn)題或復(fù)雜查詢難以處理,且回答問(wèn)題生硬機(jī)械,無(wú)法滿足用戶的實(shí)時(shí)交互和個(gè)性化需求,達(dá)不到參考咨詢服務(wù)的智慧化。而基于AIGC應(yīng)用開發(fā)的聊天機(jī)器人如ChatGPT在自然語(yǔ)言生成任務(wù)上已達(dá)到了非常高的水平,不僅擁有語(yǔ)言理解和文本生成能力,還具有編寫和調(diào)試計(jì)算機(jī)程序、翻譯、撰寫論文,進(jìn)行電視劇、故事、音樂(lè)、詩(shī)歌、繪畫等的創(chuàng)作能力。在處理參考咨詢?nèi)蝿?wù)方面具有更大的查詢范圍和精確度、較高的處理復(fù)雜問(wèn)題的能力,能根據(jù)聊天上下文進(jìn)行互動(dòng),與真實(shí)人類聊天場(chǎng)景幾無(wú)差異。理論上講,圖書館可以將世界上所有可獲得的文本、圖片等不同類型的數(shù)據(jù)加入預(yù)訓(xùn)練數(shù)據(jù)集,讓聊天機(jī)器人更智慧、更接近人類思維,從而滿足用戶的多樣化需求。除了聊天機(jī)器人,AIGC依據(jù)自然語(yǔ)言自動(dòng)輸出內(nèi)容的特性,在圖書館閱讀推廣、特殊群體服務(wù)、用戶培訓(xùn)等方面也會(huì)發(fā)揮重要作用。如文獻(xiàn)的多語(yǔ)言翻譯、盲文翻譯、館藏文獻(xiàn)的多元化展示等;在用戶培訓(xùn)方面,AIGC應(yīng)用將創(chuàng)造高質(zhì)量的沉浸式內(nèi)容,如按需生成視頻、創(chuàng)建三維空間導(dǎo)覽等,可為用戶帶來(lái)多感官、互動(dòng)性的時(shí)空體驗(yàn),獲得最佳培訓(xùn)效果。
2.3? ? AIGC助推圖書館元宇宙的發(fā)展
元宇宙是對(duì)虛擬世界的高度模擬,是趨近真實(shí)、虛實(shí)融合的互聯(lián)網(wǎng)應(yīng)用和社會(huì)形態(tài)。元宇宙時(shí)代的圖書館是實(shí)體空間和虛擬空間、實(shí)體館藏和虛擬館藏相互融合,為用戶同時(shí)提供實(shí)體空間服務(wù)和虛擬空間服務(wù)的無(wú)所不在的圖書館,館員是擁有活躍在虛擬圖書館任意空間的數(shù)字替身的超級(jí)館員[9]。因此,元宇宙和元宇宙時(shí)代的圖書館需要大量的數(shù)字內(nèi)容來(lái)支撐,未來(lái)AIGC應(yīng)用作為數(shù)字內(nèi)容生產(chǎn)的“流水線”,可以高質(zhì)量地完成多種內(nèi)容和數(shù)據(jù)輸出任務(wù),因而AIGC技術(shù)將成為元宇宙重要的基礎(chǔ)設(shè)施之一。而AIGC技術(shù)在圖書館的應(yīng)用,還將為圖書館自行進(jìn)行元宇宙建設(shè)提供更多的技術(shù)上的主動(dòng)權(quán),讓圖書館有更多的機(jī)會(huì)按照自身的特點(diǎn)和用戶需求進(jìn)行圖書館元宇宙的規(guī)劃、設(shè)計(jì)和建設(shè),而不是一味地被外包商牽著鼻子走。同時(shí),AIGC模型的通用化能力和工業(yè)化水平,能夠使更多的圖書館用戶融入進(jìn)來(lái),參與內(nèi)容創(chuàng)建;而對(duì)于圖書館來(lái)說(shuō),則可以將復(fù)雜、效率低、成本高的事交給AIGC去做,如虛擬館舍和家具建設(shè)、虛擬館藏建設(shè)、用戶服務(wù)場(chǎng)景仿真、分布于不同場(chǎng)景的虛擬分館建設(shè)等,館員則騰出更多時(shí)間進(jìn)行元宇宙規(guī)劃和設(shè)計(jì),屆時(shí)AIGC將為圖書館節(jié)省大量的時(shí)間成本和金錢成本。未來(lái),AIGC在圖書館的應(yīng)用意味著圖書館將從繁冗的基礎(chǔ)性工作中解脫出來(lái),把更多的精力放到服務(wù)設(shè)計(jì)和創(chuàng)新中,這也是AIGC應(yīng)用背景下圖書館人工作方式的整體趨勢(shì)。
3? ?AIGC應(yīng)用給圖書館帶來(lái)的挑戰(zhàn)
對(duì)圖書館行業(yè)來(lái)說(shuō),AIGC的應(yīng)用可大大提升用戶體驗(yàn),為圖書館創(chuàng)新服務(wù)模式和內(nèi)容帶來(lái)無(wú)限可能,但也需要警惕AIGC應(yīng)用給圖書館發(fā)展帶來(lái)的不利影響。
3.1? ? 用戶檢索與閱讀習(xí)慣改變帶來(lái)的挑戰(zhàn)
信息環(huán)境的變化會(huì)直接影響用戶行為和習(xí)慣,往往會(huì)對(duì)圖書館的服務(wù)模式和內(nèi)容產(chǎn)生根本性的沖擊。事實(shí)上,近20年來(lái),隨著互聯(lián)網(wǎng)、搜索引擎、短視頻等社交媒體的發(fā)展,相較于傳統(tǒng)的閱讀方式,人們的檢索和閱讀習(xí)慣已經(jīng)發(fā)生了很大變化,圖書館也在不斷適應(yīng)這種變化的過(guò)程中做出了很大改變,搜索引擎先進(jìn)的索引技術(shù)和理念、人工智能技術(shù)等在圖書館的應(yīng)用,使數(shù)字圖書館的建設(shè)日趨成熟,智慧圖書館建設(shè)也已提上日程。然而依然有一部分用戶在檢索信息時(shí)首選搜索引擎或互聯(lián)網(wǎng)而非圖書館,圖書館的用戶流失已成既定事實(shí)。如果說(shuō)互聯(lián)網(wǎng)、搜索引擎的出現(xiàn)深刻地影響了圖書館服務(wù),那么以ChatGPT為代表的AIGC應(yīng)用的出現(xiàn)則會(huì)對(duì)搜索引擎產(chǎn)生顛覆性的挑戰(zhàn),甚至有人預(yù)言谷歌只需要一兩年時(shí)間就會(huì)被徹底顛覆[10]。為應(yīng)對(duì)危機(jī),各大搜索引擎相繼推出了自己的人工智能聊天機(jī)器人,如谷歌的Bard、百度的文心一言,而微軟直接將ChatGPT嵌入到其搜索引擎中,如Bing搜索上的“問(wèn)答搜索功能”,就采用GPT3.5提供支持;甚至在其Edge瀏覽器上也添加了聊天和撰寫功能,幫助用戶解答問(wèn)題和撰寫郵件、簡(jiǎn)歷、文檔等。搜索引擎與智能聊天機(jī)器人的競(jìng)爭(zhēng)不僅能夠快速提升各自的性能,也使得人工智能技術(shù)進(jìn)入人們現(xiàn)實(shí)生活的門檻更低,兩者通過(guò)聊天場(chǎng)景與用戶建立聯(lián)系也就更容易,人們的檢索和閱讀習(xí)慣也就更容易發(fā)生改變,對(duì)圖書館來(lái)說(shuō),用戶的流失則會(huì)進(jìn)一步加重,除非圖書館能提供與兩者截然不同的、對(duì)用戶更有幫助的服務(wù)。
3.2? ? 圖書館相關(guān)技術(shù)與人才弱勢(shì)帶來(lái)的挑戰(zhàn)
眾所周知,計(jì)算機(jī)和信息技術(shù)是推動(dòng)圖書館發(fā)展的重要?jiǎng)恿Α5L(zhǎng)期以來(lái),圖書館對(duì)于信息技術(shù)的應(yīng)用多依賴于企業(yè)相關(guān)產(chǎn)品的研發(fā)或技術(shù)外包,更多地是在購(gòu)買和使用服務(wù),導(dǎo)致大多數(shù)圖書館的技術(shù)部門只是充當(dāng)圖書館硬件設(shè)備或常用數(shù)據(jù)庫(kù)和軟件的購(gòu)買、維護(hù)、使用和培訓(xùn)工作,不具備軟件開發(fā)能力,只有少量頂級(jí)高校圖書館或省級(jí)公共圖書館的技術(shù)部門具備一定的技術(shù)研發(fā)能力。以圖書館智能聊天機(jī)器人為例,圖書館往往或采取直接購(gòu)買,或與企業(yè)合作開發(fā)的方式,能夠自主研發(fā)的圖書館少之又少。相關(guān)技術(shù)與人才弱勢(shì)使得圖書館在應(yīng)對(duì)計(jì)算機(jī)和信息技術(shù)高速發(fā)展,尤其是在具有里程碑意義的新技術(shù)出現(xiàn)時(shí)顯得力不存心,這也給圖書館在瞬息萬(wàn)變的信息時(shí)代的生存帶來(lái)了危機(jī)。ChatGPT上線以來(lái),很多行業(yè)以最快的速度做出了反應(yīng),圖書館界雖然也很快加入了相關(guān)討論,但卻很難在短時(shí)間內(nèi)做出應(yīng)對(duì)。2023年3月1日,OpenAI宣布以收費(fèi)方式開放ChatGPT的應(yīng)用程序接口(API),允許第三方通過(guò)API將ChatGPT集成至自己的應(yīng)用程序和服務(wù)中,從而構(gòu)建自己的人工智能聊天機(jī)器人,為用戶提供更深層次的服務(wù)。根據(jù)OpenAI官網(wǎng)展示的應(yīng)用案例,已經(jīng)有社交平臺(tái)、學(xué)習(xí)平臺(tái)、生鮮配送平臺(tái)、購(gòu)物程序等接入ChatGPT API創(chuàng)建了自己的聊天界面[11]。ChatGPT API接入圖書館最直接的應(yīng)用就是將館藏資源輸入ChatGPT 中,使其通過(guò)學(xué)習(xí)為用戶提供知識(shí)服務(wù),將圖書館智能聊天機(jī)器人提供的基本參考咨詢服務(wù)擴(kuò)展到知識(shí)咨詢與服務(wù)。然而,如果圖書館行動(dòng)不夠快速,各大數(shù)據(jù)庫(kù)商可能會(huì)搶占先機(jī),圖書館將再次淪為購(gòu)買和作為信息中介的被動(dòng)局面,用戶的流失將不可避免。
3.3? ? AIGC自身的局限性給圖書館帶來(lái)的風(fēng)險(xiǎn)
從安全的角度來(lái)看,首先存在版權(quán)風(fēng)險(xiǎn)。以ChatGPT為例,其用于訓(xùn)練的大型文本數(shù)據(jù)語(yǔ)料庫(kù)的數(shù)據(jù)主要來(lái)自互聯(lián)網(wǎng),如果這些數(shù)據(jù)中存在侵犯版權(quán)的情況,則其生成內(nèi)容也可能面臨知識(shí)產(chǎn)權(quán)糾紛,正如OpenAI公司自己所承認(rèn)的那樣,即使ChatGPT在預(yù)訓(xùn)練時(shí)已經(jīng)在盡量規(guī)避版權(quán)風(fēng)險(xiǎn),但不能保證所有數(shù)據(jù)都經(jīng)過(guò)了原始作者的許可[12]。由于AIGC的預(yù)訓(xùn)練模型數(shù)據(jù)量龐大,圖書館在應(yīng)用時(shí)無(wú)論是否輸入自有的數(shù)據(jù),也會(huì)面臨版權(quán)風(fēng)險(xiǎn);其次是存在用戶隱私、敏感和機(jī)密信息泄漏的風(fēng)險(xiǎn)。AIGC依靠收集和存儲(chǔ)大量用戶數(shù)據(jù)來(lái)提高性能,當(dāng)用戶輸入個(gè)人數(shù)據(jù)或其他敏感信息時(shí), AIGC可能會(huì)將其納入語(yǔ)料庫(kù)從而產(chǎn)生泄露風(fēng)險(xiǎn);第三是存在產(chǎn)生偏見(jiàn)和歧視性結(jié)果的風(fēng)險(xiǎn)。一是用于訓(xùn)練人工智能的語(yǔ)料庫(kù)中如果含有偏見(jiàn)或歧視性的數(shù)據(jù),模型可能會(huì)不加區(qū)別地進(jìn)行處理,進(jìn)而把這種偏見(jiàn)和歧視反映到輸出內(nèi)容上。二是如果算法潛藏偏見(jiàn)和歧視,也會(huì)導(dǎo)致偏見(jiàn)或歧視性結(jié)果。雖然目前AIGC應(yīng)用工具都在設(shè)法規(guī)避“毒性”語(yǔ)料,但其算法被認(rèn)為是“黑箱”操作,透明度缺失,仍然存在輸出偏見(jiàn)或歧視性結(jié)果的風(fēng)險(xiǎn)[13];最后是助長(zhǎng)學(xué)術(shù)造假的風(fēng)險(xiǎn)。以ChatGPT為例,由于其具有翻譯、撰寫論文、編寫代碼等創(chuàng)作功能,已有國(guó)外大學(xué)生利用其發(fā)表學(xué)術(shù)論文、撰寫課程作業(yè),引發(fā)了學(xué)術(shù)界和教育界的擔(dān)憂[14]。在線課程提供商Study.com對(duì)1000多名學(xué)生進(jìn)行的調(diào)查顯示,89%以上的學(xué)生使用ChatGPT來(lái)幫助其完成家庭作業(yè)[15]。已有包括《Nature》在內(nèi)的多家知名學(xué)術(shù)期刊明確表示不接受由ChatGPT生成的論文投稿[16]。但如何區(qū)分人類寫作文本和人工智能合成文本卻困難重重,針對(duì)這種情況,2023年2月,OpenAI公司推出AI Text Classifier的文件檢測(cè)器,但其準(zhǔn)確性也不容樂(lè)觀,僅為26%[17]。
4? ?圖書館應(yīng)對(duì) AIGC的策略與途徑
4.1? ? 從聊天機(jī)器人入手優(yōu)化和擴(kuò)展其服務(wù)范圍
聊天機(jī)器人是目前很多圖書館提供在線參考咨詢服務(wù)的方式。但現(xiàn)有的圖書館聊天機(jī)器人主要被用來(lái)回答最基本的有關(guān)圖書館服務(wù)的問(wèn)題,復(fù)雜的問(wèn)題還需要館員來(lái)解答。參考ChatGPT理念與模型訓(xùn)練方法,優(yōu)化和豐富訓(xùn)練語(yǔ)料庫(kù),創(chuàng)建圖書館特色的人工智能聊天機(jī)器人,使其既能回答最基本的和較為復(fù)雜的參考咨詢問(wèn)題,同時(shí)也能真正扮演聊天對(duì)象,為用戶提供范圍更廣的聊天服務(wù),改善用戶體驗(yàn),這應(yīng)該說(shuō)是目前較為簡(jiǎn)單的圖書館與AIGC技術(shù)對(duì)接的方式。一項(xiàng)對(duì)60多個(gè)品牌的客服聊天機(jī)器人的研究發(fā)現(xiàn),約40%的用戶的請(qǐng)求是感性的,即用戶可能只是需要向聊天機(jī)器人宣泄情感,而不是尋求具體的產(chǎn)品或服務(wù)信息[18]。加州大學(xué)歐文分校圖書館對(duì)其智能聊天機(jī)器人ANTswers的用戶咨詢問(wèn)題進(jìn)行統(tǒng)計(jì)后發(fā)現(xiàn),與圖書館服務(wù)無(wú)關(guān)的問(wèn)題數(shù)量之多出乎了館員的意料。由于用戶是匿名咨詢,他們更喜歡把ANTswers當(dāng)作人來(lái)對(duì)待,詢問(wèn)它怎么樣以及生活情況等。也就是說(shuō),用戶可能只是想找個(gè)人聊聊天,而聊天機(jī)器人充當(dāng)了這個(gè)角色。統(tǒng)計(jì)結(jié)果使歐文分校圖書館放棄了將這些與圖書館服務(wù)無(wú)關(guān)的聊天數(shù)據(jù)從語(yǔ)料庫(kù)中刪除的決定,因?yàn)檫@樣可以為用戶帶來(lái)更好的體驗(yàn)[19]。因此,將圖書館聊天機(jī)器人語(yǔ)料庫(kù)向通用型靠攏,增加更多的通用型內(nèi)容對(duì)其進(jìn)行訓(xùn)練,使其能夠回答用戶除圖書館服務(wù)外更為廣泛的問(wèn)題,逐步深化大規(guī)模語(yǔ)言模型在圖書館參考咨詢服務(wù)中的應(yīng)用。
4.2? ? 嘗試?yán)瞄_源模型訓(xùn)練圖書館現(xiàn)有文獻(xiàn)數(shù)據(jù)
目前,大多數(shù)人工智能開源模型基于Transformer模型,并具有上手快、易操作等特點(diǎn),適合入門級(jí)開發(fā)人員使用,對(duì)技術(shù)力量薄弱的圖書館來(lái)說(shuō),可以快速自主開展適應(yīng)圖書館自身業(yè)務(wù)需要的人工智能數(shù)據(jù)訓(xùn)練,為AIGC技術(shù)在圖書館的成熟應(yīng)用打下基礎(chǔ)。國(guó)外已經(jīng)有圖書館開展了類似的工作。如瑞典國(guó)家圖書館就采用開源自然語(yǔ)言處理平臺(tái)Hugging Face的Transformer模型對(duì)幾個(gè)世紀(jì)以來(lái)的館藏資源進(jìn)行人工智能訓(xùn)練。在過(guò)去的500年里,瑞典國(guó)家圖書館收集了幾乎所有用瑞典語(yǔ)出版的各種資料,這些資料包括書籍、報(bào)紙、廣播和電視、互聯(lián)網(wǎng)內(nèi)容、博士學(xué)位論文、明信片、菜單和電子游戲等,資源的多樣化非常適應(yīng)進(jìn)行人工智能訓(xùn)練。2019年,瑞典國(guó)家圖書館成立KBLab,開始在1TB的瑞典語(yǔ)文本上訓(xùn)練其模型,為提高模型性能,還嘗試向數(shù)據(jù)集添加荷蘭語(yǔ)、德語(yǔ)和挪威語(yǔ)的內(nèi)容。隨著館藏資源的不斷數(shù)字化,每個(gè)月都會(huì)增加約50TB訓(xùn)練數(shù)據(jù),小型工作站已不能滿足要求,瑞典國(guó)家圖書館隨即采用了英偉達(dá)的超級(jí)計(jì)算機(jī)DGX,并增加了將聲音轉(zhuǎn)錄為文本的人工智能工具,使圖書館龐大的廣播電視館藏能夠轉(zhuǎn)錄為文本,利用多模態(tài)數(shù)據(jù)進(jìn)行人文研究。隨著訓(xùn)練工作的不斷推進(jìn),瑞典國(guó)家圖書館現(xiàn)在已開始開發(fā)生成文本模型,并正在研究可以處理視頻和能夠自動(dòng)描述視頻內(nèi)容的模型[20]。圖書館開展AIGC模型應(yīng)用是一個(gè)循序漸進(jìn)、逐步推進(jìn)的過(guò)程,利用現(xiàn)有館藏積極進(jìn)行初期的應(yīng)用不失為一種跟進(jìn)人工智能技術(shù)、改善用戶知識(shí)服務(wù)的良好途徑。
4.3? ? 提前進(jìn)行AIGC應(yīng)用的風(fēng)險(xiǎn)規(guī)避和防范
在安全問(wèn)題方面,版權(quán)和用戶隱私問(wèn)題事實(shí)上一直是數(shù)字圖書館建設(shè)中不可回避的話題,在AIGC技術(shù)應(yīng)用背景下,這一問(wèn)題更加復(fù)雜,圖書館要做的工作相對(duì)更多。在用戶隱私保護(hù)方面,要通過(guò)培訓(xùn)和教育提高館員和用戶的安全意識(shí)。在很多情況下,往往是用戶在不經(jīng)意間將自己的隱私信息泄露出去的,如在使用聊天機(jī)器人時(shí),輸入了自己的隱私數(shù)據(jù)而毫不知情。因此,需要對(duì)用戶進(jìn)行必要的信息安全教育,并不斷完善用戶隱私政策。館員可以說(shuō)是用戶隱私的“守護(hù)者”,應(yīng)對(duì)他們進(jìn)行數(shù)字安全技能培訓(xùn)以及職業(yè)道德教育,增強(qiáng)對(duì)用戶隱私的保護(hù)意識(shí)。在版權(quán)方面,首先要保證圖書館用于人工智能訓(xùn)練的數(shù)據(jù)的合法性,除圖書館自有數(shù)據(jù)外,其他數(shù)據(jù)要確保獲得許可和授權(quán)或符合著作權(quán)法的其他規(guī)定;其次,有關(guān)AI生成內(nèi)容的版權(quán)問(wèn)題目前還存在爭(zhēng)議。OPenAI公司在其用戶協(xié)議中規(guī)定,用戶擁有基于輸入內(nèi)容而生成的輸出內(nèi)容的所有權(quán),并對(duì)內(nèi)容負(fù)法律責(zé)任,ChatGPT則擁有這些內(nèi)容的使用權(quán)[21]。而根據(jù)我國(guó)《著作權(quán)法》的規(guī)定,“著作權(quán)屬于作者。創(chuàng)作作品的自然人是作者。也就是說(shuō)目前我國(guó)的法律僅保護(hù)自然人創(chuàng)作的作品,對(duì)于由人工智能和自然人共同創(chuàng)作的作品還沒(méi)有明確的規(guī)定。圖書館作為信息文獻(xiàn)中心,有責(zé)任也有義務(wù)關(guān)注并對(duì)相關(guān)法律的制定、修訂提出自己的建議,這需要圖書館在服務(wù)實(shí)踐中不斷地積累相關(guān)的用戶使用情況和意愿,并將之納入業(yè)務(wù)研究范疇,關(guān)注涉及人工智能生成內(nèi)容的版權(quán)糾紛案件。另外,自2023年1月10日起,我國(guó)正式實(shí)施《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》,對(duì)深度合成服務(wù)的提供者、使用者、支持者所要承擔(dān)的法律責(zé)任和義務(wù)進(jìn)行了規(guī)定[22]。2023年4月11日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》,對(duì)生成式人工智能產(chǎn)品或服務(wù)應(yīng)當(dāng)遵循的法律法規(guī)提出了要求[23]。AIGC若在圖書館使用,則作為服務(wù)提供者的圖書館需要承擔(dān)相應(yīng)的法律責(zé)任,這也是圖書館行業(yè)應(yīng)該提前規(guī)劃和關(guān)注的方面。
5? ?結(jié)語(yǔ)
2023年3月22日,非營(yíng)利組織生命未來(lái)研究所(Future of Life)發(fā)布了一封《暫停大型人工智能研究》的公開信,呼吁所有人工智能實(shí)驗(yàn)室立即暫停比GPT-4更強(qiáng)大的人工智能系統(tǒng)訓(xùn)練6個(gè)月,共同制定和實(shí)施人工智能設(shè)計(jì)和開發(fā)共享安全協(xié)議,并由獨(dú)立的外部專家進(jìn)行嚴(yán)格的審查和監(jiān)督,通過(guò)建設(shè)AI治理系統(tǒng)防止人工智能對(duì)人類造成的危險(xiǎn)[24]。每一項(xiàng)新技術(shù)的應(yīng)用都會(huì)帶來(lái)潛在的風(fēng)險(xiǎn),雖然AIGC的潛力還存在很多不確定性,但毫無(wú)疑問(wèn)它對(duì)圖書館行業(yè)必將產(chǎn)生深刻的影響。未雨綢繆,提前謀劃;持續(xù)跟蹤,積極實(shí)踐,是當(dāng)前圖書館應(yīng)對(duì)這一危機(jī)和影響的必由之路。
參考文獻(xiàn):
[1]? Poulomi Chatterjee.What Excites Yoshua Bengio about the Future of Generative AI[EB/OL].[2023-03-26].https://analyticsindiamag.com/what-excites-yoshua-bengio-about-the-future-of-generative-ai/.
[2]? 魏富強(qiáng),古蘭拜爾·吐?tīng)柡椋I日旦·吾守爾.生成對(duì)抗網(wǎng)絡(luò)及其應(yīng)用研究綜述[J].計(jì)算機(jī)工程與應(yīng)用,2021,57(19):18-31.
[3]? ?Brown T,Mann B,Ryder N,et al.Language models are few-shot learners[J].Advances in neural information processing systems,2020,33:1877-1901.
[4]? Gozalo-Brizuela R,Garrido-Merchan E C.ChatGPT is not all you need.A State of the Art Review of large Generative AI models[J].arXiv preprint arXiv:2301.04655,2023.
[5]? 唐亞匯.大規(guī)模預(yù)訓(xùn)練模型對(duì)AI應(yīng)用與普及的影響[J].上海信息化,2021(9):52-55.
[6]? 趙朝陽(yáng),朱貴波,王金橋.ChatGPT給語(yǔ)言大模型帶來(lái)的啟示和多模態(tài)大模型新的發(fā)展思路[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2023,7(3):26-35.
[7]? ?Reed S,Zolna K,Parisotto E,et al.A generalist agent[J].arXiv preprint arXiv:2205.06175,2022.
[8]? 劉穎,郭瑩瑩,房杰,等.深度學(xué)習(xí)跨模態(tài)圖文檢索研究綜述[J].計(jì)算機(jī)科學(xué)與探索,2022,16(3):489-511.
[9]? 董甜甜,卜險(xiǎn)峰.圖書館邁向元宇宙的先行實(shí)踐、未來(lái)場(chǎng)景及發(fā)展策略[J].圖書與情報(bào),2022(5):92-97.
[10]? 齊健,陳伊凡.ChatGPT引爆新一輪科技軍備賽[EB/OL].[2023-02-26].https://new.qq.com/rain/a/20230212A01Z8L00.
[11]? OpenAI.Customer stories[EB/OL].[2023-02-26].https://openai.com/customer-stories.
[12]? 叢立先,李泳霖.聊天機(jī)器人生成內(nèi)容的版權(quán)風(fēng)險(xiǎn)及其治理——以ChatGPT的應(yīng)用場(chǎng)景為視角[J].中國(guó)出版,2023(5):16-21.
[13]? Goldstein J A,Sastry G,Musser M,et al.Generative Language Models and Automated Influence Operations:Emerging Threats and Potential Mitigations[J].arXiv preprint arXiv:2301.04246,2023.
[14]? ?Thorp H H.ChatGPT is fun,but not an author[J].Science,2023,379(6630):313-313.
[15]? Productive Teaching Tool or Innovative Cheating?[EB/OL].[2023-03-30].https://study.com/resources/perceptions-of-chatgpt-in-schools.
[16]? Editorials? N.Tools such as ChatGPT threaten transparent science;here are our ground rules for their use[J].Nature,2023 (613):612.
[17]? Kirchner? J H,Ahmad? L,Aaronson? S,et al.New AI classifier for indicating AI-written text[J].OpenAI,2023.
[18]? Xu A,Liu Z,Guo Y,et al.A new chatbot for customer service on social media[C].In Proceedings of the 2017 CHI conference on human factors in computing systems,2017:3506-3510.
[19]? Kane D.Analyzing an interactive chatbot and its impact on academic reference services[J/OL].[2023-03-22].https://alair.ala.org/bitstream/handle/11213/17624/AnalyzinganInteractiveChatbotanditsImpactonAcademicReferenceServices.pdf?sequence=1.
[20]? ISHA SALIAN[EB/OL].[2023-03-30].https://blogs.nvidia.com/blog/2023/01/23/sweden-library-ai-open-source/?utm_campaign=Learning%20Posts&.utm_content=235868723&utm_medium=social&utm_source=facebook&hss_channel=fbp-1556374471294462.
[21]? Lemley M A.Terms of use[J].Minn L Rev,2006,91:459.
[22]? 國(guó)家互聯(lián)網(wǎng)信息辦公室,工業(yè)和信息化部,公安部.互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定[EB/OL].[2023-03-26].http://www.cac.gov.cn/2022-12/11/c_1672221949354811.htm.
[23]? 國(guó)家互聯(lián)網(wǎng)信息辦公室.國(guó)家互聯(lián)網(wǎng)信息辦公室關(guān)于《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》公開征求意見(jiàn)的通知[EB/OL].[2023-04-11].http://www.cac.gov.cn/2023-04/11/c_1682854275475410.htm.
[24]? Future of Life Institute.Pause Giant AI Experiments:An Open Letter[EB/OL].[2023-03-30].https://futureoflife.org/open-letter/pause-giant-ai-experiments/?continueFlag=d19c796896f3776241c518f8747afa68.
作者簡(jiǎn)介:李穎婷,女,內(nèi)蒙古呼倫貝爾市圖書館主任編輯,研究方向:圖書館管理、資源建設(shè)、圖書館服務(wù)、智慧圖書館。