[摘 要]通過梳理ChatGPT的發展歷史及特點,分析類ChatGPT對圖書館的影響,嘗試思考圖書館的應對策略,主張圖書館應積極擁抱通用人工智能AGI技術,本著“拿來主義”的態度讓類ChatGPT等AGI技術為圖書館所用,主張發揮圖書館人的主觀能動性去思考如何讓AGI技術落實到具體應用中并與圖書館協同發展,讓AGI技術賦能圖書館真正進入智慧圖書館的新紀元。
[關鍵詞]AGI;ChatGPT;人工智能;智慧圖書館
[中圖分類號]G25;TP391[文獻標志碼]A[文章編號]1005-6041(2023)03-0006-05
1 引 言
自從電腦問世以來,凡有新的IT技術出現,必會發出關于圖書館的永恒一問——“圖書館會消失嗎?”當互聯網出現時,搜索引擎使人們可以在互聯網上輕松獲取信息和學習資源,有人開始擔心這是否會威脅到圖書館的存在。當數字技術和移動設備發展普及,電子書和數字資源廣泛興起,越來越多的人熱衷于移動閱讀,圖書館人開始討論大眾是否會因更傾向于電子資源而非紙質圖書,導致人們對圖書館的需求減少。圖書館是否會消失多年來一直是圖書館人討論的話題,圖書館的未來以各種形式被演繹著。如今隨著人工智能技術的發展,ChatGPT橫空出世,人類第一次開啟了通用人工智能的大門。2022年底,ChatGPT燃爆了整個IT界并火速出圈。裹挾在一眾“某某類工作將被人工智能取代”的聲音中,“圖書館會消失嗎?”再一次回響在耳邊。
本文試圖通過梳理ChatGPT的發展歷程及特點,分析類ChatGPT技術可能對圖書館產生的影響,進而對該技術在圖書館的應用提出一些想法和建議。
2 ChatGPT的發展歷程
人工智能(AI)自1956年在達特茅斯會議上首次被提出后歷經了漫長而曲折的發展歷程。在眾多研究分支中,自然語言處理(NLP)一直是人工智能技術的一個重要方向。深度學習模型的出現為自然語言處理領域帶來了長足的發展[1],之后伴隨著計算機硬件性能(CPU/GPU/TPU)不斷提升,大數據時代信息的海量增長以及基于大規模預訓練語言模型技術GPT的出現,在算力、數據、算法三者協同作用下,2022年底ChatGPT正式面世。
回顧2017年,Google發表了一篇極具影響力的關于NLP的論文《Attention is all you need》,提出了Transformer模型架構,研究發現將注意力機制與編碼器-解碼器結構相結合能極大地提高訓練和推理的速度。隨后該模型在NLP領域內獲得了廣泛的應用。2018年,OpenAI在此基礎上推出了大規模預訓練Transformer語言模型GPT,之后每一年推出一代,直到GPT-3。2022年底,OpenAI推出基于GPT-3.5的ChatGPT對話系統,2023年3月又推出GPT-4[2]。
3 ChatGPT簡介及特點
3.1 ChatGPT簡介
簡單來說,ChatGPT是OpenAI開發的大型語言模型,其基礎是Google提出的Transformer模型。在此之上,增加了預訓練機制(Pretraining),即用大規模的文本數據集進行預訓練,讓模型學習關于自然語言的通用知識(單詞和短語的含義、
句子和段落的結構、語法和語義規則等)[3],再采用基于人類反饋的強化學習過程微調技術(Fine-tuning),讓模型能夠在具有上下文語境的多輪對話中更好地理解用戶意圖,并使用自然語言與用戶溝通。
分解ChatGPT可以得到以下部分:Chat——聊天對話;G——Generative,表示生成式模型;P——Pre-trained,表示預訓練模型;T——Transformer,表示基于Google Transformer模型。所以,ChatGPT是一個基于預訓練Transformer模型的聊天機器人,它能提供一種自然、直觀、方便的交互方式,讓用戶能夠更好地與計算機進行交流和溝通。
3.2 ChatGPT的特點
3.2.1 多語言能力。該模型對45TB的巨量多語言網絡資源(包括維基百科、新聞文章、電子書、論文、網站、論壇、社交媒體等)進行深度學習,可以使用包括英文、中文在內將近100種語言與用戶交流。
3.2.2 上下文關聯能力。ChatGPT能記住對話歷史,通過多輪對話不斷獲取和分析用戶的語言,從而識別用戶的意圖和目的。隨著GPT的升級,OpenAI逐步增加模型的上下文關聯長度,讓其具有更強大的理解能力。
3.2.3 邏輯推理能力。2021年,微軟和OpenAI共同推出名為GitHub Copilot的代碼輔助生成工具,可以通過開發人員的描述來自動生成代碼。其核心便是使用OpenAI的語言模型技術(包括GPT-3和Codex等),學習GitHub網站上大量開源代碼和文檔,讓模型能夠理解各種編程語言和框架,從而能夠生成與具體問題相關的高質量代碼(包括函數、類、語句和表達式等)。ChatGPT繼承了這種能力,并在經過代碼和文本內容的混合訓練后“表現”出一定的邏輯推理能力。GPT-4推出后,其能力又較GPT-3提高了許多,如取得律師資格模擬考試排名前10%、SAT考試排名前7%、GRE考試近乎滿分的成績,并且大部分項目的考試成績GPT-4均超過80%的人類考生。
3.2.4 單模態生成模型向多模態生成模型發展。多模態生成模型是一種能夠從不同的輸入模態(或數據類型)中生成多種輸出模態的模型。輸入模態可能包括圖像、文本、音頻、視頻等,輸出模態則可以是任何一種與輸入模態不同的數據類型。單模態生成模型的輸入和輸出的則都是同一種數據類型。例如,GPT-3只能處理文本的輸入和輸出,而GPT-4則可以處理混合輸入的文字和圖片來生成文本,今后還會支持更多的輸入、輸出數據類型。
4 類ChatGPT對圖書館的影響
人類社會不斷向前,科技發展勢不可擋,類ChatGPT的出現可能對圖書館帶來如下影響。
4.1 數字化依賴程度進一步增強
圖書館數字化、智慧化建設不斷在強化數字資源和數字館藏建設的重要性,近年來加大電子資源、數字資源以及數字化特色館藏建設、縮減紙本圖書的購買比例已經是圖書館的發展趨勢。隨著通用人工智能(AGI)類ChatGPT的出現,這一趨勢可能會加速:圖書館紙質圖書的保有量進一步減少,數字資源將占據館藏資源總量的絕大多數。一直以來,人們獲取信息的方式為:檢索獲取大量相關問題的資料集,進一步篩選、分析判斷,從中解析出合乎邏輯的答案。這個過程通常包括利用搜索引擎獲取公開信息,查詢各種資源數據庫獲取專業信息,或通過圖書館借閱相關書籍,補充資料來源。而類ChatGPT的出現極大簡化了人們收集、查看和分析信息并獲得結果的全過程。理論上,通過多輪人機對話就能直接得到結果。而能夠被類ChatGPT利用的資源無疑都是數字化資源,包括各類網站、知識庫、文本、電子書、圖像、音視頻等。紙質書籍想被利用需要經過不同形式的數字化。
4.2 數字圖書館轉型及知識組織管理能力
類ChatGPT方便利用數字資源的特性,對已經完成了數字圖書館建設或成功轉型數字圖書館的館來說是一個好消息。將ChatGPT接入數字圖書館的數字化知識庫,就可以讓圖書館擁有真正的“數智大腦”。但對于尚未建成統一數字資源知識庫的圖書館來說,類ChatGPT的出現將會成為加速其數字化轉型的第一推動力。
4.3 傳統學習方式和知識獲取途徑的改變影響讀者對圖書館的服務訴求
類ChatGPT的興起,將對傳統的學習方式和知識獲取方式帶來顛覆性改變。傳統學習方式需要花費大量的時間和精力來進行大量閱讀、聽課、練習,而類ChatGPT個性化的交互式學習方式類似古希臘蘇格拉底純對話的啟發式教學。用戶直接詢問便能獲取所需知識和信息,翻閱大量書籍資料的操作由AI來執行。對圖書館來說,這種學習方式的改變所帶來的直觀影響就是圖書資料借閱需求將斷崖式減少。在圖書館以讀者為中心的服務項目中,圖書借閱服務將離讀者核心服務訴求越來越遠,與其對應的針對圖書館評估考核的指標也需要進行相應調整。不過,這一切的前提是類ChatGPT被圖書館大量的館藏圖書和數字知識庫訓練成為該圖書館的專屬AGI。
4.4 部分工作崗位被替代并對館員提出更高的要求
類ChatGPT的引入可能會導致不需要太多專業技能的工作崗位將被替代,如服務臺、導覽員等,也可能削弱某些專業崗位信息提供者的作用,如參考咨詢等。但往往新技術的使用常常會在解決了原有問題的同時,又產生出新的問題。一方面,需要館員使用該技術來解決更復雜的問題,這對館員提出了更高的要求;另一方面,新技術的應用將會產生新的崗位,需要館員提升適配新技術的能力來適應勝任[4]。
5 圖書館該如何應對
圖書館可以通過不斷適應新技術和不斷變化的社會需求,采取拿來主義,抓住機遇,將AGI技術轉變為增強圖書館智慧化服務能力的工具。以下就圖書館如何適應新技術并作出相應改變提出一些建議。
5.1 圖書館應持積極態度擁抱新技術
類ChatGPT作為AGI雛形的出現是21世紀AI技術研究的重大突破,AI技術向AGI方向邁出的關鍵一步開啟了AGI的新紀元。圖書館應該采取開放、包容的態度,積極了解、學習和嘗試新技術,優先考慮技術對圖書館產生的積極影響,以及由此帶來的生產力提升和生產效率提高。通過嘗試應用新技術來不斷拓展圖書館的服務領域、探索新的服務方式、提高服務質量、提升讀者滿意率。同時要清醒地認識到,新技術的使用不是對原有服務和技術的否定和替代,而是在原有技術和服務基礎上的融合與提升,讓圖書館更好地適應時代發展,在維護其社會文化和教育信息服務基本職能不變的情況下,保持其社會必需性和公眾吸引力。
5.2 圖書館應加快完成數字化轉型
如果想讓類ChatGPT深入地應用到圖書館服務中,可以將其接入圖書館的數字資源知識庫,以圖書館的全部可用知識作為類ChatGPT的知識來源服務讀者,或者作為中間知識產出服務工作人員內部使用。這一切的前提是讓類ChatGPT能夠訪問和調用圖書館已建成的標準化、規范化、組織化的機讀數字資源元數據。元數據需要按一定標準進行分類和標注(Dublin Core、MARC等),包含足夠多的信息(標題、創作者、主題、描述、發布信息、標識符、格式、權限等),以機讀標準格式存儲和交換(XML、JSON等)并被合理地組織和建立索引。同時,圖書館還要定期審核和更新以保證元數據的質量和最新時效性。圖書館的數字化轉型、數字資源建設再次被提升到重要的位置。換句話說,如果圖書館在數字資源統一管理中完成了多種類數字資源基于元數據的數字資源統一檢索,那么接入類ChatGPT的工作將更容易,因此圖書館數字化基礎建設將是前期的保障性工作[5]。
5.3 推動館員持續自我提升
圖書館應該創造持續學習的文化,鼓勵館員盡早盡快地接觸并使用AGI技術,通過進行自我教育來提升綜合素質和專業技能,為使用人工智能做好準備并適應新的變化。類ChatGPT已經被證實對自我學習提升具有明確的正向幫助,如輔助英文閱讀、多語言翻譯、計算機代碼輔助學習等。在圖書館提供各種學習機會和環境支持的情況下,館員在不斷提升專業技能的同時也要加強對批判性思維、創造力和社會洞察力等AI暫時還難以獲取的“軟技能”的訓練,為在時機成熟時順利引入該技術,更好地與AI協同工作做好前期的教育投入準備。
5.4 從小規模開始嘗試類ChatGPT的接入再逐步拓展到更多領域
通過OpenAI API接口,許多網站和App已經可以構建真正的AI服務,OpenAI已經開放了基于GPT-3的接口,GPT-4也在開放排隊列表中。相信不久將會有大量的網站和手機App接入OpenAI API,在ChatGPT的助力下讓AI智能客服更精準地基于特定的網站內容來回答用戶的問題,并可提供24小時不間斷服務。此外,一些微信公眾號已經開始嘗試將ChatGPT接入并為訂閱者提供服務。對于圖書館來說,可以考慮先小范圍地試用,將ChatGPT接入測試環境進行前期的內部測試并積累經驗。在發揮ChatGPT自然語言對話基于給定語料和信息作出優質回答的優勢時,也要控制和限制ChatGPT回答用戶問題跑出背景資訊范圍外并給出不實回答的情況,畢竟目前ChatGPT的局限之一就是存在“外部幻覺”,即當用戶的問題超出了用來預訓練的語料和信息范圍時,ChatGPT可能給出自編的答案。圖書館需要通過多次測試、評估來找出解決辦法,以期在更廣泛地部署使用ChatGPT之前評估技術、積累技能和收集使用反饋。當開發人員對AGI越來越熟悉后,圖書館可以擴展AGI集成到更多的工作領域,比如圖書推薦、參考咨詢等,最終通過新技術的加持,在原有服務的基礎上提升用戶體驗,進一步提高用戶滿意度和服務質量。
5.5 專題機器人服務
圖書館現有服務中的一個比較受讀者歡迎的部分是各圖書館內部的專題圖書館或主題分館,如圖書館開設有種類繁多的主題閱讀區:法律、美術、音樂、前沿科技、設計等諸多主題的閱讀區,可以嘗試配合類ChatGPT技術選擇性訓練對應專題資源的專題機器人供讀者使用。例如,以法律主題的閱讀區為例,GPT-4在法律考試中的成績有目共睹,這個主題應該是類ChatGPT的強項。又如,美術和設計類的主題閱讀區可以嘗試結合多類型的AGI技術,由ChatGPT配合DALL-E2(圖像生成模型)、Stable Diffusion(基于擴散模型的圖像生成模型)、Midjourney(一款通過表述生成圖像的產品)等軟件,都可以支持通過文字描述自動生成圖像,為讀者帶來更生動、直觀的閱讀體驗。
5.6 探索虛擬環境(AR/VR)與AGI結合開展各種特色服務
圖書館可以嘗試虛擬技術與類ChatGPT結合,開展各種特色服務。針對少兒讀者可以打造一個虛擬學習環境,為類ChatGPT設計一個可愛的虛擬數字人的形象,讓孩子們在這個環境中與AGI互動,獲得一些多樣化學習的體驗。發揮類ChatGPT的多語言優勢,讓孩子們與AGI互動,學習不同語言的發音和語法,激發他們對語言學習的興趣,增強跨文化交流能力。還可以設計一個交互式虛擬博物館,發揮類ChatGPT理解自然對話和知識庫的優勢,為孩子們提供有趣的知識互動問答,滿足他們的好奇心。針對成人讀者可以提供閱讀推薦或輔助閱讀服務,甚至虛擬真人圖書館活動等?,F有圖書館閱讀推薦通常是兩種方式:大數據智能推薦和館員主觀推薦。要么是系統根據讀者近段時間來館借閱和參與活動的記錄作出相關推薦(如果讀者近段時間沒有使用圖書館則無法推薦),要么是館員根據圖書館近段時間的推廣主題和館內新書情況作出的大眾化的推薦。若結合類ChatGPT技術,可以增加交流啟發式推薦,在讀者與類ChatGPT互動的過程中獲取讀者相關興趣點或困惑點,結合館藏進行符合此情(情況)此景(場景)此境(心境)的實時推薦。
類ChatGPT擁有的總結、概括、匯總、生成概要的功能也可以應用在輔助閱讀中,如針對某本書給出主要人物、主要情節、主要思想和文學評論,或針對書中的內容回答讀者提問,加深讀者對本書的理解。此外,借助類ChatGPT工具還可以開展虛擬化真人圖書館活動[6]。真人圖書館(Human Library)中的“書籍”是活生生的人,他們代表著某個特定的群體或身份,讀者可以像借書一樣,與“書籍”面對面交流,了解他們的生活、經歷和觀點,更深入地了解不同群體的文化、價值和挑戰,從而增進社會的包容性和多元性。當有了類ChatGPT技術的加持,結合圖像AI和視頻AI技術,就可以用AI去模仿某個人們想了解和接觸但已故去的人。例如,擁有愛因斯坦一生的資料,就可以讓類ChatGPT站在愛因斯坦的角度與讀者對話。如果再配以愛因斯坦形象的虛擬AI人,和模仿愛因斯坦聲線的聲音,就可以開展一次惟妙惟肖的線上/線下虛擬化真人圖書館活動。結合互動中推薦的圖書、談論的相關知識內容,將讀者連接到圖書館全方位資料庫中,包括紙電圖書,數字資源庫,音視頻資料庫、相關展覽、專題庫等。
5.7 類ChatGPT的不足及在應用中需要注意的問題
類ChatGPT給圖書館帶來了許多想象的空間和可被應用的閃光點,但同時,我們應該認識到其還處于發展和實踐的初期,必然存在一些問題和不足,在使用新技術的過程中如何揚長避短、規避風險也是圖書館將會面臨的難題。
5.7.1 類ChatGPT的流暢幻象。前文提到,類ChatGPT會產生“外部幻覺”,即當問題過于復雜或超出它所擁有的背景資料范圍時會編造答案,看似流暢完整實則不可信。這是由于模型的開發目的要求“不能把天聊死”所致。圖書館需要明確告知讀者類ChatGPT只能回復哪方面的問題,超出范圍的提問請直接聯系相關館員咨詢。另外,還需要在圈定資料范圍內不斷給類ChatGPT做訓練和測試,限定問題回復范圍,提高回復的準確率。
5.7.2 類ChatGPT沒有增量學習能力。從OpenAI給出的公開資料可以看到,模型大規模預訓練的過程是離線的,即大量數據知識載入的過程在線下完成,后期再根據模型的應用方向進行微調訓練。換句話說目前的類ChatGPT暫時沒有增量學習的能力,不能在線獲取大量新知識,不能回答用戶提出的時效性較強的問題。不過已經有朝著這個方向的研究在進行,隨著技術的發展,未來的AGI有望不斷完善。
5.7.3 讀者個人信息隱私安全問題。一方面,我們希望新技術的應用帶來便捷和智能;另一方面,我們又希望維持傳統服務的保守安全。一定程度上來講這是一個矛盾的統一體。不管從已經大范圍應用的大數據技術、數據挖掘技術獲取讀者多方面的行為數據來給讀者畫像進而提供個性化推薦服務,還是新興AGI技術對話式獲取讀者興趣偏好,都是在通過獲取讀者多方位個人信息的基礎上提供智慧化服務[7]。除了期待法律和規則的完善,如何平衡和取舍,主觀上是一個度的把握,客觀上可以采取兩方面的措施:一是從底層數據層面增加敏感信息數據庫加密技術;二是從來源方面提醒讀者加強風險意識,與AGI對話保持謹慎,重要的個人隱私信息不要出現在對話中。
6 結論和思考
公共圖書館作為重要的文化設施和信息服務機構,在國家文化建設和知識經濟發展中具有重要的地位和作用。圖書館法定的職能和地位決定著圖書館不可能被某種技術所取代,但是隨著其他文化機構包括各類商業性知識服務機構伴隨時代的跨越式發展,圖書館如果不本著開放包容的態度與時俱進、吐故納新,即使在制度上不被取代也難逃被邊緣化的困境。
2023年2月,百度全新一代知識增強大語言模型“文心一言”面世,3月上線內測,目前已有超650家企業宣布接入“文心一言”生態。圖書館作為新技術的積極擁護者和跟隨著,也要開始關注、嘗試和規劃AGI技術的引入。不管是OpenAI的ChatGPT還是百度的文心一言,類ChatGPT技術已經給我們打開了一扇通往智慧圖書館的大門。如何在引入新技術,利用其優勢賦能圖書館的同時盡量避免和控制其不利影響,需要圖書館、科技公司、讀者一道繼續探索。
[參考文獻]
[1]WANG F Y,MIAO Q H,LI X,et al.What Does ChatGPT Say:The DAO from Algorithmic Intelligence to Linguistic Intelligence[J].IEEE/CAA Journal of Automatica Sinica,2023,10(3):575-579.
[2]OPENAI.ChatGPT[EB/OL].[2022-12-24].https:∥openai.com/.
[3]鐘超.自然語言處理AIGC近年的發展脈絡、關鍵論文、技術里程碑和商業應用[EB/OL].[2022-12-24].https:∥www.mikecaptain.com/2022/12/24/captain-nlp-1.
[4]張夏恒.ChatGPT的邏輯解構、影響研判及政策建議[J].新疆師范大學學報(哲學社會科學版),2023,44(5):113-123.
[5]趙瑞雪,黃永文,馬瑋璐,等.ChatGPT對圖書館智能知識服務的啟示與思考[J].農業圖書情報學報,2023,35(1):29-38.
[6]尹克寒.ChatGPT的發展對情報信息工作的影響及啟示[J].圖書館理論與實踐,2023(3):15-22.
[7]陳雅雪,佘麗娜.人工智能在圖書館應用的倫理風險及對策研究[J].大學圖書情報學刊,2022,40(4):69-74.
[收稿日期]2023-03-24
[作者簡介]江 麗(1976—),女,本科,館員,武漢圖書館。