

摘 要:文章以“雙一流”高校圖書館為例,了解高校圖書館智能咨詢的發展現狀,并從運行原理角度提出ChatGPT作為基于人工智能深度學習模式的聊天機器人程序可以應用于高校圖書館智能咨詢服務工作。ChatGPT可快速提升咨詢服務效率,與元宇宙技術結合為讀者提供沉浸式體驗,并在GPT-4技術的驅動下實現咨詢服務的智慧化。
關鍵詞:ChatGPT;高校圖書館;智能咨詢;讀者服務
中圖分類號:G252.61 文獻標識碼:A
Empowering Intelligent Consultation in University Libraries with ChatGPT
Abstract The article delves into the contemporary landscape of intelligent consultation by taking \"Double First-Class\" university libraries as a case study. From an operational standpoint, it puts forth the utilization of ChatGPT, a chatbot program based on deep learning models and artificial intelligence, for enhancing the efficacy of intelligent consultation services in university libraries. ChatGPT exhibits the ability to swiftly elevate the efficiency of consultation services, seamlessly integrate with metaverse technologies to offer readers immersive experiences, and realize the intellectualization of consultation services driven by the cutting-edge GPT-4 technology.
Key words ChatGPT; university library; intelligent consultation; reader services
1 引言
智能咨詢服務在高校圖書館中的應用已經相當普遍,而德國漢堡大學是最早使用智能問答系統的高校之一。該校于1989年建立了一個名為“Kulturportal HAM”的網站,提供了多種智能咨詢服務,包括知識問答、文獻檢索等。我國最早的圖書館自動問答系統是中國科學院計算中心研發的一款名為“知識庫”的問答系統。該系統采用了基于自然語言處理和知識表示技術的方法,能夠回答讀者提出的各種問題。該系統在1990年代末開始應用于中國科學院圖書館,并開始逐漸推廣。目前,許多高校圖書館都建立了自動問答系統,例如清華大學圖書館[1]的“知網問答”、北京大學圖書館[2]的“智庫”等。這些系統不僅提高了咨詢服務的質量和效率,也為讀者提供了更加便捷、高效的知識信息。從智能咨詢服務的本質來看,它主要涉及自然語言處理技術、知識圖譜技術、機器學習技術等多個領域的應用[3]。目前圖書館的咨詢服務大多是通過對用戶提出的問題進行語義分析和理解,再結合知識庫中的信息,給出準確的答案或建議。因此,文本處理和語義擴展是智能咨詢服務的核心技術之一。
2022年11月,OpenAI發布了一款名為ChatGPT的智能聊天機器[4],一時間引起全世界的廣泛關注。ChatGPT是文本類人工智能的應用,能夠與使用者在同一語境下持續聊天,相較于以往的智能聊天機器人回復用戶問題更具有連貫性好、邏輯性強的特點,并且響應速度更快。以ChatGPT為代表的人工智能技術的發展給高校圖書館智能咨詢帶來了新的研究方向。
2 高校圖書館智能咨詢現狀及服務內容
2.1 高校圖書館智能咨詢現狀
教育部第二輪“雙一流”建設名單[5]中共涉及147所高校。截至2022年6月,在147所高校圖書館中,有32所高校圖書館以官網、微信公眾號等方式開展智能咨詢服務,占比約21.77%。比較有代表性的除了前文提到的清華大學圖書館和北京大學圖書館的智能咨詢系統外,還有如上海交通大學圖書館的“問吧機器人”、中國科學技術大學圖書館的“小安”、武漢大學圖書館的問圖機器人、廈門大學圖書館的“小智圖書館”、四川大學圖書館的“小叮當”等,都是比較智能的問答機器人。
2.2 高校圖書館智能咨詢服務內容
研究者在了解“雙一流”高校圖書館服務現狀的基礎上,對于部分圖書館的智能咨詢服務內容作進一步調研。選取的對象既包括世界知名的綜合大學,又包括重點建設地方高校以及高水平特色高校,如表1所示。
盡管目前高校圖書館的智能咨詢機器人在語音識別和自然語言處理方面已經有了很大的進展,但其信息處理能力仍然存在一些局限性。如能夠支持語音的咨詢較少,語音識別的準確度也不高,此外,盡管多數高校圖書館咨詢系統支持圖片或文件格式的咨詢,但機器人并不能準確識別圖片或文件中的信息,經常需要館員客服介入。在人機交互方面,目前高校圖書館仍以非實時咨詢為主,即讀者先留言然后等待館員客服回復,但普遍存在無法及時響應、等待時間長的問題。此外,在拓展功能方面,僅南京大學圖書館、東南大學圖書館、四川大學圖書館、鄭州大學圖書館、大連理工大學圖書館咨詢系統具有如查公交、天氣、匯率,發布校園咨訊,查看機構知識庫等的拓展功能。
ChatGPT的出現為解決上述問題帶來了新的希望,通過借助開放接口等途徑,可以使解決行業智能咨詢需求成為可能。ChatGPT是一種基于大規模預訓練的語言模型,具有非常強大的自然語言理解和生成能力,它可以通過學習海量的文本數據來理解語言的上下文情景,并能夠生成符合語法和語義規則的自然語言文本。如將ChatGPT應用于智能咨詢中,可以通過對其進行針對性的優化和調整,從而提高智能咨詢系統的精度和效率。
3 ChatGPT工作原理介紹
3.1 ChatGPT模型的發展過程
ChatGPT是GPT-3.5模型的微調版本,使用RLHF(Reinforcement learning from Human Feedback,基于人類反饋的強化學習)訓練的文本生成式的對話機器人,其中GPT-3.5是一系列模型的統稱,包括code-davinci-002、text-davinci-002、text-davinci-003等。2017年Google團隊提出了Transformer(轉換器)模型,該模型使用自注意力(Self-Attention)結構取代了傳統的循環神經網絡(Recurrent Neural Network, RNN)結構[6]。自注意力機制允許模型在不同位置之間建立直接的聯系,從而允許信息在不同位置之間直接傳遞,這使得Transformer模型可以并行計算,避免了RNN模型的梯度消失或梯度爆炸問題。相比RNN網絡結構,Self-Attention結構的優點不僅在于其能夠進行并行計算,還在于它能夠更好地捕捉輸入序列中的長距離依賴信息。這使得Transformer模型在自然語言處理任務中取得了很好的效果。GPT(Generative Pre-trained Transformer,生成式預訓練轉換器)模型[7]就是Transformer架構的語言預訓練模型。2018年6月GPT-1模型問世,主要用于語言推理、文本生成和問答。2019年GPT-2問世,它是一種比GPT-1模型更大、更強大的語言模型,可以完成有監督學習任務[8]。2020年,在GPT-1模型和GPT-2模型的基礎上,研究人員繼續改進和擴展,推出了GPT-3模型,GPT-3模型具有了更大的規模和更多的訓練數據(45TB的文本語料庫),模型的表現力和泛化力更強。在GPT-3模型的基礎上不斷地進行微調,先后出現了WebGPT、InstructGPT和GPT-3.5等模型。ChatGPT是在GPT-3.5的基礎模型code-davinci-002基礎上,經過InstructGPT模型生成text-davinci-002模型后進行微調得到的模型[9]。
3.2 RLHF框架下ChatGPT模型的訓練過程
RLHF(Reinforcement learning from Human Feedback,基于人類反饋的強化學習)框架下ChatGPT模型的訓練過程可以分解為三個核心步驟:預訓練語言模型(Language Model, LM)、收集數據,訓練獎勵模型,還有使用強化學習對LM進行微調。如圖1所示,訓練過程中涉及三種模型,分別為SFT(Supervised Fine-Tuning,監督微調)模型、RM(Reuseard Model,獎勵)模型、PPO(Proximal Policy Optimization,近端策略優化)模型。其中SFT模型基于人工標注數據經過監督微調創建原始模型;RM模型通過打分訓練反饋模型;基于SFT模型獲得PPO模型的初始參數,應用RM模型對PPO模型產生的多個答案進行評分判斷直至收斂,完成ChatGPT模型訓練過程。
在圖1中,RLHF框架下ChatGPT模型的訓練過程為:
首先進行ChatGPT模型訓練。
第一步:隨機抽取部分讀者提出的問題,結合標準答案形成問題和答案的數據對。應用這些數據對微調GPT-3.5模型,獲得SFT模型。
第二步:將SFT模型獲得的回答參照標準答案進行相關性計算,并由高到低進行排序,由此獲得RM模型的訓練數據,經過不斷地優化,形成RM模型。
第三步:隨機抽取新的讀者提問數據,輸入到SFT模型,得到的回答作為PPO模型的初始參數,并獲得相應回答,將這些回答數據輸入到第二步訓練好的RM模型進行排序,并不斷地更新PPO模型參數,直至收斂,獲得圖書館智能咨詢服務ChatGPT模型。
值得注意的是,模型的訓練過程的確需要大量的數據和算力支持,因此需要投入大量的資金。對于高校圖書館而言,構建SFT模型和RM模型的資金投入相對較低,因為這些模型需要的計算資源和數據規模相對較小。盡管如此,資金投入仍然是構建SFT和RM模型的一個重要考慮因素,這對于一些資金有限的圖書館來說可能會造成一定的困難。總之,從運行原理角度看,ChatGPT是一種基于神經網絡的機器學習技術,它通過多層神經元之間的相互連接和信息處理,從而實現對數據的高效分類、識別和預測。在高校圖書館智能咨詢服務中,ChatGPT可以將讀者的提問進行語義分析和理解,然后根據預先訓練好的模型和數據,給出相應的答案或建議。同時,ChatGPT還可以通過不斷地學習和優化,提高自己的回答準確性和效率。
4 ChatGPT對高校圖書館咨詢服務的影響
4.1 ChatGPT賦能咨詢服務實時高效
ChatGPT作為復雜適應系統語言模型,具有很強的泛化能力和適應性。通過預訓練模型的學習,可以對各種自然語言處理任務進行有效的學習和推理,從而在面對新的問題時能夠快速做出響應。此外,由于ChatGPT是基于Transformer架構的語言模型,它還具有很好的并行計算能力,可以在毫秒級別內對問題做出即時應答。ChatGPT的即時性和臨場感相比其他人工智能咨詢工具確實有著得天獨厚的優勢。當讀者輸入完相關問題后,對話框中的字符跳動和回答生成的速度都非常快,可以讓用戶感受與“真人”聊天相似的互動感,從而拉近了人機的距離[10]。因此,ChatGPT的出現為改善高校圖書館參考咨詢服務提供了強有力的支撐。在傳統的參考咨詢服務中,面對讀者的專業咨詢問題時,通常需要館員人工處理且回答速度也較慢,對于某些專業化的問題需要求助資深館員或學科專家。而ChatGPT作為一種強大的自然語言處理模型,可以快速地理解讀者的咨詢問題,并且根據自己的預訓練模型和豐富的知識庫提供準確、全面的答案和建議。此外,ChatGPT還可以通過對話的方式與讀者進行互動,了解用戶的反饋和需求,從而不斷優化自身的回答和服務。這使得ChatGPT在圖書館參考咨詢服務中具有很大的應用潛力,可以幫助圖書館提高服務質量和效率,更好地滿足讀者的需求。
4.2 ChatGPT與元宇宙技術相結合賦能沉浸式咨詢
ChatGPT是一種強大的自然語言處理技術,可以用于智能對話、文本生成和語言理解等任務。元宇宙技術則是指虛擬現實、增強現實等技術的綜合應用,可以為讀者提供沉浸式的體驗。將ChatGPT與元宇宙技術相結合,可以賦能全智慧咨詢。具體來說,這種結合可以實現以下幾個方面的功能:(1)智能問答:ChatGPT可以作為智能問答系統的核心技術,通過自然語言處理技術快速準確地回答用戶的問題。而元宇宙技術可以通過虛擬現實或增強現實等方式,將答案呈現給用戶(讀者),提高交互的沉浸感和效果。(2)虛擬導覽:元宇宙技術可以為讀者提供沉浸式的虛擬導覽體驗,讓讀者更好地了解場館設施、服務空間等場所,其中ChatGPT可以作為導覽系統的語音助手,幫助讀者獲取更多信息并提供個性化的服務。(3)智能推薦:ChatGPT同樣是智能推薦系統的核心技術,通過自然語言處理技術分析讀者的興趣愛好和需求,為讀者提供個性化的推薦服務,并以虛擬現實或增強現實等方式,將推薦內容呈現給讀者,提高交互的沉浸感和效果。綜上,ChatGPT與元宇宙技術的結合可以為全智慧咨詢帶來更多的創新和發展機會。
4.3 ChatGPT賦能咨詢服務智慧化
ChatGPT是基于多模態預訓練大模型GPT-4開發的一種強大的自然語言處理模型,它可以接受文本和圖像形式的PROMPT,并允許用戶指定任何視覺或語言任務。這意味著用戶可以使用各種不同的方式與GPT-4進行交互,從而實現更靈活、更個性化的智能咨詢服務。另外,GPT-4還具有增加文字輸入長度限制的功能,這有助于擺脫問題論述方面的數字屏障,使高校圖書館智能咨詢服務能夠實現信息內容最大化輸入和輸出,從而可以減輕館員的工作負擔,加快咨詢服務的整體工作流程。在使用ChatGPT生成內容的過程中,讀者提出問題的重要性確實不容忽視,這是因為當前的人工智能技術仍然存在一些局限性,例如它們需要基于已有的數據和知識進行學習和推斷,而這些數據和知識通常是有限的。因此,當讀者提出一個問題時,ChatGPT可能無法直接回答或者給出不準確的答案。在這種情況下,讀者需要自我審視并學習如何更好地使用AI工具。
ChatGPT賦能的咨詢服務對高校圖書館和讀者是雙贏局面。對于圖書館而言,利用 ChatGPT等人工智能工具來實現機器咨詢服務的智能化,從而提高服務質量和效率,幫助讀者解決問題并提供更好的學習支持;對于讀者來說,ChatGPT可以幫助他們提升創新能力,通過人機交互和溝通,讀者可以獲取到各種知識和信息,從而啟發他們的思考和創造力。此外,ChatGPT等工具還可以幫助讀者快速獲取答案和解決問題,從而節省時間和精力,使他們更加專注于創新和探索。總之,高校圖書館應該充分利用人工智能工具來提高服務質量和效率,同時讀者也可提升自己的創新能力,從而更好地應對未來的挑戰和機遇。
5 結語
2022年末,預訓練大模型ChatGPT爆紅網絡,隨之而來的,如百度的“文心一言”、微軟的“New bing”、科大訊飛的“訊飛星火”等同類產品相繼推出。但就目前情況而言,ChatGPT作為GPT-4技術的代表,系統運行較為穩定而且已經開放端口,盡管其大規模應用尚處于探索階段,從已有測試結果看偶爾會出現盲目“自信”答非所問的情況。但不可否認,ChatGPT作為一種新型的人工智能技術,為圖書館智能咨詢服務帶來了新的機遇和挑戰。未來隨著技術的不斷發展和完善,相信ChatGPT將會在圖書館智能咨詢服務領域發揮越來越重要的作用。
參考文獻:
[1] 姚飛,紀磊,張成昱,等.實時虛擬參考咨詢服務新嘗試:清華大學圖書館智能聊天機器人[J].現代圖書情報技術,2011(4):77-81.
[2] 沈奎林,邵波,趙華.利用微信構建圖書館智能問答系統[J].圖書館學研究,2015(8):75-80.
[3] 張樂.詞向量語義擴展技術在圖書館智能咨詢系統的應用與實現[J].圖書情報工作,2020,64(18):126-136.
[4] 張夏恒.ChatGPT的邏輯解構、影響研判及政策建議[J/OL].新疆師范大學學報(哲學社會科學版):1-11[2023-04-03].https://doi.org/10.14100/j.cnki.65-1039/g4.20230224.002.
[5] 教育部、財政部、國家發展改革委關于公布第二輪“雙一流”建設高校及建設學科名單的通知[EB/OL].[2022-02-14].http://www.moe.gov.cn/srcsite/A22/s7065/202202/t20220211_598710.html.
[6] CHRISTIANO P,LEIKE J,BROWN T B,et al.Deep reinforcement learning from human preferences[J].IEEE Transaction on Neural Networks and Learning Systems,2017,32(12):5369-5378.
[7] Improving Language Understanding by Generative Pre-Training [EB/OL].[2018-06-09].https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf .
[8] RADFORD A,WU J,CHILD R,et al. Language Models are Unsupervised Multitask Learners[J].OpenAI blog,2019(1):8-9.
[9] 錢力,劉熠,張智雄,等.ChatGPT的技術基礎分析[J/OL].數據分析與知識發現:1-12[2023-03-30].http://kns.cnki.net/kcms/detail/10.1478.G2.20230324.1112.002.html.
[10] 郭亞軍,郭一若,李帥,等.ChatGPT賦能圖書館智慧服務:特征、場景與路徑[J/OL].圖書館建設:1-16[2023-05-11].http://kns.cnki.net/kcms/detail/23.1331.G2.20230406.1553.004.html.
作者簡介:王超,碩士,遼寧工業大學圖書館館員,研究方向為智能計算與圖書館信息化建設;潘雪峰,碩士,遼寧工業大學圖書館館員,研究方向為智能計算與圖書館信息化建設。
收稿日期:2023-04-06本文責編:李芳