基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)設(shè)計(jì)

2024-06-16 00:00:00劉驍斌

圖書(shū)館研究與工作 2024年6期

摘要：文章在概述ChatGPT、智能問(wèn)答系統(tǒng)原理和特點(diǎn)的基礎(chǔ)上，分析了虛擬館員智能問(wèn)答系統(tǒng)的設(shè)計(jì)需求，從系統(tǒng)架構(gòu)、問(wèn)答流程及功能模塊設(shè)計(jì)了基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)，并通過(guò)仿真測(cè)試實(shí)驗(yàn)從答案自動(dòng)生成速率、答案自動(dòng)生成準(zhǔn)確率兩個(gè)方面驗(yàn)證了基于ChatGPT虛擬館員智能問(wèn)答系統(tǒng)的性能，最后從讀者研究對(duì)象輔助者、語(yǔ)言文字潤(rùn)色者、文本生態(tài)構(gòu)建者三個(gè)方面歸納了基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)的應(yīng)用場(chǎng)景，旨在提升虛擬館員智能問(wèn)答系統(tǒng)的適用性。

關(guān)鍵詞：ChatGPT；虛擬館員；智能問(wèn)答系統(tǒng)

中圖分類(lèi)號(hào)：G250.7；G252.61 文獻(xiàn)標(biāo)識(shí)碼：A

Designing an Intelligent Qamp;A System for Virtual Librarians Based on ChatGPT

Abstract Building upon an understanding of ChatGPT， the principles and characteristics of intelligent question answering systems， this paper delves into the design requirements for a virtual librarian's intelligent question answering system. It outlines the architecture， question answering process， and functional modules of a virtual librarian's intelligent question answering system based on ChatGPT. Through simulation testing experiments， the system's performance is evaluated in terms of automatic answer generation speed and accuracy. Additionally， the paper summarizes the application scenarios of the virtual librarian's intelligent question answering system based on ChatGPT， focusing on assisting reader research objectives， refining language and text， and constructing a text ecosystem， with the aim of enhancing the system's usability.

Key words ChatGPT; virtual librarians; intelligent question answering system

1 引言

ChatGPT（Chat Generative Pre-trained Transformer）的產(chǎn)生改變了人機(jī)交互方式和知識(shí)生成模式，開(kāi)啟了人工智能知識(shí)生成的新紀(jì)元，給智慧知識(shí)問(wèn)答服務(wù)帶來(lái)了新動(dòng)能。一方面，ChatGPT融入到智能問(wèn)答服務(wù)中能創(chuàng)造全新的知識(shí)樣態(tài)，拓展讀者的認(rèn)知邊界，激發(fā)讀者創(chuàng)意，豐富知識(shí)服務(wù)內(nèi)容，構(gòu)建智能生成的知識(shí)服務(wù)網(wǎng)絡(luò)，促進(jìn)向人工智能知識(shí)生成性問(wèn)答服務(wù)轉(zhuǎn)型。另一方面，ChatGPT可以彌補(bǔ)知識(shí)服務(wù)的不足，促進(jìn)智慧交互服務(wù)發(fā)展。然而，ChatGPT在賦能知識(shí)問(wèn)答服務(wù)方面有哪些特征，智慧問(wèn)答服務(wù)系統(tǒng)的服務(wù)模式如何，虛擬館員智能問(wèn)答系統(tǒng)適用于哪些應(yīng)用場(chǎng)景，該如何基于ChatGPT服務(wù)端口設(shè)計(jì)虛擬館員智能問(wèn)答系統(tǒng)，這些問(wèn)題需要進(jìn)一步探索和解決。為此，本研究結(jié)合ChatGPT和智能問(wèn)答系統(tǒng)的原理、特征，從系統(tǒng)架構(gòu)、問(wèn)答流程、功能模塊設(shè)計(jì)了基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)，并對(duì)系統(tǒng)的性能進(jìn)行了仿真測(cè)試，指出了該系統(tǒng)的適用場(chǎng)景，為推動(dòng)以ChatGPT為代表的大型AIGC（Artificial Intelligence Generated Content，生成式人工智能）模型在智慧服務(wù)中的應(yīng)用提供思路和方法。

2 ChatGPT、智能問(wèn)答系統(tǒng)概述

2.1 ChatGPT

ChatGPT是美國(guó)Open AI公司推出的一款聊天機(jī)器人程序，是應(yīng)用深度學(xué)習(xí)算法的自然語(yǔ)言處理工具[1]，能在預(yù)訓(xùn)練階段基于訓(xùn)練階段的模式和統(tǒng)計(jì)規(guī)律自動(dòng)生成答案，還能基于與用戶(hù)聊天過(guò)程的上下文語(yǔ)境與用戶(hù)互動(dòng)，幫助人們撰寫(xiě)郵件、文案、代碼、腳本等[2]。同時(shí)，ChatGPT也是一種全新的語(yǔ)言信息處理工具，它采用了大量語(yǔ)言處理模型（Large Language Model， LLM），通過(guò)輸入大量語(yǔ)義文本構(gòu)建語(yǔ)料庫(kù)進(jìn)行大規(guī)模訓(xùn)練，使其獲得類(lèi)似人的語(yǔ)言認(rèn)知理解能力，本質(zhì)上是生成式人工智能（Artificial Intelligence Generated Content，AIGC）的應(yīng)用落地，能夠?qū)崿F(xiàn)語(yǔ)義交互、互動(dòng)對(duì)話、機(jī)器翻譯，為使用者提供高效的語(yǔ)言交互體驗(yàn)[3]。ChatGPT強(qiáng)大的功能主要在于它應(yīng)用了前饋神經(jīng)網(wǎng)絡(luò)（Freedforward neural network）和遞歸神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network）融合建立起深度神經(jīng)網(wǎng)絡(luò)模型，深度神經(jīng)網(wǎng)絡(luò)模型包含了多種潛藏的神經(jīng)網(wǎng)絡(luò)，每類(lèi)潛藏的神經(jīng)網(wǎng)絡(luò)包含多種神經(jīng)元，分布在潛藏神經(jīng)網(wǎng)絡(luò)各個(gè)節(jié)點(diǎn)的神經(jīng)元可以處理復(fù)雜的神經(jīng)反射信號(hào)，對(duì)于復(fù)雜信息也能快速反饋[4]。此外，ChatGPT作為一種大規(guī)模預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型，主要通過(guò)源于互聯(lián)網(wǎng)空間和社交媒體海量文本數(shù)據(jù)對(duì)語(yǔ)言模型的大規(guī)模訓(xùn)練，從而產(chǎn)生語(yǔ)言自動(dòng)生成和語(yǔ)義理解能力，滿足用戶(hù)提出問(wèn)題的交互式對(duì)話需求，針對(duì)用戶(hù)問(wèn)題的語(yǔ)言邏輯理解、分析和預(yù)測(cè)提供語(yǔ)料支持，因此，ChatGPT經(jīng)常作為圖書(shū)館智能問(wèn)答系統(tǒng)的重要組件，幫助讀者答疑解惑。

2.2 智能問(wèn)答系統(tǒng)

智能問(wèn)答系統(tǒng)（Question Answering system）是一種高級(jí)形態(tài)的信息檢索，基于用戶(hù)提出的問(wèn)題用最簡(jiǎn)潔的自然語(yǔ)言進(jìn)行回答，是神經(jīng)語(yǔ)言程序?qū)W（Neuro-Linguistic Programming）研究的一個(gè)重要方向[5]。智能問(wèn)答系統(tǒng)一般由問(wèn)題分析、知識(shí)融合、答案生成3個(gè)功能模塊組成。其中，問(wèn)題分析模塊包括問(wèn)題歸類(lèi)、特征詞提取兩部分；知識(shí)融合模塊包括結(jié)構(gòu)化信息抽取、非結(jié)構(gòu)化信息抽取和知識(shí)聚類(lèi)；答案生成模塊包括答案提取、答案聚類(lèi)、答案驗(yàn)證。智能問(wèn)答系統(tǒng)主要分為兩類(lèi)：第一類(lèi)是文本推薦匹配式，主要是通過(guò)大規(guī)模文本數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型，通過(guò)判斷問(wèn)題相似度進(jìn)行答案匹配，然而該方法需要建立大規(guī)模問(wèn)題庫(kù)，通過(guò)對(duì)問(wèn)題庫(kù)所有問(wèn)題檢索匹配相似度最高的答案，反應(yīng)速度會(huì)隨著問(wèn)題規(guī)模的增大降低；第二類(lèi)是文本自動(dòng)生成式，其主要方法是通過(guò)海量科學(xué)數(shù)據(jù)集對(duì)預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練，通過(guò)對(duì)用戶(hù)問(wèn)題的語(yǔ)義分析、內(nèi)容分析快速生成文本答案，該方法是當(dāng)前智慧圖書(shū)館智能問(wèn)答系統(tǒng)應(yīng)用的主流[6]。

3 虛擬館員智能問(wèn)答系統(tǒng)的設(shè)計(jì)需求分析

虛擬館員智能問(wèn)答系統(tǒng)主要是針對(duì)讀者書(shū)籍借閱、遠(yuǎn)程服務(wù)、信息獲取、知識(shí)服務(wù)、資源下載、知識(shí)咨詢(xún)方面的問(wèn)題提供咨詢(xún)和引導(dǎo)，也就是應(yīng)用ChatGPT預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)的人機(jī)智能問(wèn)答交互替代傳統(tǒng)的館員咨詢(xún)服務(wù)，減輕圖書(shū)館員的工作壓力[7]。本文首先根據(jù)圖書(shū)館的業(yè)務(wù)需求，設(shè)計(jì)智能問(wèn)答系統(tǒng)的功能和特點(diǎn)，如需要提供各種文獻(xiàn)資源的快速精準(zhǔn)查詢(xún)、需要滿足不同用戶(hù)群體的需求等。其次，隨著人工智能技術(shù)的不斷發(fā)展，智能問(wèn)答系統(tǒng)的技術(shù)也在不斷進(jìn)步，本文通過(guò)技術(shù)發(fā)展趨勢(shì)和應(yīng)用場(chǎng)景的結(jié)合，設(shè)計(jì)出更高效、智能、實(shí)用的智能問(wèn)答系統(tǒng)。最后，通過(guò)用戶(hù)調(diào)研和用戶(hù)反饋，了解用戶(hù)對(duì)智能問(wèn)答系統(tǒng)的期望和需求。按照虛擬館員智能問(wèn)答系統(tǒng)的設(shè)計(jì)需求框架，讀者對(duì)虛擬館員智能問(wèn)答系統(tǒng)有以下基本使用需求：①書(shū)籍文獻(xiàn)精確查詢(xún)需求。虛擬館員智能問(wèn)答系統(tǒng)要能針對(duì)讀者提出的“書(shū)籍文獻(xiàn)查詢(xún)”問(wèn)題快速給出“目標(biāo)書(shū)籍文獻(xiàn)”的信息，信息中需包括作者信息、書(shū)籍文獻(xiàn)狀態(tài)信息、書(shū)籍文獻(xiàn)引用信息等；②信息數(shù)據(jù)快速獲取需求。智能問(wèn)答系統(tǒng)需根據(jù)讀者提出的“信息數(shù)據(jù)查詢(xún)獲取問(wèn)題”給出信息數(shù)據(jù)目錄、鏈接及獲取方式，需要清晰標(biāo)注數(shù)據(jù)類(lèi)型、數(shù)據(jù)內(nèi)容、信息狀態(tài)、數(shù)據(jù)格式等；③知識(shí)信息咨詢(xún)需求。讀者在提出專(zhuān)業(yè)的知識(shí)問(wèn)題后或是尋求新的文本內(nèi)容、代碼、文案、圖像，虛擬館員智能問(wèn)答系統(tǒng)需快速響應(yīng)，針對(duì)現(xiàn)有的知識(shí)資源生成新的知識(shí)，為讀者提供全新的文本知識(shí)、代碼、文案、圖像；④學(xué)科問(wèn)題快速解答需求。虛擬館員智能問(wèn)答系統(tǒng)能對(duì)讀者提出的學(xué)科問(wèn)題精準(zhǔn)識(shí)別，借助預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型對(duì)讀者提出的學(xué)科問(wèn)題進(jìn)行語(yǔ)義分析、內(nèi)容分析，結(jié)合已有的大規(guī)模學(xué)科科學(xué)數(shù)據(jù)集對(duì)預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練，針對(duì)問(wèn)題自動(dòng)生成新的知識(shí)內(nèi)容，為讀者快速解答問(wèn)題；⑤歷史信息快速查詢(xún)需求。主要幫助讀者查詢(xún)歷史提問(wèn)和及時(shí)更新的回復(fù)，及時(shí)更新的回復(fù)能給予讀者一定的提示。

虛擬館員智能問(wèn)答系統(tǒng)還要能給讀者帶來(lái)良好的操作體驗(yàn)，用戶(hù)端設(shè)計(jì)要具備良好的人機(jī)對(duì)話效果，需滿足讀者的人機(jī)對(duì)話需求、人機(jī)交互需求、智能檢索需求、語(yǔ)音操作需求，進(jìn)而為讀者提供良好的操作體驗(yàn)。

4 基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)設(shè)計(jì)

4.1 系統(tǒng)架構(gòu)

基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)使用美國(guó)Open AI已公布的ChatGPT4.0版本的框架、接口及開(kāi)源代碼設(shè)計(jì)與實(shí)現(xiàn)[8]。館藏資源、科學(xué)數(shù)據(jù)及其他學(xué)科數(shù)據(jù)普遍存儲(chǔ)于不同的數(shù)據(jù)庫(kù)中，因此需要在已訓(xùn)練好的ChatGPT-4模型基礎(chǔ)上針對(duì)已有的資源數(shù)據(jù)做針對(duì)性訓(xùn)練，使用ChatGPT-4中的自然語(yǔ)言處理工具對(duì)讀者提出的問(wèn)題轉(zhuǎn)化，由ChatGPT-4對(duì)問(wèn)題識(shí)別分析，基于已有的大規(guī)模科學(xué)數(shù)據(jù)集的訓(xùn)練結(jié)果自動(dòng)生成內(nèi)容匹配給讀者。具體而言，基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)架構(gòu)可劃分為4層，分別為應(yīng)用層、計(jì)算層、邏輯層和數(shù)據(jù)層，如圖1所示。

（1）應(yīng)用層。應(yīng)用層主要是針對(duì)讀者的智能問(wèn)答需求以可視化操作界面的形式將系統(tǒng)功能模塊呈現(xiàn)出來(lái)，該層主要采用了B/S結(jié)構(gòu)，使用Tableau和QlikView可視化工具完成頁(yè)面布局和系統(tǒng)功能、數(shù)據(jù)的可視化展示。應(yīng)用層主要包括答案內(nèi)容自動(dòng)生成、答案智能匹配、Tableau可視化、QlikView數(shù)據(jù)可視化，向讀者提供答案內(nèi)容自動(dòng)生成、答案智能匹配、QlikView數(shù)據(jù)可視化多種人機(jī)交互方式，對(duì)于讀者提出的問(wèn)題，系統(tǒng)會(huì)自動(dòng)生成答案，并及時(shí)匹配給讀者，同時(shí)以知識(shí)圖譜和圖表的方式將答案的詳細(xì)信息呈現(xiàn)出來(lái)。

（2）計(jì)算層。計(jì)算層體現(xiàn)出虛擬館員智能問(wèn)答系統(tǒng)的數(shù)據(jù)處理及各種業(yè)務(wù)處理的能力，主要包括問(wèn)答任務(wù)識(shí)別、ChatGPT-4交互訓(xùn)練、自然語(yǔ)言處理、自然語(yǔ)言交互標(biāo)準(zhǔn)計(jì)算、科學(xué)數(shù)據(jù)集調(diào)用計(jì)算。問(wèn)答任務(wù)識(shí)別模塊主要對(duì)讀者提出的問(wèn)題進(jìn)行識(shí)別，將讀者問(wèn)題轉(zhuǎn)化為自然語(yǔ)言進(jìn)行處理。自然語(yǔ)言處理模塊主要是針對(duì)問(wèn)題任務(wù)識(shí)別，將讀者問(wèn)題轉(zhuǎn)化的自然語(yǔ)言進(jìn)行計(jì)算，形成可供ChatGPT識(shí)別的科學(xué)數(shù)據(jù)。科學(xué)數(shù)據(jù)集調(diào)用計(jì)算模塊一方面是對(duì)自然語(yǔ)言處理模塊轉(zhuǎn)化出的分散性的科學(xué)數(shù)據(jù)集加工融合成科學(xué)數(shù)據(jù)集，另一方面是對(duì)分布在館藏資源數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、開(kāi)放共享平臺(tái)及其他數(shù)據(jù)庫(kù)中與讀者問(wèn)題高度相似的科學(xué)數(shù)據(jù)集調(diào)用計(jì)算，進(jìn)行預(yù)訓(xùn)練學(xué)習(xí)，針對(duì)讀者問(wèn)題自動(dòng)生成答案。自然語(yǔ)言交互標(biāo)準(zhǔn)計(jì)算模塊主要為讀者提供不同操作環(huán)境下的自然語(yǔ)言交互標(biāo)準(zhǔn)，讀者可根據(jù)實(shí)際情況自主選擇。

（3）邏輯層。邏輯層是虛擬館員智能問(wèn)答系統(tǒng)的核心層，是系統(tǒng)算法功能實(shí)現(xiàn)的重要部分，主要包括自然語(yǔ)言分詞模塊、問(wèn)題分類(lèi)模塊、實(shí)體識(shí)別模塊、問(wèn)題查詢(xún)模塊和ChatGPT-4算法函數(shù)模塊[9]。自然語(yǔ)言分詞模塊主要實(shí)現(xiàn)自然語(yǔ)言問(wèn)題的初步計(jì)算處理，區(qū)分實(shí)體與非實(shí)體。問(wèn)題分類(lèi)模塊是針對(duì)讀者的問(wèn)題進(jìn)行分類(lèi)，并與ChatGPT-4預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型形成映射。實(shí)體識(shí)別模塊是對(duì)讀者問(wèn)題語(yǔ)句中的實(shí)體進(jìn)行識(shí)別，結(jié)合問(wèn)題分類(lèi)，形成供ChatGPT-4預(yù)訓(xùn)練學(xué)習(xí)的科學(xué)數(shù)據(jù)集。問(wèn)題查詢(xún)模塊將實(shí)體名稱(chēng)和問(wèn)題類(lèi)型代入ChatGPT-4形成問(wèn)題的分解與答案的自動(dòng)生成。ChatGPT-4算法函數(shù)模塊是在答案自動(dòng)生成后，結(jié)合實(shí)體類(lèi)別和問(wèn)題分類(lèi)代入到算法函數(shù)校正，保障自動(dòng)生成的答案具有可用性。

（4）數(shù)據(jù)層。數(shù)據(jù)層主要包括館藏資源數(shù)據(jù)、海量的科學(xué)數(shù)據(jù)集、知識(shí)庫(kù)、問(wèn)答語(yǔ)料、神經(jīng)網(wǎng)絡(luò)預(yù)訓(xùn)練數(shù)據(jù)等，針對(duì)ChatGPT-4自動(dòng)生成的答案在讀者調(diào)取使用后，可采用Neo4j數(shù)據(jù)庫(kù)和MySQL數(shù)據(jù)庫(kù)存儲(chǔ)，其中Neo4j數(shù)據(jù)庫(kù)可通過(guò)屬性圖對(duì)各類(lèi)強(qiáng)關(guān)系數(shù)據(jù)存儲(chǔ)，MySQL數(shù)據(jù)庫(kù)可存儲(chǔ)各類(lèi)弱關(guān)系型數(shù)據(jù)。

4.2 問(wèn)答流程設(shè)計(jì)

讀者使用虛擬館員智能問(wèn)答系統(tǒng)產(chǎn)生的問(wèn)題類(lèi)型和語(yǔ)句格式較為固定，可以通過(guò)對(duì)問(wèn)題識(shí)別、自然語(yǔ)言分詞、問(wèn)題分類(lèi)、科學(xué)數(shù)據(jù)集訓(xùn)練、實(shí)體識(shí)別、ChatGPT-4算法函數(shù)調(diào)用實(shí)現(xiàn)答案的自動(dòng)生成，向讀者智能匹配答案，如圖2所示。

智能問(wèn)答系統(tǒng)問(wèn)答流程主要分為以下步驟：

（1）對(duì)讀者問(wèn)題產(chǎn)生的自然語(yǔ)言問(wèn)句識(shí)別；

（2）使用自然語(yǔ)言分詞工具對(duì)問(wèn)題語(yǔ)句進(jìn)行處理，對(duì)讀者問(wèn)題意圖進(jìn)行預(yù)測(cè)；

（3）提取問(wèn)題關(guān)鍵詞，基于關(guān)鍵詞特征對(duì)問(wèn)題分類(lèi)，使用命名實(shí)體識(shí)別技術(shù)對(duì)問(wèn)題中的實(shí)體進(jìn)行命名并填充到ChatGPT-4預(yù)訓(xùn)練的科學(xué)數(shù)據(jù)集，針對(duì)問(wèn)題進(jìn)行預(yù)訓(xùn)練學(xué)習(xí)；

（4）使用數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)句使ChatGPT-4模型與存儲(chǔ)各類(lèi)科學(xué)數(shù)據(jù)集的數(shù)據(jù)庫(kù)連接，使用不同的科學(xué)數(shù)據(jù)集實(shí)現(xiàn)ChatGPT-4的大規(guī)模預(yù)訓(xùn)練學(xué)習(xí)；

（5）針對(duì)問(wèn)題的類(lèi)別、實(shí)體，由系統(tǒng)計(jì)算問(wèn)題的自然語(yǔ)言交互標(biāo)準(zhǔn)，根據(jù)計(jì)算得出的自然語(yǔ)言交互標(biāo)準(zhǔn)，自動(dòng)生成答案，使用ChatGPT-4中的自然語(yǔ)言算法函數(shù)進(jìn)行校正，檢驗(yàn)初步生成的答案與問(wèn)題的吻合度，若吻合度達(dá)到100%可直接反饋給讀者，若生成答案與問(wèn)題吻合度低于100%，則重新進(jìn)行預(yù)訓(xùn)練學(xué)習(xí)，再次生成答案。

4.3 功能模塊設(shè)計(jì)

4.3.1 用戶(hù)端功能設(shè)計(jì)

基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)用戶(hù)端功能設(shè)計(jì)如圖3所示。根據(jù)用戶(hù)端的功能需求進(jìn)行功能模塊設(shè)計(jì)。首先要將讀者行為進(jìn)行分解，系統(tǒng)需要對(duì)讀者的身份和行為進(jìn)行識(shí)別，讀者登錄系統(tǒng)時(shí)需進(jìn)行身份驗(yàn)證，當(dāng)讀者身份驗(yàn)證完成后進(jìn)入系統(tǒng)操作頁(yè)面提問(wèn)。系統(tǒng)中的ChatGPT模型針對(duì)不同類(lèi)型的問(wèn)題識(shí)別，判定問(wèn)題的標(biāo)準(zhǔn)是理解讀者提出的問(wèn)題是否有指定標(biāo)記，例如讀者提出的問(wèn)題包含“查找館藏資源”關(guān)鍵詞信息，系統(tǒng)通過(guò)智能爬蟲(chóng)和數(shù)據(jù)清洗兩個(gè)步驟實(shí)現(xiàn)。首先，在算法工具中嵌入爬蟲(chóng)框架，由定義好的爬蟲(chóng)結(jié)構(gòu)填充相關(guān)內(nèi)容，再對(duì)讀者提出的問(wèn)題進(jìn)行清洗，將館藏的書(shū)目信息轉(zhuǎn)化為數(shù)據(jù)參數(shù)傳遞。智能爬蟲(chóng)在獲得關(guān)鍵詞后進(jìn)行數(shù)據(jù)抓取，訪問(wèn)的書(shū)目查詢(xún)系統(tǒng)獲得館藏資源列表。然后，由爬蟲(chóng)工具中的正則表達(dá)式匹配獲得具體的館藏資源分布數(shù)據(jù)，根據(jù)讀者需求進(jìn)行數(shù)據(jù)清洗和計(jì)算，將讀者所需館藏資源的位置信息、分布信息、數(shù)量信息及內(nèi)容信息封裝成json數(shù)據(jù)傳遞到可視化操作界面。若讀者提出的問(wèn)題需要系統(tǒng)解答，則進(jìn)入“智能回答”模塊，通過(guò)文本相似度算法對(duì)讀者提出的問(wèn)題進(jìn)行文本相似度計(jì)算。為保障問(wèn)題解答的精準(zhǔn)性，還需要添加文本相似度量的多重邏輯判斷，使系統(tǒng)具有一定程度的思考能力，實(shí)現(xiàn)不同類(lèi)型問(wèn)題的精準(zhǔn)理解，然后從數(shù)據(jù)庫(kù)中調(diào)取與讀者問(wèn)題高度關(guān)聯(lián)的數(shù)據(jù)自動(dòng)生成答案。

4.3.2 管理端功能設(shè)計(jì)

管理端的功能設(shè)計(jì)如圖4所示，主要?jiǎng)澐譃楣芾韱T的基本操作和超級(jí)管理員的必要操作。在功能實(shí)現(xiàn)過(guò)程中系統(tǒng)的運(yùn)行程序需要與數(shù)據(jù)庫(kù)關(guān)聯(lián)起來(lái)，通過(guò)數(shù)據(jù)庫(kù)操作語(yǔ)言實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)的調(diào)用，因管理員需要負(fù)責(zé)系統(tǒng)運(yùn)維，所以管理員在登錄系統(tǒng)時(shí)需要進(jìn)行身份驗(yàn)證，超級(jí)管理員在登錄系統(tǒng)時(shí)需進(jìn)行兩次身份驗(yàn)證。

在系統(tǒng)操作中，超級(jí)管理員和普通管理員具有的基本操作功能包括對(duì)讀者問(wèn)題的管理，通過(guò)讀者行為記錄表和語(yǔ)料庫(kù)關(guān)聯(lián)實(shí)現(xiàn)，對(duì)于未回答的問(wèn)題在得到管理員回答后，會(huì)填充到問(wèn)題的語(yǔ)料庫(kù)，這一操作過(guò)程能使系統(tǒng)的語(yǔ)料庫(kù)不斷豐富，然后在讀者行為記錄表中記錄該回答，并將該條信息的閱讀狀態(tài)設(shè)置為讀者未讀，便于計(jì)算信息的未讀數(shù)量。

普通管理員實(shí)現(xiàn)基本的操作功能，超級(jí)管理員則可以對(duì)普通管理員進(jìn)行身份認(rèn)證、增加普通管理員、刪除普通管理員和查詢(xún)普通管理員。超級(jí)管理員通過(guò)數(shù)據(jù)庫(kù)操作語(yǔ)言實(shí)現(xiàn)數(shù)據(jù)庫(kù)信息數(shù)據(jù)的調(diào)用，數(shù)據(jù)庫(kù)與系統(tǒng)通過(guò)算法連接，算法中不僅嵌入了可供超級(jí)管理員使用的數(shù)據(jù)庫(kù)操作語(yǔ)言，還設(shè)置了提交和回滾機(jī)制。數(shù)據(jù)庫(kù)操作語(yǔ)句在自動(dòng)生成后會(huì)自動(dòng)連接數(shù)據(jù)庫(kù)提交操作，針對(duì)數(shù)據(jù)庫(kù)執(zhí)行語(yǔ)句批量提交時(shí)可能出現(xiàn)的運(yùn)行錯(cuò)誤，設(shè)置了回滾操作來(lái)優(yōu)化操作步驟。

4.3.3 數(shù)據(jù)庫(kù)端設(shè)計(jì)

系統(tǒng)的數(shù)據(jù)庫(kù)端設(shè)計(jì)分析如圖5所示。數(shù)據(jù)庫(kù)是虛擬館員智能問(wèn)答系統(tǒng)運(yùn)行的重要保障，數(shù)據(jù)庫(kù)串聯(lián)系統(tǒng)的各個(gè)功能模塊，讀者行為記錄、管理員記錄、語(yǔ)料庫(kù)建設(shè)都離不開(kāi)數(shù)據(jù)庫(kù)的支持。智能問(wèn)答系統(tǒng)嵌入數(shù)據(jù)庫(kù)操作語(yǔ)句實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)信息數(shù)據(jù)的調(diào)用和增刪改查，通過(guò)MySQL數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)存儲(chǔ)。智能問(wèn)答系統(tǒng)數(shù)據(jù)庫(kù)中建立三張數(shù)據(jù)表（見(jiàn)表1—表3），分別為讀者行為記錄表、管理員表、語(yǔ)料庫(kù)表，表中字段基于需求進(jìn)行編輯。

讀者行為記錄表記錄了讀者的操作行為，如表1所示，讀者每進(jìn)行一次提問(wèn)，數(shù)據(jù)表中id就會(huì)增加一次。管理員表記錄管理員的個(gè)人信息和操作記錄等內(nèi)容，如表2所示，其中的id、use-name、password、crate-time、login-time對(duì)應(yīng)個(gè)人信息，record對(duì)應(yīng)操作記錄。語(yǔ)料庫(kù)表記錄如表3所示，主要記錄讀者提出問(wèn)題的語(yǔ)料和有關(guān)的問(wèn)題（question）和答案（answer），以id作為標(biāo)識(shí)，區(qū)分不同類(lèi)型的問(wèn)題，并保障每個(gè)id對(duì)應(yīng)一個(gè)類(lèi)型的問(wèn)題。

4.4 系統(tǒng)性能仿真測(cè)試

上述過(guò)程使基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)功能實(shí)現(xiàn)，系統(tǒng)能穩(wěn)定運(yùn)行，但其相較于傳統(tǒng)的智能問(wèn)答系統(tǒng)是否具有更高的答案生成速率和答案生成準(zhǔn)確率還無(wú)法確定，為此設(shè)計(jì)仿真對(duì)比實(shí)驗(yàn)對(duì)設(shè)計(jì)的基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)的性能進(jìn)行測(cè)試與分析。

在測(cè)試過(guò)程中，主要將基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)與傳統(tǒng)智能問(wèn)答系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn)，由于讀者提出的問(wèn)題不同，系統(tǒng)對(duì)讀者問(wèn)題語(yǔ)句的回答方式也存在著較大差異。為了保障實(shí)驗(yàn)結(jié)果的準(zhǔn)確性，對(duì)實(shí)驗(yàn)外部環(huán)境參數(shù)進(jìn)行統(tǒng)一設(shè)置，通過(guò)系統(tǒng)自動(dòng)生成答案速率和準(zhǔn)確率對(duì)系統(tǒng)性能進(jìn)行體現(xiàn)。自動(dòng)生成答案速率計(jì)算公式為：

其中，TP表示自動(dòng)生成答案正確的數(shù)量；t表示自動(dòng)生成答案的單位時(shí)間。

自動(dòng)生成答案準(zhǔn)確率計(jì)算公式為：

其中，F(xiàn)N表示自動(dòng)生成答案錯(cuò)誤的數(shù)量。

通過(guò)上述公式對(duì)智能問(wèn)答系統(tǒng)性能指標(biāo)計(jì)算與獲取，進(jìn)而對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行詳細(xì)分析。

通過(guò)實(shí)驗(yàn)獲得的自動(dòng)生成答案準(zhǔn)確率對(duì)比情況如表4所示。可以看出基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)自動(dòng)生成答案準(zhǔn)確率要高于傳統(tǒng)智能問(wèn)答系統(tǒng)，最大值達(dá)到99%。整體測(cè)試結(jié)果顯示，基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)極大提升了自動(dòng)生成答案的速率和準(zhǔn)確率，說(shuō)明基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)具有良好的性能。

5 基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)的應(yīng)用場(chǎng)景

5.1 提供精準(zhǔn)的館藏信息查詢(xún)服務(wù)

基于ChatGPT構(gòu)建的虛擬館員智能問(wèn)答系統(tǒng)具有較高的答案自動(dòng)生成速率和準(zhǔn)確率，讀者使用智能問(wèn)答系統(tǒng)查詢(xún)書(shū)目、咨詢(xún)學(xué)術(shù)問(wèn)題、獲取專(zhuān)業(yè)領(lǐng)域資料，并對(duì)查詢(xún)到的文獻(xiàn)進(jìn)行分類(lèi)整理，匯總成為觀點(diǎn)，在這個(gè)過(guò)程中，讀者基本不花費(fèi)大量的時(shí)間精力。基于ChatGPT構(gòu)建的虛擬館員智能問(wèn)答系統(tǒng)具有良好的上下文理解和分析總結(jié)能力，讀者可以用其自動(dòng)調(diào)取文獻(xiàn)資料，對(duì)文獻(xiàn)資料歸納總結(jié)與分析，整理形成綜述觀點(diǎn)。奧梅爾·艾登（?mer Ayd?n）等人借助提供的基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)以“養(yǎng)生保健中的數(shù)字孿生”為主題從學(xué)術(shù)資源庫(kù)調(diào)取文獻(xiàn)，用虛擬館員智能問(wèn)答系統(tǒng)理解總結(jié)后，對(duì)智能問(wèn)答系統(tǒng)提問(wèn)，結(jié)果發(fā)現(xiàn)虛擬館員智能問(wèn)答系統(tǒng)自動(dòng)生成的文本內(nèi)容與原文本具有高度的匹配性[10]，能高效地回答問(wèn)題。這也說(shuō)明應(yīng)用ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)能實(shí)現(xiàn)對(duì)文本知識(shí)的快速加工整理和表達(dá)。同時(shí)，哈佛大學(xué)圖書(shū)館將ChatGPT-4融入本館的智能問(wèn)答系統(tǒng)，被在校師生當(dāng)作數(shù)字秘書(shū)和科研助理，其中一位研究者使用基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)解決專(zhuān)業(yè)學(xué)術(shù)領(lǐng)域問(wèn)題，虛擬館員智能問(wèn)答系統(tǒng)給出了20多種解決方法，提供了全新的統(tǒng)計(jì)學(xué)術(shù)語(yǔ)[11]，輔助其快速解決學(xué)術(shù)研究過(guò)程中遇到的難題。由此來(lái)看，基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)可以作為一種全新的學(xué)術(shù)研究輔助工具，幫助讀者快速查詢(xún)、匯總、加工、整理文獻(xiàn)資料，形成新的觀點(diǎn)，提供新的研究解決策略，輔助讀者進(jìn)行科研決策[12]。

5.2 幫助用戶(hù)對(duì)文獻(xiàn)進(jìn)行潤(rùn)色

基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)針對(duì)不同讀者提出的相同問(wèn)題具有不同的回答方式與回答內(nèi)容，生成的文本信息經(jīng)過(guò)機(jī)器加工和語(yǔ)義矯正，具有較高的質(zhì)量。同時(shí)，智能問(wèn)答系統(tǒng)涵蓋的語(yǔ)料庫(kù)極為龐大，包括各國(guó)語(yǔ)言和各學(xué)科領(lǐng)域知識(shí)，可以根據(jù)讀者提出的問(wèn)題使用各種語(yǔ)言進(jìn)行回答。基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)能根據(jù)讀者提出的問(wèn)題生成不同風(fēng)格的語(yǔ)言文字。這些特性使基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)成為讀者有力的寫(xiě)作助手。例如，2022年計(jì)算生物學(xué)家凱西·格林（Casy Greene）和米爾頓·皮維多里（Milton Pividori）使用基于ChatGPT-4的虛擬館員智能問(wèn)答系統(tǒng)對(duì)研究性文獻(xiàn)進(jìn)行潤(rùn)色[13]，系統(tǒng)幾秒鐘就給出了修改建議，幾分鐘就完成了文章修改，系統(tǒng)修改后的文章結(jié)構(gòu)更為完整、緊湊，幫助讀者節(jié)省了文章修改時(shí)間，讓讀者有更多精力從事基礎(chǔ)的研究工作。

5.3 為讀者建立全新的閱讀文本生態(tài)

應(yīng)用基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)強(qiáng)大的語(yǔ)言處理能力，讀者可以構(gòu)建全新的語(yǔ)言文本，融合不同學(xué)術(shù)文獻(xiàn)和語(yǔ)言資料打造全新的文本生態(tài)。網(wǎng)絡(luò)藝術(shù)家卡澤米受1999年舊金山圖書(shū)館發(fā)起的“全國(guó)小說(shuō)寫(xiě)作月”活動(dòng)的啟發(fā)，在吉特哈伯（GitHub）發(fā)起了“全國(guó)小說(shuō)生產(chǎn)月”活動(dòng)，要求參與者可以使用任意ChatGPT衍生工具使用代碼程序創(chuàng)作小說(shuō)，其中由美國(guó)哥倫比亞大學(xué)圖書(shū)館員、耶魯大學(xué)圖書(shū)館館員使用虛擬館員智能問(wèn)答系統(tǒng)創(chuàng)作的小說(shuō)作品在吉特哈伯社區(qū)公開(kāi)，點(diǎn)贊量和閱讀量居于高位，其他參與者使用ChatGPT創(chuàng)作的文本內(nèi)容也會(huì)公開(kāi)發(fā)表到吉特哈伯社區(qū)，供其他參與者閱讀、評(píng)論和下載[14]，讓參與者認(rèn)識(shí)到人工智能創(chuàng)作的高效性。讀者使用基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)不僅可以創(chuàng)作文學(xué)作品，還可以生成系列圖書(shū)，從圖書(shū)選題、撰寫(xiě)、出版、策劃及書(shū)評(píng)都可以由人工智能完成[15]，讓讀者在大量自主閱讀學(xué)習(xí)的同時(shí)，也能高效高質(zhì)量創(chuàng)作，將自身的想法與創(chuàng)意通過(guò)語(yǔ)言文本呈現(xiàn)出來(lái)，建立全新的閱讀文本生態(tài)。

6 結(jié)語(yǔ)

本研究在概述ChatGPT、智能問(wèn)答系統(tǒng)原理和特點(diǎn)的基礎(chǔ)上，分析了虛擬館員智能問(wèn)答系統(tǒng)的設(shè)計(jì)需求，從系統(tǒng)架構(gòu)、問(wèn)答流程及功能模塊設(shè)計(jì)了基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)，并通過(guò)仿真測(cè)試實(shí)驗(yàn)驗(yàn)證了基于ChatGPT虛擬館員智能問(wèn)答系統(tǒng)的性能。實(shí)驗(yàn)結(jié)果表明基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)具有較高的答案自動(dòng)生成速率和準(zhǔn)確率。最后從讀者研究對(duì)象輔助者、語(yǔ)言文字潤(rùn)色者、文本生態(tài)構(gòu)建者三個(gè)方面總結(jié)了基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)的應(yīng)用場(chǎng)景。數(shù)字圖書(shū)館是讀者獲取知識(shí)的重要平臺(tái)，基于ChatGPT的虛擬館員智能問(wèn)答系統(tǒng)的應(yīng)用能實(shí)時(shí)和精準(zhǔn)地為讀者提供知識(shí)問(wèn)答、文本生成、自主創(chuàng)作、文獻(xiàn)歸納、智慧咨詢(xún)等方面的服務(wù)，能促進(jìn)館藏資源的高效應(yīng)用，提高智慧服務(wù)效率。

參考文獻(xiàn)：

[1] 張嘉寧，宋西貴.ChatGPT與圖書(shū)館的領(lǐng)域動(dòng)向[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)報(bào)，2023（8）：19-29.

[2] 李鋒.類(lèi)ChatGPT人工智能背景下國(guó)家安全情報(bào)工作的機(jī)遇、挑戰(zhàn)和應(yīng)對(duì)[J].情報(bào)理論與實(shí)踐，2023（12）：1-8.

[3] 鄭世林，陶然，楊文博.ChatGPT等生成式人工智能技術(shù)對(duì)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)的影響[J].產(chǎn)業(yè)經(jīng)濟(jì)評(píng)論，2023（6）：1-21.

[4] 程思凡.ChatGPT知識(shí)生產(chǎn)框架、技術(shù)迷思與未來(lái)演進(jìn)[J].當(dāng)代傳播，2023（6）：60-64.

[5] 胡瀟戈，戚越，王玉琦，等.面向智能問(wèn)答的圖書(shū)館參考咨詢(xún)知識(shí)庫(kù)體系設(shè)計(jì)及構(gòu)建[J].圖書(shū)情報(bào)知識(shí)，2019（5）：101-108，119.

[6] 李雪婷，李莘.圖書(shū)館微信平臺(tái)自動(dòng)問(wèn)答機(jī)器人語(yǔ)言體系研究[J].現(xiàn)代情報(bào)，2016，36（10）：99-101，122.

[7] 譚豐隆，陳婧，劉洋陽(yáng).ChatGPT與圖書(shū)館變革：雙重效應(yīng)、認(rèn)知變化與發(fā)展策略[J].圖書(shū)館論壇，2023（12）：1-9.

[8] 劉凌宇，徐中陽(yáng).類(lèi)ChatGPT人工智能技術(shù)嵌入智慧圖書(shū)館：應(yīng)用價(jià)值、潛在風(fēng)險(xiǎn)及防控策略[J].圖書(shū)館理論與實(shí)踐， 2023（12）：1-13.

[9] 王毅，董怡婷.類(lèi)ChatGPT人工智能在圖書(shū)館智慧服務(wù)中的應(yīng)用與思考[J].圖書(shū)館理論與實(shí)踐，2023（6）：129-136.

[10] AYD?N ?，KARAARSLAN E.OpenAI ChatGPT generated literature review：Digital twin in healthcare[J].Emerging Computer Technologies，2022（2）：22-31.

[11] WALD H.ChatGPT for clinical vignette generation，revision，and evaluation[J].MedRxiv，2023（2）：1-16.

[12] STOKEL-WALKER C，VAN NOORDEN R.What ChatGPT and generative AI mean for science[J].Nature，2023（7947）：214-216.

[13] PIVIDORI M，GREENE C S.A publishing infrastructure for AI-assisted academic authoring[J/OL].BioRxiv，2023[2023-10-20]. https：//doi.org/10.1101/2023.01.21.525030.

[14] 宋時(shí)磊.網(wǎng)絡(luò)寫(xiě)作社區(qū)的構(gòu)建、跨國(guó)拓展與貢獻(xiàn)：基于美國(guó)全國(guó)小說(shuō)寫(xiě)作月的分析[J].長(zhǎng)江學(xué)術(shù)，2022（1）：59-68.

[15] 宋時(shí)磊.詩(shī)歌之后：國(guó)外人工智能小說(shuō)的創(chuàng)作探索[J].湖北社會(huì)科學(xué)，2021（12）：126-132.

作者簡(jiǎn)介：劉驍斌，山西省圖書(shū)館館員，研究方向?yàn)閳D書(shū)館管理、讀者服務(wù)等。

收稿日期：2023-12-18本文責(zé)編：孫曉清

圖書(shū)館研究與工作2024年6期

圖書(shū)館研究與工作的其它文章: 數(shù)字人文時(shí)代圖書(shū)館口述歷史資源的價(jià)值挖掘與開(kāi)發(fā)利用研究; 成年國(guó)民閱讀意愿的動(dòng)因解析及“全民閱讀”活動(dòng)啟示; 手機(jī)應(yīng)用程序“過(guò)濾氣泡”現(xiàn)象及其規(guī)避策略研究; 美國(guó)匹茲堡玩具借閱圖書(shū)館運(yùn)行機(jī)制及其啟示; 中美高校圖書(shū)館學(xué)習(xí)空間服務(wù)對(duì)比研究; 低代碼技術(shù)在智慧圖書(shū)館的應(yīng)用場(chǎng)景和實(shí)踐路徑