摘要:通過對AIGC發展歷程的分析,探討人工智能生成內容對于科研信息服務沖擊的理論基礎。AIGC促進科研信息服務內容、服務途徑和服務模式逐漸升級迭代,完成信息服務方式從被動到互動、服務內容從常規到精準、服務場景從單一到多元的發展,從而加速了交互型智慧咨詢、知識型報告生成服務、即時型的文獻傳遞服務、多場景型的科研信息服務在圖書館的應用實踐的進程。
關鍵詞:AIGC;人工智能;ChatGPT;科研信息服務
中圖分類號:G201文獻標識碼:A
人工智能時代,數字世界與現實世界的深度融合催生了數字生成內容的技術要素,各種AIGC工具應運而生。2023年11月7日,OpenAI宣稱公司的人工智能生成工具ChatGPT的周活用戶數達到1億人,有200萬開發者正在使用OpenAI的API,92%的財富500強公司正在使用OpenAI的產品搭建服務[1]。國內互聯網及企業科研機構也加入其中,陸續推出了各自的AIGC工具,例如百度公司的文心一言,科大訊飛的訊飛星火及清華大學的ChatGLM等。AIGC在人機交互、音樂及文案創作的優異表現,使它以迅雷不及掩耳之勢進入智慧科研、智慧教育及金融等領域,科研信息服務領域也不例外,如何利用這個智慧型工具,追蹤科研前沿動態,構建具有全球視野、多場景模擬和深度知識服務的信息服務平臺,是信息咨詢服務工作者應該認真思考的問題。
目前,高校圖書館界已經開始關注AIGC對于圖書館智慧化建設的研究,例如武漢大學龔芙蓉采取實證研究,分析AIGC工具對學生高階思維與情感價值的影響[2]。安徽大學管理學院儲節旺等認為應該在信息檢索、參考咨詢、閱讀推廣、特殊全體服務等方面加速AIGC的應用[3]。上海圖書館郭利敏等認為AIGC可以在資源加工、館員助理、智慧檢索和綜合應用上助力圖書館服務[4]。綜上所述,圖書館界對于AIGC助力圖書館的研究較多,專注于某一領域相對較少,特別是從研究AIGC在科研信息服務的文獻屈指可數。本文從AIGC的技術發展歷程,研究其對于科研信息服務的沖擊和影響,并通過具體的應用場景進行闡述。
1人工智能生成內容的發展歷程
人工智能(ArtificialIntelligence)是計算機科學的一個分支,是研究開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學[5],發展歷程可以追溯到20世紀50年代的。
AI誕生階段(1950—1956),人工智能之父艾倫·圖靈,在1950年發表的論文《計算機器與智能》中提出了圖靈測試。1956年,美國科學家約翰·麥卡錫和克勞德·香農等科學家,召開了達特茅斯會議,將機器模擬人類智能的新學科定義為人工智能,1956年也被公認為人工智能誕生元年。
起步發展階段(1958—2006),隨著卡耐基梅隆大學開發了XCON專家系統、人工神經網絡技術的發展,實現了語音識別的突破,但是識別效果不佳。隨后統計學模型的引入,有效地提高了語音識別的準確率,但是計算機運算能力嚴重不足,缺乏常識性的數據儲備,人機互動效果不佳。
穩步發展階段(2006—2014),2006年,李飛飛教授意識到了“數據”的重要性,于是開始構建大型圖像數據集—ImageNet。隨著計算機運算能力指數級別增長,搜索引擎、新媒體、電子應用產生海量數據,推動了人工智能的進一步發展,能夠進行語音識別、翻譯及內容的簡單生成。
快速發展階段(2014—2021),2014年,聊天程序“尤金·古斯特曼”在英國皇家學會舉行的“2014圖靈測試”大會上,首次“通過”了圖靈測試。隨著云計算和物聯網等信息技術的飛速發展,泛在感知數據和圖形處理器等計算平臺推動了以深度學習神經網絡的飛速發展,如語音識別及圖像識別等應用技術實現了重大突破。
蓬勃發展階段(2021至今),2021年,OpenAI提出DALL·E和CLIP。DALL·E兩個新的神經網絡,CLIP則能夠完成圖像與文本類別的匹配,并在2022年11月30日發布了ChatGPT,使用了Transformer神經網絡架構,擁有語言理解和文本生成能力,可以自主生成原創音樂、創作文案、視頻、編寫程序,與人類進行多場景的交流互動。
人工智能經歷70多年技術嬗變,歷經3次高潮低谷,終于磨礪成珠,AIGC產品的產生,使得人工智能完成從傳統知識型向智慧型人工智能的轉變。
2AIGC視域下對科研信息服務的沖擊
在人類文明發展的歷史長河中,每一次技術創新,必將引起生產方式的巨大變革,促進生產關系加速轉型。在信息知識生產內容快速增長的視域下,信息爆炸式增長,快速影響著圖書館的信息服務工作,使圖書館的信息服務內容、服務途徑和服務模式逐漸升級迭代,完成信息服務方式從被動到互動、服務內容從常規到精準、服務場景從單一到多元的發展,從而達到信息服務專業化、即時化、立體化和多語言化的服務效果。
2.1服務方式從被動到互動
傳統的信息服務以文獻資源為核心,從信息服務內容上主要是PDG有專業的內容創作者或團隊進行創作、編輯和發布的內容,如圖書館信息部門發布的紙質文獻、電子資源等,用戶主要是被動地接受文獻信息。隨著社交媒體的盛行,UGC是指用戶生成內容應運而生,它由普通用戶或受眾群體參與創作、編輯和發布的內容,如博客、知乎等,提倡知識共享共建,用戶的參與度大幅度提升,但是單方面參與,互動效果差強人意。AIGC創作者是人工智能程序,通過與用戶的互動,高效地獲取用戶需求,快速產生智能問答、論文及原創音樂等,促進個性化信息知識互動服務。隨著人機互動頻率的增加,可以促進自然人和機器本身的共同發展,能夠比單人或者單機的思考,更具創新性和全面性。
2.2服務內容從常規到精準
隨著科研數據密集化,學科知識融合化及復雜化的趨勢,對與信息服務工作者學科知識的寬度及深度有了更高的要求,而常規的信息服務內容的專業性及精準性相對不足,已經無法滿足用戶的需求。常規的信息服務多是依托館內資源,進行簡單資源提供查找服務,例如文獻傳遞、參考咨詢及信息素養講座等,而對于學科知識的精準知識服務相對較少。究其原因在于服務人員專業知識與高校科研工作者來比相差較遠,信息服務館員受制于學科背景及學歷層次,難以進行全學科的、專業的知識服務。而AIGC的各種應用則可以彌補館員專業知識儲備的不足。2023年12月7日,谷歌正式發布的多模態人工智能AIGC模型Gemini1.0系列,在MMLU(大規模多任務語言理解)測試上得分高達90.0%,即數學、物理、法律等57個領域測試中,GeminiUltra成為第一個超越人類專家水平的AI模型[6]。AIGC打破學科行業壁壘,為信息服務專業化、精準化、跨學科化提供了可能性,信息服務館員,可以利用AIGC的優勢根據用戶的科研需求,提供專業精準的信息服務。
2.3服務場景從單一到多元
數字化時代,用戶的需求更加多元化,如論文寫作、項目申請、課件制作、旅行工作及語言學習不同的場景需要不同的信息需求。傳統的信息服務多為單一場景服務,用戶單一或者多人,但是信息服務內容多為同一類型。不但場景單一、服務單一,并且信息服務容易受到時間、空間及人員限制,極大地阻礙了信息服務的開展。AIGC卓越的知識生成能力,能協助論文撰寫、智能搜索、生成原創音樂及視頻等多模態、多場景的應用,促進了信息服務場景的多元化擴展。不但如此,人工智能虛擬人技術的發展,可以使虛擬人真實化,可以給用戶創造更真實的服務體驗。
3AIGC視域下圖書館科研精準信息服務的應用場景
AIGC是建立在多模態之上的人工智能技術,它不僅影響了信息服務的服務方式、服務內容和服務場景,而且加速了高校圖書館科研信息服務模式的轉變。結合圖書館現有信息服務現狀,本文主要從交互式智慧咨詢、知識型報告生成服務、即時型的文獻傳遞服務、多場景型的科研信息服務等四個方面探討AIGC在圖書館的應用。
3.1交互型智慧咨詢服務
傳統的信息咨詢以人工咨詢、電話咨詢、QQ及微信咨詢等方式進行,咨詢范圍較為單一,咨詢內容相對簡單,咨詢時間相對局限。近幾年有些高校圖書館引入了智能機器人咨詢,如2021年5月,清華大信息服務對話機器人“清小圖”可以自動應答關于圖書借還、電子資源、座位預約等問題。還有南京大學的“圖寶在線”,服務內容不但涉及圖書館相關咨詢,更擴充至生活領域如“查匯率”“查快遞等”,但是智能咨詢效果差強人意。而AIGC的出現正好彌補了傳統信息咨詢的不足,以前的對話機器人的知識儲備、理解能力,交互性更加優越。以Gemini1.0為例,其支持文本、圖像、視頻、音頻及代碼等任意形態的輸入,具備復雜的多模態對話、多語言對話、可視化翻譯及嚴密的邏輯推理能力。高校圖書館可以借助Gemini1.0,為高校科研工作者提供科研咨詢、學科動態及課件制作等咨詢服務,并且支持多輪對話及錯誤反饋,極大地滿足了用戶的信息需求。
3.2智能型報告生成服務
信息咨詢部門的查收查引、科技查新服務,作為信息部門的常規工作,占用了信息服務人員大量的工作時間和精力。在用戶進行項目評獎及職稱評審時,往往時間要求緊迫,大量用戶排隊的情況時有發生。為了解決這種日益增長的查收查引需求和工作人員偏少、工作時間偏短的矛盾,可以利用AIGC創建智能程序,自助生成檢索報告,并且是由電子印章,可以大量節約用戶及服務方的時間和精力。而科技查新更需要大量的閱讀,對比中外文數據庫如Elsevier、PQDT等數據庫將近40個數據庫,涉及期刊論文、會議論文、專利及標準等各種文獻類型,工作繁雜,時間緊迫。以Gemini1.0為例,它具有閱讀、過濾以及理解信息,從數十萬份文件中提取見解的卓越能力,并且具有多語言能力,特別適合做文獻的抽取和對比,把AIGC引入科技查新服務,可以快速縮短文獻檢索閱讀及比對時間,極大提高科技查新的效率。
3.3即時型的文獻傳遞服務
文獻傳遞受高校數據庫的學科類別及數量限制,高校科研工作者經常需要進行文獻傳遞服務。從最初的館際互傳及平臺的郵箱傳遞,傳遞時間為3~15天,到后來的QQ、微信等新媒體工具傳遞,速度明顯加快,響應時間縮短至2~10分鐘,用戶滿意度得到了提升。但是畢竟是人工服務,工作時間為早上8:00至晚上10:00,無法做到科研時間全覆蓋。學術資源文獻傳遞與互助平臺應運而生,如鄭州輕工業大學的SPIS,覆蓋國內外主要全文數據庫,用戶可以直接下載,但是其文獻數量還是會有不足,缺乏人工服務。利用人工智能生成工具打造虛擬文獻傳遞人員作為補充,對于一些平臺缺少文獻進行跨平臺補充式檢索,或者是相關文獻推薦,盡可能地滿足用戶的文獻需求。
3.4多場景的科研信息服務
高校科研工作者承擔著不同身份,如教師、項目負責人、科研管理者和決策者等,面對不同的信息服務場景。信息化時代,面對紛繁復雜的海量文獻、日益迫切的科研進程壓力,繁雜的教學事務、對科研工作者的工作效率有了極高的要求。需要文獻的快速閱讀能力、創新的實驗設計能力、多種類型文獻的制作能力,這些都離不開信息資源閱讀和整理。Gemini1.0,卓越的文獻閱讀能力,可以極大程度提高科研工作者的閱讀能力,達到科研輔助的作用。其次,AIGC可以根據提示詞,依托數字化的資源,按照科研工作者的構思和目標提供不同的實驗及論文思路,促進用戶進行創新性思考。
結語
AIGC作為一種新型的內容知識方式為人工智能的技術創新帶來了新的范例,也加速了信息服務業的變革與轉型[7]。但是AIGC的不足與風險也不應該被我們所忽略和輕視。這些問題體現在:第一,數據的局限性,各個數據庫商、搜索引擎及新媒體視頻網站的數據往往具有商業壁壘。大語言模型關鍵需要大量數據訓練,數據的質量及數量的限制會影響模型邏輯思維能力的構建,從而造成生成結論的偏差。第二,受生成內容工具公司制作人員的社會意識形態、傳統習慣及知識儲備的影響,生成內容往往體現不同的中西方文化的偏差。第三,內容同質化,如何界定知識產權保護問題。雖然用戶需求千差萬別,但是大規模的普及應用難免會出現創作內容相同的情況,相同內容被不同人員使用,知識產權如何界定也是一個值得探討的問題。因此,圖書館信息館員使用AIGC工具時,應該遵循信息道德,合理有效利用揚長避短,更好地進行科研信息服務。
參考文獻:
[1]江月.OpenAI升級GPT大模型軟件開發者迎“iPhone時刻”[N].21世紀經濟報道,20231108(003).
[2]龔芙蓉.ChatGPT類生成式AI對高校圖書館數字素養教育的影響探析[J].圖書情報知識,2023,40(05):97106+156.
[3]儲節旺,杜秀秀,李佳軒.人工智能生成內容對智慧圖書館服務的沖擊及應用展望[J].情報理論與實踐,2023,46(05):613.
[4]郭利敏,付雅明.以大語言模型構建智慧圖書館:框架和未來[J].圖書館雜志,2023,42(11):2230+133.
[5]周志敏,紀愛華.人工智能[M].人民郵電出版社,2017.
[6]張夢然.谷歌發布最新人工智能模型Gemini[N].科技日報,20231208(004).
[7]朱富霖,章東旭.基于新型智能算法的多自由度機器人控制系統研究[J].輕工科技,2024,40(01):8789+97.
項目:本文系2017年度河南省社會科學規劃項目“基于知識轉移的產學研協同創新項目研究”階段性研究成果之一(項目編號:2017SZH011);2023年度河南省圖書情報研究項目“數智化場景下高校精準信息服務體系研究”階段性研究成果之一(項目編號:HNTQL2023159)
作者簡介:鄭書娟(1981—),女,漢族,河南新鄭人,碩士研究生,館員,研究方向:科研信息服務。