[摘要]文章選擇《預防醫學》雜志審稿人為調查對象,收集審稿人基本信息,調查審稿人LLMs認知、使用以及LLMs輔助審稿的態度等,分析LLMs在醫學期刊同行評議中的創新場景,以及面臨的風險挑戰。基于此,文章提出“積極應對AI技術風險挑戰,維護學術誠信”“積極參與LLMs研發和規范制訂,推動醫學期刊創新發展”“加強審稿人培訓,擁抱AI時代的出版場景”的對策建議,以促進LLMs的行業化定制,推動醫學期刊高質量發展。
[關鍵詞]大語言模型;醫學期刊;審稿人;人工智能
以ChatGPT為代表的大語言模型(Large Language Models,LLMs)基于Transformer模型和自然語言處理(NLP)技術,通過深度學習和海量數據預訓練,能夠執行復雜的語言任務,在內容創作、文本生成、翻譯方面表現出色,加快了內容生產的速度,為全球化的信息交流和傳播提供了強大支撐[1-3]。同行評議是國際公認的學術期刊質量控制機制,但是在學術傳播全球化和傳播媒體快速迭代的時代,傳統同行評議流程不透明、評審不公正、評審時間長等弊端逐漸凸顯。AI技術的快速發展將從技術上改進同行評議流程,提高評審效率和質量,尤其是以ChatGPT為代表的LLMs問世以來,業界進行了積極探索和廣泛討論。有研究認為:LLMs可對論文結構、格式規范、文字差錯、數據質量、統計方法等進行分析,生成初步評價報告,有助于編輯和審稿人快速了解論文質量,節省評審時間[4-5];通過大數據分析,鑒別生成式人工智能(AIGC)生成內容以及論文抄襲、剽竊、代寫等學術不端行為,維護學術誠信和出版倫理[6-7];匹配合適的審稿人,通過構建審稿人的專業領域、具體研究方向及學術影響力的綜合畫像,將論文推送給專業對口的審稿人評審,提高審稿的專業性和效率[8]。審稿人通常也是科技工作者和論文作者,是學術生態圈中比較活躍和有代表性的群體,因此審稿人的態度在LLMs優化同行評議流程、推動行業化定制、規范標準制訂等方面扮演著至關重要的角色。文章基于《預防醫學》雜志審稿人問卷調查,結合文獻綜述,探討LLMs在醫學期刊同行評議中的應用場景以及面臨的挑戰,并提出相應的對策建議。
一、LLMs在醫學期刊同行評議的創新和應用場景
醫學研究通常需要通過調查和實驗收集大量數據,因此編輯在醫學論文審稿和編校工作中需要反復核對數據、核驗統計結果、檢查單位符號和規范圖表等,這需要耗費編輯的大量時間和精力,而且編輯的責任心和能力在一定程度上會影響編校質量。一方面,LLMs在學術期刊出版中具有強大的技術優勢,只需要幾秒鐘便可以完成論文原創性分析和規范格式、語言文字等基礎性工作,將審稿人和編輯從繁重的工作中解放出來,使他們可以更加專注于判斷論文質量和學術價值。另一方面,LLMs可以快速處理大量稿件,縮短審稿周期,提高出版效率;具有一致性與標準化的評審標準,能夠確保同行評議的客觀公正和透明度;通過精準匹配審稿人,能夠提高審稿的專業性和審稿質量;提供輔助決策,能夠減輕審稿人的工作負擔。
世界范圍內的學術期刊出版機構在LLMs應用和平臺建設方面進行了積極探索,如:Elsevier于2024年1月正式發布Scopus AI,通過應用生成式人工智能(AIGC)和LLMs對文獻進行自動分類,可為研究人員快速精準定位核心論文,生成簡明且可文獻溯源的研究主題等;Springer Nature的Transfer Desk是一個基于LLMs發展的自動轉投稿平臺,可通過論文主題和作者偏好畫像推薦合適的期刊;美國實驗生物學學會聯合會(FASEB)旗下的期刊Sci將SciScore整合到投稿系統,用于評估論文方法的嚴謹性和可重復性。Clarivate Analytics運營的Publons則展現了AI時代的學術期刊同行評議場景,學術期刊通過平臺為審稿人行為提供權威認證,強化了審稿人在工作中的認可度,有助于提升研究人員的學術聲譽和影響力。
二、積極應對LLMs帶來的新挑戰
LLMs在發展和應用過程中不可避免地會產生負面效應,如LLMs可能被用來代寫、抄襲和剽竊論文;LLMs深度學習和預訓練數據來源于互聯網,因此可能導致研究數據、作者信息泄露以及學術偏見;由于過度依賴LLMs等AI技術,審稿人、編校人員的判斷能力和業務能力下降[9-11]。學術期刊是學術成果發布的重要平臺,承擔著堅守出版倫理、維護學術誠信、打造健康學術環境的重要責任。國際出版倫理委員會(COPE)于2023年2月發布了關于出版物中AI使用的立場聲明:禁止將AI工具,如ChatGPT列為作者;作者應增加AI使用的透明度,并對AI生成的內容負責[12]。2023年12月,科技部監督司發布的《負責任研究行為規范指引(2023)》明確指出,不得使用生成式人工智能直接生成申報材料,依規合理使用生成式人工智能參與研究實施,不得直接使用未經核實的由生成式人工智能生成的參考文獻等[13]。2024年發表在BMJ的一項調查結果顯示,在Scimago.org評選的全球排名前100的期刊中,有51種是醫學期刊,其中有44種(86%)發布了生成式人工智能(GAI)指南,禁止將AI列為作者;關于具體的GAI工具,有23種(52%)提到了LLMs,19種(43%)提到了ChatGPT[14]。國際頂級醫學期刊《柳葉刀》明確規定,審稿人在同行評審過程中不能將論文或者部分上傳至AI工具,也不允許將評審意見上傳至AI工具潤色文字[15]。《英國醫學期刊》也強調了同行評審過程的機密性:不允許將未發表的稿件及相關信息上傳至AI工具;如果審稿人使用AI潤色評審意見,需要在提交的報告中披露[16]。
三、審稿人調查:認知率高但態度審慎
(一)對象與方法
《預防醫學》雜志于1989年9月創刊,是預防醫學與公共衛生學綜合類學術期刊,被中國科技核心期刊(中國科技論文統計源期刊)、《中國學術期刊影響因子年報》統計源期刊(Q1區)、《科技期刊世界影響力指數(WJCI)報告(2023)》、世界衛生組織西太平洋地區醫學索引(WPRIM)等國內外數據庫收錄。筆者以“大語言模型”“生成式人工智能”“LLMs”“AIGC”“ChatGPT”“學術期刊”“醫學期刊”“同行評議”“審稿”為主題詞,檢索中國知網、萬方數據知識服務平臺2023年1月以來收錄的文獻,分析研究熱點,設計調查問卷,調查內容包括審稿人性別、年齡、學歷、專業、專業技術職稱等基本信息,以及涉及LLMs認知和態度調查的單選或者多選題,總計8個題目。同時,筆者使用“問卷星”制作問卷,并通過電子郵件和微信進行推送,最終導出數據分析審稿人對LLMs的認知、態度和使用情況。
(二)結果分析
本次調查應答率為81.39%,平均答卷時間為169秒。參與本次調查的審稿人主要從事公共衛生和疾病預防控制工作,以中青年、高級專業技術職稱人員為主,大多承擔著科研和教學任務,發表過中英文論文,擔任醫學期刊審稿工作。其中,男性占61.7%,女性占38.3%;45歲—54歲占37.77%,35歲—44歲占33.51%;博士占49.47%,碩士占36.17%;正高專業技術職稱占64.36%,副高職稱占29.79%;所在機構為疾病預防控制中心占42.02%,醫院占27.66%,高等院校占26.60%;從事疾病預防控制工作占40.96%,教學科研占29.79%,臨床占15.96%。
以ChatGPT為代表的LLMs快速發展,2023年以來,文心一言、通義千問、訊飛星火、騰訊混元、Kimi等國內LLMs相繼上線,被廣泛應用于新聞、教學、出版、聊天娛樂等領域,對各行各業產生了深遠影響。調查結果顯示,審稿人對LLMs的認知率較高,3.19%對LLMs非常了解,30.85%比較了解,48.94%一般了解,16.49%不太了解,完全不了解的僅為0.53%。此外,54.79%的審稿人已經使用過ChatGPT、文心一言、WPS AI、訊飛星火、通義千問等LLMs。
對作者在論文寫作中使用LLMs的問題,審稿人中有15.43%持支持態度,有12.77%表示不支持,有71.80%持中立態度;對審稿人使用LLMs輔助審稿,審稿人中有46.81%持支持態度,有30.85%表示不支持,有22.34%表示并未考慮過這個問題;對編輯部使用LLMs輔助審稿,審稿人中有52.13%表示支持,有30.32%表示不支持,有17.55%表示并未考慮過這個問題。對此,表示QOKjq84NIP3qgSrxh1xvkQ==支持的審稿人認為在論文寫作中使用LLMs輔助審稿可以提高工作效率和論文質量;不支持的審稿人認為應用LLMs將產生更加復雜和難以控制的學術不端行為,會嚴重損害研究的真實性和學術誠信,應加以控制。鑒于COPE的公告及我國新近出臺的《生成式人工智能服務管理暫行辦法》等規范性文件的導向,加之學術界圍繞AI技術(特別是大型語言模型LLMs)所展開的廣泛而深入的討論,多數審稿人在評估過程中展現出更為審慎與周全的態度。
四、對策建議
(一)積極應對AI技術風險挑戰,維護學術誠信
羅伯特·斯考伯在《即將到來的場景時代》指出:“技術從來并永遠都是一種工具,無論是加以利用還是濫用都是由使用者決定的。我們可以滔滔不絕地贊美它,也可以對其帶來的危害感到極度痛苦。”[17]LLMs等AI技術的迅猛發展對內容創作和信息傳播領域產生極其深遠且革命性的影響,LLMs在醫學期刊同行評議過程中展現出巨大的發展潛力和應用前景。提高同行評議質量和效率,以及同行評議的透明度和客觀公正性是學術期刊創新發展的關鍵驅動力,是其在國際化競爭中取得優勢的重要途徑。因此,醫學期刊應加快LLMs等AI技術的引入與應用,充分發揮AI技術優勢,為我國醫學期刊發展注入強勁動力,進而提升我國醫學期刊的國際傳播力和影響力。隨著LLMs等AI技術在醫學研究與期刊出版領域的廣泛應用,相關從業者不僅需要充分發揮其技術優勢來推動醫學高質量發展,更要警惕并有效應對可能出現的科研不端行為和出版倫理問題。科研誠信是科技創新的基石,我國高度重視科研誠信建設,已出臺多項法規文件用于加強科研誠信建設,營造良好的科研環境。醫學期刊作為醫學研究成果發布、學術交流的重要平臺,承載著維護學術誠信和出版倫理的重要責任,應大力弘揚科學家精神,積極履行科研誠信的教育與宣傳責任,為構建良好的醫學學術生態貢獻力量;應積極探索與AI技術發展相適應的出版倫理規范、同行評議流程、出版方式,以確保論文發表符合學術規范和倫理標準;應不斷完善和嚴格執行“三審三校”制度和同行評議制度,依靠專家學者淵博的專業知識、嚴謹的態度,以及利用大數據、AI技術建立更加透明、客觀、公平的評審流程,確保論文的科學性和創新性。
(二)積極參與LLMs研發和規范制訂,推動醫學期刊創新發展
醫學期刊在LLMs和其他AI等新技術領域的研發和應用尚未形成有效的布局和戰略。一方面,國內醫學期刊出版單位比較分散,且大多為非法人編輯部,科研經費嚴重不足,技術人才匱乏,沒有自主研發能力;另一方面,醫學期刊出版單位對新技術和服務存在需求,但是購買力有限,企業投入研究經費難以產生利潤回報,因此積極性不高,投入不足,技術發展相對較慢。技術發展滯后在一定程度上影響了我國醫學期刊的出版效率和競爭力,因此醫學期刊應抓住AI發展機遇,積極參與LLMS等AI技術的研發與應用,以及智能平臺的構建與運營[11,18]。通過合作研究、培訓推廣等多種手段,LLMs等AI技術行業化定制產品被廣泛應用于醫學期刊審稿、同行評議、編輯出版等環節,進而推動醫學期刊出版業態的變革。醫學期刊應加強與醫學科研院校、學術團體的合作,積極參與制訂醫學研究、學術交流的AI(LLMs)指南,規范AI(LLMs)技術應用邊界。同時,醫學期刊應搭建跨學科、跨領域的合作橋梁,促進信息共享與資源整合,組織醫學、出版、法律、信息以及AI領域的專家學者就AI(LLMs)技術在醫學研究、數據分析、論文撰寫、同行評議等方面的應用合作進行探討研究,識別潛在的風險與挑戰,如數據隱私保護、信息安全、學術誠信等。此外,醫學期刊應建立和加強學術監督機制,明確監督主體與職責,如期刊編輯部負責引入大型語言模型(LLMs),以優化審稿流程、強化同行評議的精準度,并確保編輯工作的質量達到新高度;完善制度建設,加強編委會的監督作用,確保發表的論文經過嚴格評審;加強宣傳培訓,與科研機構、學術團體合作舉辦學術研討會等活動,提升科研人員規范應用AI(LLMs)技術的能力。
(三)加強審稿人培訓,擁抱AI時代的出版場景
如上所述,Scopus AI、ChatReviewer、StatReviewer、Publons等正在改變醫學期刊同行評議的傳統模式,為我們展現了AI時代的醫學期刊出版場景。然而,不同醫學期刊對AI的認知和接受度存在差異,一些期刊可能更加關注AI技術的潛力和前景,而另一些期刊則可能持保守態度,處于觀望態度。同時,審稿人對LLMs等的技術邊界以及潛在風險還缺乏足夠了解,LLMs等AI技術在醫學研究、論文撰寫、審稿中的實際應用價值尚未得到廣泛認可。盡管LLMs等AI技術在自然語言理解方面取得了顯著進展,并在醫學期刊出版領域得到應用,但是隨著醫學研究領域和學科被不斷細分,醫學期刊對產品的個性化定制具有很高要求,當前LLMs的技術成熟度還不足,面臨適應性挑戰。為了確保審稿人能夠充分利用LLMs等AI工具,減輕審稿工作負擔,同時維護同行評議的公正性和專業性,醫學期刊應加強審稿人培訓,引導審稿人規范使用AI工具,以提高審稿質量和效率[18-19]。同時,醫學期刊還要了解審稿人的實際需求,針對不同學科領域、不同經驗的審稿人提供差異化的培訓內容,確保培訓的針對性和有效性。隨著AI時代的到來,類似Publons這樣的智能平臺既可以實現對稿件的初步篩選和審稿,并快速生成評審報告,還可以對專家的研究領域、學術背景、審稿記錄等進行資料分析,構建審稿專家畫像,幫助編輯部快速、精準找到專業對口的審稿專家。總之,AI技術的發展勢不可擋,醫學期刊出版機構應積極做好準備,迎接AI技術帶來的機遇與挑戰。
五、結語
未來已來,AI浪潮正以前所未有的力量推動著一場深刻的產業變革。我國醫學期刊數量占中文科技期刊的四分之一,在AI技術的推動下,醫學期刊正迎來新的發展機遇。LLMs等AI技術不僅優化了學術期刊的同行評議流程,也為期刊的高質量發展注入了強勁動力。但是,要想成熟應用LLMs等AI技術,審稿人還需要進行大量的實踐研究。文章通過問卷調查了解了醫學期刊審稿人對在論文寫作以及審稿過程中使用LLMs的態度,為推動LLMs等AI技術行業化定制和同行評議流程優化提供了客觀信息。由于文章只選擇了一家醫學期刊進行調查研究,調查結果不能代表所有醫學期刊和衛生健康專業技術人員,有一定的局限性。下一步,筆者將跟蹤AI對學術期刊出版影響的研究熱點,選擇更多醫學期刊進行調查,以探索AI技術推動醫學期刊高質量發展的路徑。
[參考文獻]
[1] 徐思彥.生成式人工智能:發展演進及產業機遇[J].人工智能,2023(04):43-50.
[2]沈錫賓,王立磊,劉紅霞.人工智能生成內容時代學術期刊出版的機遇與挑戰[J].數字出版研究,2023(02):27-33.
[3]楊雅.生成式人工智能在科技期刊出版中的應用場景探討[J].新聞研究導刊,2024(02):242-245.
[4]楊涵,張小強.論人工智能應用給學術期刊編輯帶來的機遇與挑戰[J].編輯學報,2023(03):258-262.
[5]張重毅,牛欣悅,孫君艷,等.ChatGPT探析:AI大型語言模型下學術出版的機遇與挑戰[J].中國科技期刊研究,2023(04):446-453.
[6]楊亞紅,孫巖,余黨會.學術出版行業生成式人工智能作品相關責任與風險分析研究綜述[J].中國科技期刊研究,2023(12):1601-1607.
[7]徐敬宏,張如坤.大語言模型在學術出版應用中的失范風險與應對策略[J].中國編輯,2024(02):36-42.
[8]董文杰,李苑.人工智能在科技期刊中的應用及啟示[J].中國科技期刊研究,2023(11):1399-1408.
[9]李松山.ChatGPT背景下科技期刊面臨的挑戰及應對策略[J].傳播與版權,2023(19):58-61.
[10]曹兵,唐帥,李潔,等.ChatGPT對科技期刊的影響及其應用[J].傳播與版權,2023(18):48-52.
[11]楊亞紅,孫巖,余黨會.人工智能對學術期刊3個重要出版環節的影響[J].編輯學報,2024(01):88-92.
[12]COPE.COPE position statement[EB/OL].(2023-02-13)[2024-08-25].https://publicationethics.org/cope-position-statements/ai-author.
[13]中華人民共和國科學技術部.科技部監督司發布《負責任研究行為規范指引(2023)》[EB/OL].(2023-12-21)[20241599c36661f224e0fa7ee037b38e9ab562d828352ecc8324d61608bc92bdb9d6-08-25].https://www.most.gov.cn/kjbgz/202312/t20231221_189240.html.
[14]GANJAVI C, EPPLER M B, PEKCAN A, et al.Publishers' and journals' instructions to authors on use of generative artificial intelligence in academic and scientific publishing: bibliometric analysis[EB/OL].(2024-01-31)[2024-08-25].https://doi.org/10.1136/bmj-2023-077192.
[15]Overview of peer review at the Lancet journals[EB/OL].[2024-08-25].https://www.thelancet.com/peer-review.
[16]Resources for reviewers[EB/OL].[2024-08-25].https://www.bmj.com/about-bmj/resources-reviewers.
[17]斯考伯,伊斯雷爾.即將到來的場景時代[M].趙乾坤,周寶曜,譯.北京:北京聯合出版公司,2014.
[18]李春麗,俞琦.ChatGPT人工智能對科技期刊編輯出版的影響及對策[J].學報編輯論叢,2023(00):56-61.
[19]王丹.ChatGPT對科技期刊的影響及應對策略[J].中國傳媒科技,2024(02):70-74.