尤嘉琮,劉 瑋,張麗儀,林志祥,呂 鵬,阮 繼*
(1. 中華醫學會雜志社《風濕病與自身免疫(英文)》編輯部醫學期刊知識挖掘與服務重點實驗室 北京100052;2. 中山大學腫瘤防治中心《Cancer Communications》編輯部 廣東廣州510060; 3. 中華醫學會雜志社《癌癥發生與治療(英文)》編輯部醫學期刊知識挖掘與服務重點實驗室 北京100052)
近年來,隨著圖像處理軟件和文獻數據庫的日益發展,論文中的學術不端問題逐漸暴露出來。國內外出現大批因實驗數據造假、圖片篡改和偽造、欺詐性署名、虛假同行評議等行為而撤稿的事件,這些學術不端行為造成的危害無疑是巨大的,極大地浪費了學術資源、敗壞了學術環境、造成了嚴重的學術不公,導致了社會對學術界的信任危機[1]。在這些學術不端行為中,圖片篡改和偽造等學術不端的問題較為突出。2016年微生物學家Sunnyvale圖片分析顧問Elisabeth Bik帶領團隊,對1995—2014年發表在 40種期刊上的20621篇論文的圖像進行了篩選和分析,發現3.8%的論文中的圖片存在問題,其中至少1/2表現出故意操縱的特征[2]。2018年該團隊再次發表了對細胞分子生物學領域期刊的研究結果,分析了2009—2016年發表在Molecular and Cellular Biology上的960篇論文,其中59篇(6.1%)論文中存在不當復制的圖片,導致了41次更正、5次撤回和13次未處理[3]。這些數據一經發布,在學術界甚至社會中引發了巨大反響和討論,讓人們對論文中圖片的真實性產生懷疑,嚴重影響了學術界的聲譽。
但是,目前對于圖片學術不端行為的甄別方法還十分稀少,大多依靠期刊編輯在收稿時對論文圖片直接觀察進行比對和鑒別,這種比對方式只能對圖片的篡改或重復使用進行鑒別,采用的方法也大多是將圖片放大,檢查是否存在顏色過渡時模糊、扭曲等現象,對比各組間和不同時間點的圖片特征結果確定是否存在混用[4]。也可使用Photoshop、JPEGsnoop等軟件中的工具進行人工比對。這種方式固然有效,但只能發現一些使用較為低級的方法處理過的圖片,且耗費大量的人力和時間,收效甚微。不僅如此,圖片的篡改包括合成、變種、潤飾、增強、計算機生成、繪制等[5]多種方式。隨著圖像處理軟件的日益發展,圖片處理越來越精細,上述方法已不能滿足甄別圖片學術不端的需要。
有研究者[6]提出使用開放科學計劃OSID(open science identity)中的SAYS(scientist at your system)系統工具包對論文的圖片進行鑒別。開放科學計劃是一項面向學術期刊的開放科學公益計劃,借助SAYS系統工具,為每篇論文標注唯一OSID標識碼,構建供科研工作者互動交流的平臺[7]。但是,該方法有一定的局限性,若已發表的論文所在期刊未加入OSID,則無法將論文中的圖片加入數據庫,不能用來鑒別待發表的論文。而且,部分學科因其特殊性,圖片的重復性很低,可能少有自身圖片重復使用的問題,較少涉及抄襲其他論文中的圖片內容,如果出現這種情況,該方法則無法鑒別,所以不能解決所有問題。
Bik等[3]報道,Molecular and cellular biology雜志中因圖片學術不端問題而撤稿的論文約占撤稿論文的10%,約占雜志發表論文總數的0.5%,若該比例具有代表性,將有大量論文在發表后撤稿。論文發表后,雜志編輯平均需要用6h解決論文中的圖像問題;但在論文發表之前,編輯平均只需用30min對論文中的圖片進行篩選與修改,既可減少論文發表后可能出現的問題,又可節省編輯在論文發表后因修改圖像問題而耗費的大量時間。為了避免發生圖片學術不端現象,國際上各大出版社都進行了許多努力和嘗試。目前,Wiley出版社開發了一款AI圖像處理軟件(Image Checks),并宣布將推出“圖像審查服務”[8]。Wiley出版社的一些期刊的編輯部應用該軟件在投稿論文的初審階段對圖片進行檢查,幫助編輯甄別圖片是否存在學術不端現象;同時,要求作者在論文投稿時提交原始數據和圖片,以便編輯檢查。
本文對Wiley出版社的AI圖像處理軟件的工作原理及應用進行介紹,分析和討論了該軟件的優勢與不足,為期刊編輯準確又高效地甄別圖片學術不端提供參考。
該圖像處理軟件主要用于圖像完整的科技論文中的圖片檢查,如生命科學和醫學等,首先應用于Wiley出版社出版的Journal of Cellular Biochemistry和Journal of Cellular Physiology雜志[9]。該軟件具有準確、集中、優化、可擴展和專業驅動的特點,可以在稿件的初審階段幫助編輯對論文中的圖片進行檢查,以便及時發現和修正出現的問題。許多國際期刊,如Journal of Cell Biology及EMBO出版社旗下的The EMBO Journal、EMBO Reports、EMBO Molecular Medicine等,采用了一種新的圖片深度查證流程,即圖片數據完整性分析(data integrity analysis),由專業人員對圖片進行系統性分析,結果發現有20%~30%的稿件的圖片存在不同的問題[10],該軟件的采用,提高了期刊編輯對圖片數據的分析能力,更高效地檢查出圖片中可能存在的問題。
Wiley出版的一些期刊要求2020年7月以后投稿的作者在提交稿件時,需要提供未經處理的原始凝膠電泳圖像,出版社將原始圖像存檔,如果后續需要參考原始數據,可能會使用這些原始圖像,并寫信向作者咨詢。
Image Checks的工作原理與編輯收稿后對圖像的分析和處理流程基本相同。作者投稿后,Image Checks對稿件中的圖像進行干預,使用Visual Studio和Photoshop等專業圖像處理軟件檢測圖片是否存在剪切、拼接、翻轉、移接、調整對比度等處理。為確保圖像分析的專業性,由相關學科專家對圖片進行分析,且參與度大于或等于專業軟件Photoshop。Image Checks軟件設計團隊可根據使用者的需要,在檢測前、檢測中和檢測后分別提供分析和技術支持服務。目前,主要對生命科學和醫學領域的稿件進行驗證,范圍是接收初審或接收待修改的稿件中的圖片、顯微照片和凝膠印記圖像。
編輯在接收到作者提交的稿件、原始記錄和原始圖片后,首先對稿件進行編號,然后使用Image Checks軟件對稿件中的圖片進行分析,最后出具分析報告供編輯、作者參考和對稿件進行修改。圖片分析過程主要包括3個階段。
①預檢測和分析:對稿件進行預檢測和分析,首先鑒定稿件內容,然后使用Image Checks分析稿件中的圖像,最后通過目測或Photoshop對圖像進行 檢測。
②正式檢測和分析:根據雜志社對稿件中圖片的要求檢查圖片,如清晰度、格式等,再按照圖像優化軟件的參數檢查圖片,如常用的處理是對比度的調整等,以便于徹底檢查圖像是否存在人為處理等學術不端行為。
③檢測和分析后:根據已有的標準創建分析報告,也可根據作者或編輯的要求定制分析報告。在報告中根據學術不端的類型對可能存在問題的圖片進行分類,標注出可能存在問題的具體位置和對問題的詳細描述,并且提出相應的修改建議。而且報告是可以分享的,編輯可通過電子郵件將審查報告分享給稿件的利益相關者,進一步溝通或跟進修改進度,以便于編輯跟蹤和管理稿件數據,提高工作效率和工作 質量。
Image Checks軟件工作流程示意圖如圖1所示。

圖1 Image Checks軟件工作流程示意圖 Fig.1 Schematic diagram of Image Checks software workflow
較為常見的圖片學術不端行為是一圖多用或對原始圖片稍加處理后重復使用。如圖2所示,稿件中的圖片描述為:橙皮素減少LPS誘導的小鼠股骨骨質流失,小鼠在第9天被安樂死,并使用顯微CT和3D重建掃描它們的股骨遠端。圖像經檢查發現“橙皮素(Hesperetin) ”和“脂多糖(LPS)+橙皮素”的圖像相同,這是不可能的現象,因此判斷存在圖像重復使用的情況。

圖2 稿件中出現的一圖多用 Fig.2 Repeated use of one image in manuscript
免疫印跡和凝膠成像結果是生物學和醫學稿件中最為常見的數據,也是出現圖片學術問題最多的數據類型。最為常見的問題是作者有意或無意地通過有選擇地剪切、翻轉、重新排序和重用相同的源圖像或不相關的圖像來表示不同的結果。蛋白質免疫印跡結果的一圖多用如圖3所示,2張圖片中GAPDH的條帶相同,但分別標注的蛋白卻是不同,因此判斷存在圖片學術不端行為。

圖3 蛋白質免疫印跡結果的一圖多用 Fig.3 Repeated use of one image of Western blot results
圖像拼接是指通過不當的剪裁、抹除、復制、旋轉、縮放、拼湊等方式,對圖像進行篡改或者修改、重組圖片的部分內容得到想要的、但并不存在的結果數據圖像,屬于圖片學術不端行為[11]。圖像檢查軟件通 過調整圖片的亮度/對比度、級別和曲線的變化來分析圖像,判斷是否存在圖像拼接行為。如圖4所示,結果顯示AFT4和MTHFD2圖像中,2組條帶之間有明顯的直線(使用粗框和箭頭突出顯示),表明存在剪接。直接通過肉眼觀察很難辨別出ATF4圖像中條帶間的拼接痕跡,但使用圖像檢查軟件能夠快速、準確地分析出拼接位置。

圖4 圖像拼接的鑒別結果 Fig.4 Identification result of image splicing
圖像分辨率較低雖然不屬于圖片學術不端行為,但是對圖像檢查和論文的發表存在一定影響,因此也需要讓作者進行修改或重新提交。如圖5所示,圖像檢查軟件通過調整圖片的亮度、對比度和曲線來分析圖像。然而,由于作者所提供數據圖片的圖像分辨率較低(用粗框突出顯示),很難得出分析結果,無法鑒 別圖片是否存在學術不端問題。因此,應要求作者提供更高分辨率的圖像和原始數據(免疫印跡/凝膠圖像)進行重新分析和驗證。

圖5 圖片的圖像分辨率較低而無法進行分析 Fig.5 Unable analysis due to low image resolution of picture
綜上所述,圖像分析軟件能夠對稿件中不同圖片類型的常見錯誤很好地進行鑒別,可幫助編輯對稿件中的圖片進行高效、準確地審查。
近年來,大量論文因存在學術不端行為而被撤稿,造成了非常惡劣的社會影響,引起了學術界和期刊界的廣泛關注。Wiley、PLOS、Elsevier、Nature等多個國際期刊出版社旗下的期刊也增加了投稿同時提交數據原始圖片的新要求。相關機構也推出各種防范措施,研發檢測圖片造假和篡改的系統,如美國科研誠信辦公室(The Office of Research Integrity,ORI)開發的“Droplets”、艾普蕾(iPlagiarism)公司研發的貓圖鷹圖像造假檢測系統、Mike Rossner創辦的IDI(Image Data Integrity)系統。百度等科技公司還開放和提供圖片剽竊檢測系統[12]。
Wiley出版社也研發了AI圖片分析系統并已投入使用,要求作者投稿時同時提交稿件及數據的原始圖片,軟件隨即對稿件和數據圖片進行分析并出具分析報告,編輯可以根據報告對稿件進行評估,聯系作者對稿件進行修改,不但大幅減少了編輯或專業審核人員對論文中圖片的審核時間,同時也提高了問題圖像的檢出率和準確性。
目前圖像分析軟件還存在一些不足之處。在一些學科中,雖然研究結果的可重復性比較小,但如果研究內容相似,數據結果也可能存在抄襲或一圖多用現象。圖像分析軟件目前只能根據作者提供的原始圖片進行分析,還無法將稿件中的圖片與已發表或已經投稿過的其他稿件的圖片進行比對分析。所以,需要建立一個相關的圖片數據庫,將不同期刊已出版的論文圖片錄入數據圖,以供軟件進行比對分析。Elsevier與柏林洪堡大學在2018年宣布根據被撤稿論文中的圖片建立一個數據庫[13]。Journal of Cell Biology鼓勵作者共享數據,并于2008年發布了專為存儲生命科學領域論文原始圖片的在線存儲系統JCB DataViewer,未來將與其他存儲生命科學領域圖片數據的公共存儲系統合并[14]。隨著AI圖像識別技術的提升及論文數據庫的完善,存在數據和圖片學術不端的論文會逐漸被曝光,進而遏制學術不端行為的發生,營造和維護公平、公正、良好的學術環境。■