余 菁,鄔加佳,劉清海,徐 杰
(1.中山大學學報編輯部,廣東 廣州 510080;2.附屬第三醫院期刊中心《器官移植》編輯部,廣東 廣州 510630)
圖片是醫學論文信息表達的重要方式,具有信息載體和數字證據的作用,存在于醫學各個學科的論文。隨著科技的發展,數字化圖像處理技術逐漸成熟,即使使用手機都可以完成圖像的編輯和處理,圖片的篡改和偽造變得越來越容易。2005年國外學者干細胞造假事件[1]等學術不端事件讓圖片的真實性產生誠信危機,影響了學術界的聲譽,也使醫學期刊編輯面臨巨大的挑戰。相對于文字的復制和抄襲,圖片的篡改屬于“較高層次”的學術不端,在論文的展現過程中,每個環節都是真實可靠的,僅有部分結果,通常也是關鍵性的結果被篡改,使得審稿專家、期刊編輯工作者很難分辨真偽。篡改圖片類行為在目前的學術不端行為中比較難界定和判斷,國內三大學術不端檢測網站——知網、萬方和維普,均沒有提供圖片檢測的服務。經過科學的實驗設計,在各技術環節逐一實施的基礎上,如未能得到預期結果,個別科研工作者會鋌而走險,篡改結果[2-3]。醫學期刊在此類學術不端行為中承擔著重要的社會責任,應加強對新媒體環境下圖片真實性檢測方法的探究,提高對圖片的審稿要求,有效預防圖片篡改文章的發表,以確保期刊健康有序發展。
本刊在接收作者投稿時會對論文圖片進行比對,首先檢查其各分組、各時間點圖片有無篡改或者重復使用,然后放大各圖觀察陽性結果,檢查像素間顏色過渡是否有模糊、扭曲等。在比較各分組、各時間點圖片時應注意把臨近的陽性結果、氣泡、裂隙(圖1C和D)以及一些特征性的結構(圖1E和F)進行仔細比對。


圖1 圖片重復使用實例
A、C、E和B、D、F中,很清楚地看到紅色箭頭所指的是同一細胞,黃色箭頭所指的也是同一細胞,周圍其他結構完全一樣。作者只是把鏡頭移動少許,但結果的表述卻屬于不同分組。
黃色箭頭所指的特征性結構證明G和H使用的是一張圖,但結果的表述卻屬于不同分組。
本刊在收到投稿論文結果如圖2A所示,發現其中兩個神經元形態近似,我們對此產生一定懷疑。首先將圖片放大,可以看到圖2A黃色所示的兩個神經元大小、形態極其類似,就連神經胞體上方的突起內染色都一模一樣,我們考慮其中一個為“假”神經元。

圖2 免疫熒光圖片篡改實例
為了驗證假設,我們將圖片用Photoshop軟件打開并放大,點擊吸管工具,觀察類似神經元胞體相同部位RGB值。圖2B和圖2C中吸管工具所指向的不同神經元同一部位具有同樣的RGB值(R:149,G:0,B:0)印刷四色模式(C:46,M:100,Y:100,K:16),這從側面反映了兩個神經元可能是“拷貝—粘貼”關系的“假”神經元。
其像素間顏色過渡比較混亂。這是由于圖片篡改過程中被進行過模糊、縮放等處理,部分區域和周圍有周期性關系。在圖1J的白色矩形框中可以看到橡皮圖章擦除的痕跡,擦除破壞了正常圖像數據間的連續性,打亂了顏色間的平穩過渡。盡管有些地方已經進行了銳化、模糊等處理,放大后一般還是能看出痕跡,尤其是與圖1I進行對比之后,可以分辨出涂改痕跡。
如果此時對投稿圖片有懷疑,需請作者提供原始圖片,查看其EXIF信息[5](圖3)。首先查看所有同類實驗圖片使用的拍攝裝置是否相同;然后查看修改時間是否在同一天,至少應在實驗進行期間;再后觀察EXIF信息提供的“軟件” 信息,看是否有使用軟件進行編輯的痕跡;最后要看“XMP數據”和“Phohoshop資源”的字節,如果是小的改動一般也要幾千到一萬字節。

圖3 圖片篡改前后EXIF信息的比較
紅色矩形框示:修改時間接近投稿時間,“XMP數據”和“Phohoshop資源”有寫入痕跡,說明圖片經Phohoshop軟件修改,結合有形態類似神經元的存在,可作出判斷。
圖片的篡改包括合成、變種、潤飾、增強、計算機生成、繪制[4]等。隨著圖像處理軟件的發展,未來還會出現更先進的圖像篡改技術。在醫學論文中經常出現的有合成、潤飾和增強。除了觀察圖片本身的灰度、色彩明暗銜接之外,還可以結合查看圖片屬性、Exif版本等信息確定圖片的真實性。
合成是指選取圖片的一部分拼接到該圖片本身或者其他圖片中,以達到添加或者去除某種信息的目的,又稱作復制粘貼(copy-move)篡改。
潤飾:大多數在消除篡改痕跡的時候出現,最終使得圖片看起來更加自然的一種圖像修補行為。下面就幾例圖對上述兩種情況做一分析。
增強:此種篡改是通過有目的地調整圖片整體或局部特征,包括明暗度、色彩、面積大小等,達到擴大不同特征間區別的目的。如圖2所示,圖2A為實驗的真實數據,使用photoshop軟件可將陽性結果條帶的明暗度增強(圖2B),通過對圖片的觀察可以看出,圖2B陽性條帶周圍有一暗圈。如果作者投稿如圖2B情況,從其陽性條帶周圍暗圈與marker的暗圈范圍的對比,以及暗圈周圍像素間顏色過渡生硬的情況,我們可以要求作者提供原圖,按1.5的方式檢測EXIF信息作出判斷。
重復:把同一張圖片的不同部位重復利用。圖3A和3B是同一張圖片,作者僅僅截取了其中一部分就當做兩個不同組別的圖例做分析。相對于上面幾種圖片篡改,這種類型的圖片篡改比較容易作出判斷。
其他表現:除了上述判斷方法之外,還可以通過Magic EXIF軟件查看圖片EXIF信息。方法是將圖片導入EXIF信息查看軟件查看其“數據排列方式”內容[5]。圖1A的EXIF信息可看到修改時間為2009年12月30日(圖4A),沒有其他處理軟件信息。而圖1B的EXIF信息顯示其在2018年4月19日用photoshop軟件進行過修改,圖4B顯示XMP數據組件數和字節數與上下行相比有較大不同。不過已經出現有修改EXIF信息的軟件,用Magic EXIF打開圖片如果軟件右下角有紅色的“非原始圖像”的提示,說明EXIF信息被修改過。
中國科協公布的《第二次全國科技工作者狀況調查報告》指出,數據造假等學術不端行為其根源在于現行學術評價和職稱評定標準不合理,主要是現行評價制度驅使,其他依次為社會大環境、監督機制不健全、研究者自律不夠、處罰不嚴厲、學術規范教育不夠、學術規范及規章不明確等原因。為應對新媒體環境下醫學論文圖片篡改,應從以下幾點做出相應防范。
學術界作為探索真理的先驅,本應是科學研究的帶領者和先證者,但學術不端等不良風氣嚴重損害了學術環境和學術純潔。高校作為學術團體最集中、學術資源儲備最充足的學術陣地,迫切需要加強其學術道德和學術規范教育。重點是要加強教師和年輕科研工作者的學術規范教育和學術道德建設,使之懂得科學精神,恪守科研道德,規范開展學術活動。通過講座、校園宣傳欄、校園網絡和移動互聯網等手段宣傳正確的科學研究方法,號召科研工作者敬畏學術,以真理標準要求自己,將真知真實滲入頭腦中,思想上認同真理,行為上實踐真理。
從立法上看,我國尚未明確學術不端行為的民事處罰,更無司法機關介入學術不端處理。一旦發現學術不端行為,大都由單位內的議事機構對其行為進行討論,提出處罰建議。2016年起各高校已經逐漸開始重視學校層面的學術監督機構,紛紛成立學術監督委員會或學術道德委員會等機構。除此之外,還應建立學者個人信用檔案,從論文投稿的途徑對各類學術不端進行防范。具體實施方法為使用“開放研究者與貢獻者身份識別碼”(Open Researcher and Contributor ID, ORCID)。由于此16位碼類似身份證號碼,每位學者可以申請,避免重名而造成文章歸屬問題,一人一碼。建議國內各刊物從投稿環節開始啟動作者ORCID碼,一經作者發現有各類學術不端現象,給予曝光且3~5年內不接受其投稿。
隨著圖像信息技術的發展,把圖片“查重”變成可能。目前可實施的方法有數字簽名和圖片檢測工具。數字簽名是指在圖片重嵌入簽名或者水印等版權信息。一旦圖片遭到篡改,數字簽名必將遭受破壞。不過,大多數的水印信息會降低圖片的觀感和資料價值。圖像篡改檢測技術在國外已有相關研究,圖片篡改檢測工具Clone tool detector和Truth dots逐漸開始應用到期刊檢測中。除了以上方法外,期刊雜志應在稿件見刊之前要求作者簽署類似《著作權使用授權書》,要求作者聲明來稿的原創性和無一稿多投行為。