楊 耀,施筱勇
(國家科技評估中心,北京 100081)
科研誠信是科技創新的基石。近年來,中國科技快速發展,取得世界矚目的成就,為建設創新型國家奠定堅實基礎,然而科研不端行為卻時有發生,給國內科技界形象造成了惡劣影響。黨中央、國務院高度重視科研誠信建設,先后出臺了《關于進一步加強科研誠信建設的若干意見》《關于進一步弘揚科學家精神加強作風建設和學風建設的意見》等重要文件進行規范和引導;科技部等科研誠信建設聯席會議成員單位也出臺《科研誠信案件調查處理規則(試行)》等文件,加強對科研不端案件的查處。
在科研誠信熱點事件中,涉及科研論文的不端行為無疑是一個焦點。媒體陸續曝光的《腫瘤生物學》雜志“107 篇論文撤稿事件”、南京大學“梁瑩事件”等引發社會廣泛關注。撤稿是保障科研論文真實可信的重要手段,國際出版倫理委員會(COPE)發布的撤稿指南中提出,只有在由偽造、篡改等不端行為以及一些誠實的錯誤等引起的數據不可信、重復發表并且沒有交叉引用、剽竊、存在倫理問題時才建議編輯考慮撤稿[1]。根據《醫學期刊編輯出版倫理規范》,所謂撤銷論文是指已經發表的,經作者申請或科學共同體成員舉報,在調查后發現存在錯誤或學術不端行為的,對科學發展具有不良影響的,同時載文期刊針對該文發布正式撤銷聲明以告知公眾的論文[2]。捏造(fabrication)、篡改(falsification)、剽竊(plagiarism)是不同國家公認的科研不端行為[3]。包靖玲等[4]對醫學學術期刊撤稿原因的研究表明,科研不端是撤稿的主要原因。因此,研究撤稿論文的相關情況,對把握科研誠信狀況、分析科研不端行為趨勢具有重要意義,基于論文撤稿的科研誠信研究已成為國內外開展科研誠信狀況研究、科研不端行為分析等的重要手段。
科研不端并非中國獨有的問題,而是世界上各個國家都面臨的挑戰。2018 年,前哈佛醫學院教授Piero Anversa 博士因涉嫌偽造和篡改實驗數據,被要求撤回30 余篇關于心臟干細胞的研究論文,給整個領域帶來嚴重影響[5];德國的Fundamental and Applied Limnology(《基礎科學與應用科學雜志》)一次性撤稿高達434 篇文章,其中包括2018 年世界應用研究學會會議論文,創下一年撤稿之最[6]。這些撤稿數字的背后是科研誠信狀況的一個反映,也是當前科研環境的一個縮影。分析中國和主要發達國家的論文撤稿情況,有利于認清國內科研誠信建設狀況、科研不端行為的主要形式、科研不端行為發生的重點領域等,為下一步加強科研誠信建設提供參考。
本研究以撤稿觀察數據庫(Retraction Watch Database)1)為基礎,分別于2019 年1 月27—29 日和2 月12 日檢索中國、美國、英國、德國、日本五國在2014—2018 年間發表的論文撤稿數據作為樣本進行分析。以2014 年中國撤稿論文為例,具體檢索方法如下:首先在Country(s)下拉菜單選擇China,然后在Original Paper 欄下From date 輸入框中輸入01/01/2014、在To 輸入框中輸入12/31/2014,在Retraction or Other Notices 欄 的Nature of Notice 下 拉菜單中選擇Retraction,其他以默認值進行搜索,將檢索得到的數據保存用于后續分析。各國每年撤稿數據的檢索方式均采用上述方式,共得到撤稿數量為2 208 篇。
依據撤稿觀察2)網站中標注的撤稿原因,本研究將撤稿類型劃分為因科研不端行為撤稿和因其他原因撤稿兩大類,并將科研不端行為歸類為剽竊(duplication)、不當行為(misconduct)、篡改或捏造(falsification/fabrication)、偽造欺騙(fraud)、違反倫理道德(ethical violation)等5 種類型(見表1),其中不當行為分類中明確使用misconduct 和objections by author(s)標注的不端和論文作者反對行為,其他原因包括數據錯誤、信息不足等,不屬于科研不端行為。

表1 科研不端行為類別劃分
2014—2018 年度發表論文總數從Web of Science檢索獲得。具體方法如下:以中國為例,在Web of Science 網站搜索框輸入“China”,選擇為“地址”,時間分別選定2014—2014 年、2015—2015年、2016—2016 年、2017—2017 年、2018—2018年,數據庫選擇核心合集,檢索所得結果即為每年度中國學者參與發表論文數量。上述所得2014、2015、2016、2017、2018 年度發表論文數量之和即為2014—2018 年度中國學者參與發表論文總數。樣本其他國家發表的論文數量采用上述相同的檢索方法,美國檢索地址輸入“USA or (United-States)or America”,英國檢索地址輸入“UK or England or Scotland or (Northern-Ireland) or (United-Kingdom)”,德國檢索地址輸入“Germany”,日本檢索地址輸入“Japan”,其他設置同中國檢索過程中設置。
基于撤稿觀察數據庫中對論文所屬領域的劃分,本研究對各領域因科研不端行為的撤稿進行了統計,原始數據劃分為七大領域,包括商業/技術(B/T)、基礎生命科學(BLS)、環境科學(ENV)、健康科學(HSC)、人文科學(HUM)、物理科學(PHY)和社會科學(SOC)。七大領域的每一領域下又有細分類別,如基礎生命科學具體分為生物化學、細胞生物學、分子生物學等,但本研究只統計七大領域,未統計細分類別,每1 篇論文只劃歸入1 個領域。由于學科交叉,部分論文具有多個標簽,若標簽都指向同一領域,則將論文劃分至該領域;若標簽指向不同領域,則劃入標簽出現次數最多的領域,如1 篇論文具有生物化學(BLS)、醫學-腫瘤學(HSC)、醫學-療法(HSC)和心理學(SOC)4 個標簽,則劃入標簽HSC 出現最多的領域;若指向不同領域的標簽個數相當(此為極少數情況),則根據論文標題和作者單位判斷劃入其中一個領域,如1 篇論文具有細胞生物學(BLS)、分子生物學(BLS)、醫學-神經學(HSC)、醫學-腫瘤學(HSC)4 個標簽,2 個領域的標簽數量相同,而作者單位為醫院和醫學院,則劃入健康科學(HSC)領域。
2014—2018 年間,樣本五國發表的國際論文被撤稿總數為2 208 篇,包括中國1 179 篇、美國638篇、英國162 篇、德國117 篇、日本112 篇(見圖1)。其中,因科研不端行為撤稿的論文共計1 198 篇,占撤稿總數的54.2%,包括中國760 篇、美國281 篇、英國61 篇、德國50 篇、日本46 篇,分別占本國撤稿總數的64.4%、44.0%、37.7%、42.7%、41.1%??梢?,研究期間中國撤稿的論文數、因科研不端行為撤稿的論文數均高于其他四國的總和。

圖1 2014—2018 年樣本五國論文撤稿數量的分類統計
2014—2018 年間,樣本五國每年撤稿數及其中因科研不端行為撤稿數均呈現出下降趨勢(見圖2)。其中,因科研不端行為撤稿數量中國下降趨勢最為明顯,從2014 年的283 篇下降至2018 年的42 篇,降幅達85%;其次為美國,從2014 年的76 篇下降至2018 年的15 篇,降幅達80%;德國、日本近年來也大幅降低,降幅分別達73%和82%,目前已連續兩年降低到5 篇以下;而英國雖然有下降,但近3 年每年基本穩定在9 篇左右,降幅為47%。

圖2 樣本五國因科研不端行為撤稿數量的年度變化趨勢
按表1 中科研不端行為的一級分類統計,樣本五國的撤稿中剽竊類位居科研不端行為的首位,屬于各國面臨的共同問題;偽造欺騙類在中國排第2位,而不當行為類在美國、英國、德國、日本等國均排在第二位;違反倫理道德類在各國科研不端行為統計中占比均較低(見圖3)。其中,一些因科研不端行為撤稿中出現的科研不端行為往往不止1種,例如有的論文同時出現抄襲和數據造假等不端等行為。根據表1,本研究在進行科研不端行為的二級分類統計中將科研不端行為各二級分類累加計算,結果顯示中國因科研不端行為撤稿的篇均科研不端行為次數最低,為1.38 次,低于美國1.53 次、英國1.43 次、德國1.58 次和日本1.41 次。

圖3 2014—2018 年樣本五國撤稿中科研不端行為類型統計
不同國家的科研人員數量、科研論文發表數量存在很大差異,單以撤稿總數、因科研不端行為撤稿數量來衡量一國科研人員整體的研究行為較為片面,因此,本研究引入每萬篇年度發表國際論文中因科研不端行為撤稿數這一指標Pm/t來反映各國因科研不端行為撤稿的整體情況,Pm/t=當年因科研不端行為撤稿數/年度國際論文發表總數×10 000,其中m為當年因科研不端行為撤稿數,t為年度國際論文發表總數。統計結果顯示,樣本五國在2014—2018 年間的Pm/t值均呈現出明顯的下降趨勢(見圖4),其斜率大小分別為:k英國(-0.146 3)> k美國(-0.212 2)>k德國(-0.221 6)>k日本(-0.276 5)>k中國(-1.733 3),不難看出中國在5 年中的Pm/t值下降速率最快,從2014 年的7.377 下降到2018 年的0.840,其他四國的Pm/t值下降速率較為相似。2018 年,中國的Pm/t值已降至0.840,但與其他四國相比,每萬篇因科研不端行為撤稿數依舊是其2~5 倍,其中德國的Pm/t值最低,僅為0.174 (見表2)。

表2 2014—2018 年樣本五國的Pm/t 值

圖4 樣本五國的Pm/t 值變化趨勢
按五國全樣本統計,2014—2018 年因科研不端行為撤稿涉及撤稿觀察數據庫劃分的全部7 個領域(見圖5),其中基礎生命科學領域的撤稿數量位列第一,共435 篇,人文科學最少,共8 篇。

圖5 2014—2018 年不同領域因科研不端行為撤稿的樣本數量分布
研究期間,中國在基礎生命科學、健康科學和物理科學領域因科研不端行為撤稿數量位居7 個領域的前3 位,分別為271 篇、267 篇和148 篇,但如圖6 所示,基礎生命科學和健康科學領域因科研不端行為撤稿數量占比在不斷降低,分別從2014 年的39.1%和43.3%下降至2018 年的23.8%和16.7%,而物理科學領域的撤稿數量占比上升,從2014 年的12.3%上升至2018 年的35.7%,超過其他6 個領域,商業和技術、環境科學、社會科學、人文科學領域因科研不端行為撤稿數量占比也有增加趨勢,但占比依舊較小。

圖6 中國在不同領域因科研不端行為撤稿數量占比的年度分布
本研究對撤稿觀察數據庫中2014—2018 年間中國、美國、英國、德國和日本的論文撤稿情況進行了細致分析,結果顯示:
第一,五國的論文撤稿數量呈下降趨勢,該結果與任艷青等[7]基于撤稿觀察數據庫全樣本分析的結果一致;其中因科研不端行為引起的撤稿數量占總撤稿量的54.2%,該比例小于基于PubMad 數據庫內生物醫學領域因科研不端行為撤稿數量的占比(65.3%),這可能與本研究的樣本來源數據庫有關,撤稿觀察數據庫綜合了多個領域的數據,不限于生物醫學領域[8]。中國在撤稿總數和因科研不端行為撤稿數量上均明顯降低,反映出國內科研誠信建設的總體趨勢向好,但與美國、英國、德國和日本這4 個發達國家相比仍然差距明顯。
第二,每萬篇論文中因科研不端行為撤稿數量的統計結果更是凸顯了中國與發達國家的差距。2014 年,中國的每萬篇論文中因科研不端行為撤稿數量為7.38 篇,而美國、英國、德國、日本均在1篇左右,這或許反映出國內科技界整體的誠信環境與發達國家仍存在較大差距,其中德國的每萬篇論文中因科研不端行為撤稿數量為0.68 篇,明顯低于其他國家。盡管在這5 年中,中國的每萬篇論文因科研不端行為撤稿數降低至0.84 篇,但仍然為樣本其他四國的2~5 倍。因此,中國應加強對發達國家的科研誠信建設經驗研究,尤其是對德國的科研誠信建設管理進行學習借鑒,促進國內科研誠信和科技界的作風學風建設。
第三,在科研不端行為類型統計中,剽竊類占各國科研不端行為的首位。在有關撤稿中不端行為的多項分析中,例如Campos-Varela 等[8]和周立秋等[9]的研究都發現剽竊為最常見的科研行為不端手段。因此,各國應加大對科研活動中剽竊行為的打擊力度,尤其是學術期刊在接到稿件后應運用相應的軟件系統進行篩查,這有利于對其中剽竊行為的發現和對此類不端行為的預防[10]。
第四,研究期間基礎生命科學領域是因科研不端行為撤稿的“重災區”,在本研究分析的7 個領域中最為嚴重。然而對中國的論文因科研不端行為撤稿所屬領域分析顯示,因科研不端行為撤稿數量的占比,傳統科研行為不端的“重災區”——基礎生命科學和健康科學領域正在呈現下降趨勢,物理科學領域正在逐年上升并在2018 年已位列各領域之首,其中很多撤稿源自物理和生物等學科的交叉研究。當前,新一輪科技革命加速演進,隨著新興技術的不斷出現,學科交叉融合必將日益深入,新興學科也將不斷涌現,科研誠信建設工作的風險領域可能正在發生變遷,各國應提前開展針對新興領域的科研不端潛在行為研究,為科研誠信建設、科研不端預防和監測提供方法與工具。
注釋:
1)網站地址:http://retractiondatabase.org/RetractionSearch.aspx?。
2)網站地址:https://retractionwatch.com/the-retraction-watchleaderboard/。