更讓人憂心的是,人們不愿意對此采取任何行動。
2011年,墨爾本蒙納士大學的婦產科教授本 · 摩爾(Ben Mol)無意中發現了埃及一位研究人員發表的一篇關于子宮肌瘤和不孕癥的研究論文的撤回通知。發表這篇文章的期刊之所以撤回該文,是因為文中的數據與早些時候西班牙的一篇研究論文數據完全一致,問題在于,西班牙的那項研究的主題是子宮息肉。事實證明,作者只是從有關子宮息肉的那篇論文里復制了一部分,把其中提到的疾病改成了子宮肌瘤。
“從那一刻起,我就對這類事情警覺了起來。”摩爾博士說。他不僅僅是作為已發表論文的讀者而警覺。當時,他還是《歐洲婦產科期刊》(European Journal of Obstetrics and Gynaecology )的編輯,并經常為提交給其他期刊的論文做同行評審。果然,很快就有兩份明顯偽造了數據的論文出現在了他的桌上。他將它們退稿。但是,一年后,他再次讀到了它們,它們發表在了另一本期刊上,只是作者對其中可疑的數據做了些調整。
自那以后,他就和其他研究人員合作,對他發現的數據造過假的作者寫的論文組進行調查——一查一個準。有些列舉患者特征的表格里的數據過于均勻。有些數值從臨床角度來看基本不可能。有份論文聲稱研究對象中的準媽媽是隨機選擇,但生出的嬰兒性別比例卻是不可信的40:60。這些論文里時常會出現驚人的臨床試驗完成速度。
編造虛假
摩爾博士和他的同事已經將他們對750多篇論文的擔憂發送給了發表這些論文的期刊。但是,大多數情況下,要么無事發生,要么期刊需要花費數年時間去調查。到目前為止,他們標出的研究論文中只有80篇被撤回。更糟糕的是,這其中的許多項研究都被納入了系統綜述,系統綜述是一種對多項研究的摘要,會為臨床實踐提供參考。
這可能會導致數以百萬計的病人接受錯誤的治療。比如,醫生會為選擇剖宮產分娩的婦女注射類固醇,這是為了防止新生兒出現呼吸問題。有人擔心它們可能會對嬰兒的大腦造成損傷,但這種做法在2018年得到了考克蘭(Cochrane)發表的一篇論文的支持,考克蘭是一家推廣循證醫學的慈善機構。然而,當摩爾博士和他的同事們看到這篇綜述時,他們發現文中包括了三項他們認為不可靠的研究。2021年,修訂后的論文剔除了這三項研究,論文發現,相關藥物對這些病例的益處難以確定。
多虧了像摩爾博士這樣的偵探,有越來越多部分或全部偽造的論文被揪了出來。“撤稿觀察”是一座在線數據庫,它列出了將近19 000篇遭到撤稿的生物醫學方面的論文。2022年,這一領域大約有2 600篇論文被撤稿,是2018年的兩倍多。有些論文被撤稿是出于誠實的錯誤,但是大多數撤稿論文都涉及這樣或那樣的學術不端行為。
然而,就算期刊真的撤回某篇論文,這一過程也需要數年的時間。根據這些數字來看,大約每1 000篇論文中就有一篇會被撤回。聽起來還不算太糟。然而,基于對此事的各種研究和偵探們的報告,“撤稿觀察”的創始人之一伊萬 · 奧蘭斯基(Ivan Oransky)認為,由于編造、剽竊或嚴重錯誤,大約每50篇論文中就有一篇論文的結果是不可靠的。
大多數編造的論文都來自兩個源頭。其中一些,特別是那些有關臨床試驗的論文,出自高產的個人或團隊欺詐者。那些被摩爾博士發現的就屬于這一類。另一些論文更多地以分子生物學等基礎科學為主題,它們是由被稱為“論文工廠”的機構收費撰寫的。通常情況下,編造這些論文的手段是通過復制已發表的論文,并將合法論文中提到的基因或疾病替換成另一種。
根據“撤稿觀察”數據庫,被撤稿次數最多的200位作者撰寫的論文占了全部1.9萬篇撤稿論文的四分之一以上。這些最高產的騙子中有許多都是大學或醫院的資深科學家。其中很少有人公開談論他們捏造研究的動機。但還是有些人開了口,而這些人的自白極大地解釋了哪些因素可能會推動其他人走上同樣的道路。
騙局不休
科學研究是一條艱難長路,對于研究人員提出的大膽假設,研究結果給出的答案往往模糊得讓人失望。迪德里克 · 斯塔佩爾(Diederik Stapel)曾是荷蘭蒂爾堡大學的心理學教授,在有人揭露他偽造研究后,他有58篇論文遭到撤稿。他在自白回憶錄《偽造科學》(Faking Science)中寫道,他之所以這么做,是因為這些研究的原始數據無法為研究的問題提供一個“簡單、清晰、美麗而優雅”的解決方案。然而,與許多類似的造假者一樣,他這樣做也是受到了職業晉升機會的蠱惑。所謂“不發表就毀滅”,這句格言反映了學術界的真理。一張長長的發表清單對于晉升或跳槽到其他機構以獲得更好的工作而言至關重要。但是期刊更喜歡那些給出強有力、積極結果的研究,這意味著,就職業發展而言,研究人員的大部分努力都是白費的。
發表大量研究報告使得一些欺詐者被視為他們所在領域的著名專家,還讓他們享受到了專業聲望所帶來的特權——至少在事情真相大白之前是這樣。牛津大學退休的實驗心理學家多蘿西 · 畢曉普(Dorothy Bishop)自愿花時間去識別有問題的研究,她觀察發現,這些欺詐者常常會領導許多研究小組,或是與其他研究中心建立合作網絡。當造假被發現,其后果會波及當事人的這些同事。“很多時候,”她表示,“初級研究人員的職業生涯會因此徹底受阻。”
這在某些國家尤其是個問題。要想在醫院獲得最好的工作,往往需要多到不切實際的發表數量,而且,在頂級期刊上發表文章的人還能獲得巨額的現金獎勵。因此,這些國家發展出了繁榮的論文工廠產業,也就不讓人意外了。事實上,幾乎所有與論文工廠有關的撤稿聲明都列出了這些國家的作者。在提交給期刊的論文中,大約五分之一的論文至少有一位作者來自這些國家的機構,然而這五分之一的論文占據了隨后被撤稿論文的近一半。
然而,有兩本期刊遭到了論文工廠的專門針對,對這兩本期刊收到的投稿進行調查后顯示,這些造假論文的作者來自70多個國家。而且,盡管出自中等收入國家的假論文數最多,但目前遭到曝光的、影響最為重大的數項造假臨床試驗卻是在美國、加拿大、歐洲和日本炮制出來的。
誰也不知道有多少造假行為是從來沒被發現的。畢曉普博士指出,“我們發現的造假論文只有那些造假水平不太高的。如果某人非常擅長造假,你發現不了。”而且害群之馬并非只有一兩匹。2009年,《公共科學圖書館:綜合》(PLoS One )發表了一份有關18項科學家調查的總結報告,這些調查都圍繞學術造假展開,參與的科學家大多來自美國。雖然只有2%的受訪者承認自己曾偽造數據,但14%的受訪者表示他們知道身邊有人偽造過數據。同樣,三分之一的受訪者承認自己曾做過其他可疑的研究行為,比如基于“直覺”放棄不符合研究論點的數據點,或是在研究進行期間對研究方案進行重大修改,但是有72%的人指出他們的同事曾經這么做。
美國在這方面并非“一枝獨秀”。在2016年發表的一項針對英國學者的調查中,近五分之一的受訪者承認自己曾捏造數據。在最近一項對荷蘭研究人員的調查中,來自生命科學和醫學領域的研究人員中有10%的人承認他們曾篡改或捏造數據。
許多偽造的論文是對已得到其他研究支持的治療方案的效仿型研究。在大多數情況下,這些研究不太可能影響臨床實踐。但是,有些騙子的論文卻成了特定醫學干預措施的靈感來源,這些措施最終都被證明是無用、甚至有害的。
例如,在過去,醫生們有時會為接受手術的危重病人注射淀粉以提高他們的血壓。這一措施部分基于德國麻醉學家約阿希姆 · 博爾特(Joachim Boldt)的七項研究,這些研究如今已被證明不可信。在人們發現他的偽造行為后,2013年,《美國醫學會雜志》(Journal of the American Medical Association )發表了一份修訂后的證據綜述,綜述顯示,在此類情況下注射淀粉會造成腎損傷,有時還會導致患者死亡。
類似地,十多年來,歐洲的心臟病患者都會在手術前服用β受體阻滯劑,目的是減少心臟病發作和中風。這種做法基于2009年的一項研究,但人們最終斷定,這項研究至少有部分是基于捏造的數據。據估計,每年僅在英國,這種方法就可能導致了10 000人死亡。此外,曾有一項系統綜述顯示,注射高劑量的糖溶液可以降低頭部受傷后的死亡率,然而,對其進行調查時,人們發現,文中稱所有的試驗都由同一位研究人員進行,但他們找不到任何證據證明研究人員真的做過這些試驗。
無米之炊
要想尋找偽造的論文,通常要首先在無意中發現其中一篇,然后像摩爾博士那樣,順著去找同作者寫的其他文章。“許多問題只有在你瀏覽同一作者發表于不同期刊的論文時才會顯現出來。因此,如果你手頭只有一篇論文,你未必能夠找出其中的問題。”阿伯丁大學的艾莉森 · 阿維內爾(Alison Avenell)如是說。她所在的團隊對數個研究小組發表的數百項臨床試驗表達了擔憂。她認為,問題論文的常見特征包括報稱自己的治療方法產生了異常大的影響、試驗參與者的中途退出率異常,或是在不同的試驗報告中出現了相同的數據。她說:“你會看到一些在統計學層面根本不可能出現的數據。”
卡萊爾(Carlisle)博士和其他人設計了各種統計檢查方法,來捕捉單篇論文中的異常數據。作為《麻醉》(Anaesthesia )期刊的編輯,他對2017年至2020年期間提交給該期刊的所有526項臨床試驗研究都進行了此類檢查。當他查看那些作者未曾提交病人個體基礎數據的論文時,他發現其中有2%的數據是虛假的。而當他檢查了那些包含個體基礎數據的論文時,這一比例飆升至44%,其中26%的數據被他判定為“存在致命錯誤”。
定期進行此類檢查可以阻止大量的偽造文章發表。然而,考克蘭機構的莉莎 · 貝羅(Lisa Bero)說,盡管判定期刊論文是否可以發表的評審者會收到所有的這些補充文件和數據集的鏈接,但他們中的大多數人不會去看。此外,盡管作者們經常說,如有要求,他們會提供論文的備份數據,但2022年進行的一項研究報告稱,當其他研究人員提出要求時,93%的作者未能提供備份數據。倫敦衛生與熱帶醫學院的伊恩 · 羅伯茨(Ian Roberts)表示:“你一要求對方提供原始數據,然后,我的老天,你就會意識到我們生活在一個好危險的世界里。”洪水、地震、白蟻、筆記本電腦被偷——他見識過的為數據丟失找的借口可謂五花八門。
白圭之玷
考克蘭機構維護著一個有關撤稿研究的數據庫,并根據需要對其系統綜述進行修訂。但是這類綜述很少需要修訂,部分原因在于線上圖書館很少為被撤稿的論文加上顯眼的撤稿標記,因此他人會繼續引用這些論文,好像它們仍然是被認可的有效研究一樣。漠不關心的態度也是因素之一:即使告訴研究人員他們的論文中包含了造假的研究,很多人也不愿意糾正這個錯誤。曼徹斯特大學的生物統計學家杰克 · 威爾金森(Jack Wilkinson)表示,這些人的態度是,這份研究在當時是正確的。
例如,阿維內爾博士和她的同事評估了27篇被撤回的臨床試驗論文的影響,這些論文涵蓋了數種醫學狀況,被88篇系統綜述和臨床指南引用。研究人員估計,如果將遭撤稿的試驗排除,其中一半文章的結論很可能會發生改變。他們將涉事論文被撤稿的消息告訴了所有文章的作者。只有一半的作者回復了。一年后,在那些可能會受到影響的44篇文章中,39篇的作者沒有采取任何行動。
近年來,針對論文工廠生產出的文章,人們也發現了類似的令人沮喪的情況。這類論文中有很多都質量低劣,任何認真的研究人員都會認為它們是個笑話,因此它們通常發表在只要給錢什么都可以發的野雞期刊上,但另一些看起來則足夠扎實,甚至會被著名的科學期刊發表。如今,這些期刊發現,它們已經發表了數百篇這樣的論文。一項研究對橫跨六個出版商和多個領域的期刊提交的53 000篇論文進行了分析,該研究對其中2%至46%的論文做了標記,認為它們存在可疑情況。
分子生物學領域的文章是論文工廠的專長,這類論文中經常加入蛋白質印跡的圖片,蛋白質印跡法是一種用于研究蛋白質的實驗室技術。例如,在研究某種藥物如何影響人類細胞的論文中就可以找到此類圖片。世界上沒有兩塊完全相同的蛋白質印跡,因此若有一雙銳眼就可以找出復制的圖片。伊麗莎白 · 比克(Elisabeth Bik)是一位荷蘭微生物學家,現已轉職成為專門搜尋造假論文的全職偵探,她在找這類復制圖片上就有著卓越的天賦。用她在一篇近期的評論文章中的話講,她利用“一雙匹配圖案的銳眼和大量的咖啡因”分析了超過10萬篇論文,并發現其中有6 500篇論文存在蛋白質印跡方面的錯誤或造假的證據。
偽造蛋白質印跡的研究似乎不會像偽造臨床試驗的研究那樣造成嚴重的后果。但想想最近有關阿爾茨海默病起因的一系列有影響力的論文所引發的爭議吧。這些論文的主要作者是明尼蘇達大學的西爾萬·萊斯內(Sylvain Lesné),該大學正在調查此事。
近來,比克博士和其他人在這些研究中發現了他們所說的圖像處理的證據,包括蛋白質印跡的圖片。其他科學家也曾試圖復制萊斯內博士2006年發表在《自然》期刊上的一項具有里程碑意義的研究結果,但都以失敗告終。這項研究似乎為一種假說提供了關鍵證據,該假說認為阿爾茨海默病與大腦中所謂的淀粉樣蛋白斑塊有關,這也是阿爾茨海默病研究中被引用次數最多的論文。這篇文章可能把所有有關該假說的科學研究都引向了錯誤的方向,因為它將矛頭指向了一種特定的β淀粉樣蛋白,也就是導致斑塊形成的蛋白。2022年7月,《自然》雜志在調查此事期間發表了一篇表達關注和憂慮的文章。
類似的現象也正出現在遺傳學領域中。在去年發表的一項研究中,悉尼大學的癌癥研究員詹妮弗·伯恩(Jennifer Byrne)帶領一個團隊,使用他們自行開發的軟件“核苷酸查找”篩選了近1.2萬篇論文,以檢查文中被稱為核苷酸序列試劑的物質的相關細節。
核苷酸序列試劑是一種DNA或RNA的短片段,它們旨在結合特定的天然基因物質片段,在很多基因研究中起到重要的作用。“核苷酸查找”從論文中提取這些試劑的序列,將它們與公共序列數據庫“Blastn”中的序列進行比較,以檢查它們是否與預期的基因靶標相匹配。該團隊發現,6%的論文中存在錯誤,暗示著它們可能是論文工廠的產物。
類似這樣的假遺傳學研究可能會和那些涉及可疑蛋白質印跡圖片的研究一樣,造成影響深遠的后果。伯恩博士和她的合著者估計,也許有多達10萬篇關于人類基因的論文來自論文工廠,而其中四分之一的論文“可能會誤導人類療法的未來發展”。
整肅學界
人們時常斷言,科學具有自我糾正的能力。的確,如果有人聲稱得出了某個結果,而這個結果足夠重要,那么人們遲早會發現它無法復制,或是發現后續的研究難以與之相符。不過,短期來看,潛藏于陰影中并非難事。就連數據造假的科學家的合著者們——換句話說,那些與他或她最親近的人——也可能難以注意到這位罪魁禍首在行惡事。在針對某種特定疾病的復雜研究中,會涉及數種類型的研究人員,理論上來講,這些研究者并非彼此領域的專家。畢曉普博士觀察到,“別人給了你一小部分數據,你就會傾向于相信它。”
此外,即使一篇已發表的論文被標記為包含捏造的數據,相關人員也往往很少啟動自糾程序。威爾金森博士表示,在收到提醒稱論文存在造假問題時,各家期刊和出版商的反應“大相徑庭”:他們是否會進行調查、需要多長時間才能得出結論,以及此后他們會做什么,各家在這些事上都很不一樣。
阿維內爾博士斷言,根據她的經驗,通常需要兩到三年的時間,期刊才會刊發關注聲明或是撤稿聲明。“我們讓那些文章被撤稿的唯一途徑,就是一遍、一遍又一遍地糾纏這些期刊,”她說,“如果你只是給他們發一封一次性的電子郵件,詳細說明你的擔憂,那么不太可能會有任何人采取任何行動。”貝羅博士說,考克蘭旗下的許多論文作者認為,提醒期刊編輯說自己發現某某研究有問題純屬浪費時間,所以他們不會費心這么做。“我們的許多作者都曾寫信給編輯,但要么得不到任何回應,要么編輯不會動手撤回論文,要么對方根本不進行調查。”她觀察得出結論。
問題之一在于,各家期刊很少會有具備處理此類問題所需專業知識的員工,比如統計學家。就出版商而言,他們通過出版更多的刊物獲利,而不是通過調查可能需要撤回的研究來獲利。他們還擔心被戰斗力過強的造假者起訴。因此,他們常常將責任轉移給雇用涉嫌造假人員的機構。
在美國,接受聯邦撥款的機構(也就幾乎是所有的正經機構)必須遵守政府規定,在收到有關研究學術不端行為的指控后,它們應在60天內進行調查。伊利諾伊大學厄巴納-香檳分校的倫理學家岡薩勒斯(C.K. Gunsalus)曾經做過這樣的調查,但她說,許多調查需要花一到兩年的時間。
做就是了
在某些情況下,調查的拖延是有充分理由的。原因之一在于,找到能夠進行復雜分析的專家很難。另一個原因是,對一份論文的調查可能會牽扯出更多份可疑的出版物。不過,岡薩勒斯博士說,大多數時候,調查緩慢只是因為“沒什么可著急的”。調查的目標是要決定一位研究人員是否應該被解雇,而不是為了保衛科學文獻的誠實性。在留職/解職的決定做出之前,大學方面通常會保持沉默。
岡薩勒斯博士說,即使在美國,此類調查的質量也往往有很多不盡人意之處。而且很多地方根本沒有相關規定。畢曉普博士說,在西方國家,由于研究學術不端而被解雇的人有時會換個地方重操舊業。伊朗卡尚醫科大學的扎托萊 · 阿塞米(Zatolleh Asemi)領導一個研究小組發表了一份包含172篇問題論文的清單,新西蘭奧克蘭大學的安德魯 · 格雷(Andrew Grey)及其同事指出,他所在大學的7位正、副校長中,有5位是其中至少一篇受影響論文的共同作者。
大學也并不鼓勵“吹哨人”們檢舉揭發,盡管這可以從源頭扼制研究造假。大學的規章制度通常會用大篇幅去說明虛假指控可能帶來的后果,但很少或根本完全不提醒人們注意學術欺詐行為要付出的責任。
很少有“吹哨人”擁有比克博士那樣的毅力。迪迪埃 · 拉烏爾(Didier Raoult)是馬賽一所大學醫院的教授,現已退休。在比克博士對拉烏爾發表的60多篇論文表示了關注和擔憂后,她收到了線上威脅,拉烏爾的一位同事還在推特上發布了她的家庭住址。拉烏爾博士還對她提起法律訴訟,指控她企圖敲詐和騷擾。法國政府的下屬機構法國國家科學研究中心譴責了拉烏爾的行為,稱其是“將科學爭議和批評司法化”。2021年,比克博士獲得了約翰 · 馬多克斯獎(John Maddox Prize),該獎由英國慈善機構“科學智識”和《自然》雜志共同頒發(馬多克斯曾在該期刊擔任編輯多年),以表彰她“在支持可靠的科學和證據一事上體現出的勇氣和正直”。
近來,出現了一些充滿希望的跡象。除了掃描撤稿數據庫、尋找是否有新內容需要補充,并將新內容納入數據重新分析外,考克蘭還開始檢查論文的誠信度。最近,考克蘭針對有關預防早產藥物的研究發布了一篇論文,并剔除了其中44項不符合誠信原則的研究,這占了起始清單中的四分之一。
與此類似,英國國家衛生與臨床優化研究所也為“系統綜述檢查”項目提供了資金支持,該項目由威爾金森博士負責,旨在為考克蘭進行的那類系統綜述開發誠信度檢查工具。科學技術醫學出版商國際協會是一家出版業協會,他們正在研究一種類似的系統,以便檢測投稿論文中是否存在偽造內容。領導此項工作的喬里斯 · 范羅瑟姆(Joris van Rossum)表示,這個系統旨在提示編輯,為他們指出論文工廠文章中常見的可疑特征,例如重復的圖像、同一篇論文同時提交給數家期刊、履歷中沒有相關專業知識的作者等等。
威爾金森博士和范羅瑟姆博士都擔心造假者和被雇來抓他們的人之間會展開一場軍備競賽。ChatGPT等人工智能工具的日益復雜化則放大了這種擔憂。在最近的一項研究中,研究人員要求ChatGPT生成50篇醫學研究摘要,結果,人類評審員和人工智能輸出檢測器都未能識別出其中三分之一的論文是由ChatGPT編寫的。
且信且證
然而,說到底,要防止偽造內容進入科學記錄,取決于出版商是否愿意提供更多的資源。對臨床試驗方面的論文進行統計檢查通常要涉及煩瑣的人工工作,例如在電子表格中輸入特定數據等。這將需要期刊雇用專門的員工,因而會削減期刊的利潤。
更先進的造假檢測方法本身是否能夠造成重大的影響?許多曾花費數年時間試圖讓造假論文被撤稿的學者對此持悲觀態度。羅伯茨博士和摩爾博士希望期刊可以得到類似某些國家的社交媒體和新聞業那樣的監管,對它們發表的內容建立標準。英國心臟病專家彼得 · 威姆斯赫斯特(Peter Wilmshurst)對自己所在領域的大量研究不端案例發出了警告,他認為應該對捏造數據的人進行刑事處罰。岡薩勒斯博士希望大學公開對研究欺詐的調查報告。并且,每個人都認同這個觀點:不發表就毀滅只會將學術界引向災難。
這些解決方案中沒有一個是快速或直接的。但如今,有一件事已經明了:選擇對學術造假視而不見正在對病人造成明顯的傷害。正如倫敦國王學院的斯圖爾特 · 里奇(Stuart Ritchie)在他的著作《科學小說》(Science Fictions )中指出的那樣:“為了科學,也許是時候讓科學家不要那么信任彼此了。”
資料來源 The Economist