論文撤稿數(shù)量的增長(zhǎng),既反映了現(xiàn)代科技的進(jìn)步,也從側(cè)面反映了奔走在學(xué)術(shù)打假前線的“學(xué)術(shù)偵探”的存在。各種編輯軟件的誕生使得論文造假越來(lái)越容易,但另一方面,科技的進(jìn)步也給“學(xué)術(shù)偵探”提供了更多的武器,使得“打假”更容易了。現(xiàn)如今,任何一家有聲譽(yù)的出版社或期刊,都會(huì)在錄用文章之前進(jìn)行查重。
“圖片偵探”
前《細(xì)胞生物學(xué)雜志》副主編麥克·羅斯納是學(xué)術(shù)界響當(dāng)當(dāng)?shù)摹皥D片處理偵探”。
1997-2007年,羅斯納在美國(guó)《細(xì)胞生物學(xué)雜志》擔(dān)任副主編;2006-2013年,他在洛克菲勒大學(xué)出版社擔(dān)任執(zhí)行理事。2002年,他在《細(xì)胞生物學(xué)雜志》執(zhí)行了一項(xiàng)新政策:篩查接收到的論文中的所有圖片。這最終導(dǎo)致該雜志拒收大約1%已通過(guò)同行評(píng)議的論文。兩年后,美國(guó)研究誠(chéng)信辦公室為雜志和出版社推出了篩查圖片的軟件。
羅斯納認(rèn)為,圖片也是數(shù)據(jù),重要性和論文中的數(shù)字及任何其他支撐性數(shù)據(jù)相當(dāng)。有鑒于此,他在2013年開(kāi)辦了一間咨詢公司,為期刊、出版社和大學(xué)提供生物醫(yī)學(xué)方面的圖片處理業(yè)務(wù)。
斯坦福大學(xué)微生物學(xué)家伊麗莎白·比克也有“圖片偵探”之稱。
比克在荷蘭老牌名校烏得勒支大學(xué)獲得博士學(xué)位后,在斯坦福大學(xué)微生物學(xué)與免疫學(xué)系工作多年,2016年加入位于美國(guó)洛杉磯的腸道茵群檢查(uBiome)公司擔(dān)任科學(xué)編輯總監(jiān),該公司乃世界領(lǐng)先的微生物基因組學(xué)研究公司。
在斯坦福大學(xué)工作時(shí),比克曾帶領(lǐng)團(tuán)隊(duì),花了數(shù)年時(shí)間審閱1995-2014年間來(lái)自40本不同科學(xué)期刊的20621篇已發(fā)表論文。2016年,比克和兩名微生物學(xué)雜志編輯一同公開(kāi)了研究結(jié)果:其中782篇文章存在圖片處理不當(dāng)問(wèn)題,比例達(dá)3.8%。但發(fā)現(xiàn)了問(wèn)題,并不意味著問(wèn)題就能得到解決。比克將其研究成果告知了相關(guān)期刊,只有三分之一有回應(yīng)。
隨后,比克又領(lǐng)導(dǎo)一個(gè)團(tuán)隊(duì)篩選了2009-2016年在《分子與細(xì)胞生物學(xué)》(MCB)雜志上發(fā)表的960篇論文,并在去年發(fā)布研究成果:59篇(6.1%)論文存在“不恰當(dāng)?shù)膱D片重復(fù)使用”情況,包括同一圖片在同一期刊多次使用,同一篇文章的不同實(shí)驗(yàn)中使用了相同圖片等。研究人員把這個(gè)情況通報(bào)給雜志社,最終有42篇論文更正了圖片,5篇被撤稿,另外12篇論文由于種種原因未采取任何措施。
研究還發(fā)現(xiàn),已發(fā)表論文如果被發(fā)現(xiàn)存在不恰當(dāng)圖片使用問(wèn)題,平均每篇得花6個(gè)小時(shí)解決;而如果在論文發(fā)表之前就提前介入,可能只需要30分鐘就夠了。
比克認(rèn)為,許多不恰當(dāng)圖片的使用問(wèn)題并非學(xué)術(shù)不端,而是不小心犯錯(cuò)。比克提出,更好的策略是在論文發(fā)表之前就揪出這些圖片問(wèn)題,她希望這項(xiàng)研究能警醒期刊編輯和同行評(píng)議人員重視這一問(wèn)題,建議期刊編輯在收到論文后就掃描一遍里面的圖片,這樣做要比發(fā)表后發(fā)現(xiàn)問(wèn)題再來(lái)應(yīng)對(duì)各種麻煩節(jié)省時(shí)間。
“數(shù)據(jù)流氓”
35歲的詹姆斯·希瑟爾斯和57歲的尼克·布朗被譽(yù)為“數(shù)據(jù)警察”,他們卻自嘲為“數(shù)據(jù)流氓” ——無(wú)組織的散兵游勇。給論文“找茬”純屬業(yè)余愛(ài)好,他們沒(méi)有任何資金支持,也和任何官方機(jī)構(gòu)無(wú)關(guān)。
希瑟爾斯出生在澳大利亞,在悉尼大學(xué)獲得了碩士和博士學(xué)位,分別研究過(guò)經(jīng)濟(jì)學(xué)和生理學(xué),如今是美國(guó)波士頓東北大學(xué)計(jì)算行為科學(xué)的博士后。而布朗在英國(guó)長(zhǎng)大,是劍橋大學(xué)工程學(xué)專業(yè)出身,當(dāng)了多年的計(jì)算機(jī)網(wǎng)絡(luò)經(jīng)理,如今在荷蘭格羅寧根大學(xué)攻讀心理學(xué)博士學(xué)位。
希瑟爾斯和布朗并不認(rèn)為自己是在“打假”或者揭發(fā)學(xué)術(shù)不端。數(shù)據(jù)上的小問(wèn)題可能是一時(shí)疏忽導(dǎo)致的錯(cuò)誤,也有可能是巨大問(wèn)題的冰山一角,而他們只負(fù)責(zé)當(dāng)說(shuō)實(shí)話的“流氓”。布朗說(shuō):“我們只檢查數(shù)據(jù)的不一致,而把推測(cè)為什么的事情交給別人。”
這對(duì)搭檔靠希瑟爾斯編寫的簡(jiǎn)單軟件,為揭發(fā)有問(wèn)題論文開(kāi)辟了全新的思路——這款縮寫為“精靈”的軟件能夠利用統(tǒng)計(jì)學(xué)原理,從論文發(fā)表的結(jié)果重建出原數(shù)據(jù)的可能面貌。
布朗估計(jì),到目前為止,兩人聯(lián)合或各自獨(dú)立做的分析,已經(jīng)導(dǎo)致了幾十篇論文的修改以及十多篇論文的撤稿,其中包括康奈爾大學(xué)知名研究者布萊恩·萬(wàn)辛克的5篇論文。
2012年,萬(wàn)辛克在《吸引人的食物名字能增加小學(xué)生的蔬菜攝入》一文中提出,如果把某種十分討厭的蔬菜命名為“x射線眼胡蘿卜”,小孩子就會(huì)大吃特吃。希瑟爾斯用“精靈”重建可能的論文原數(shù)據(jù),結(jié)果發(fā)現(xiàn),要得到論文里的平均值和樣本量,實(shí)驗(yàn)中至少要有一個(gè)孩子需要吃掉60根胡蘿卜,才能產(chǎn)生與實(shí)驗(yàn)數(shù)據(jù)相匹配的結(jié)果!這數(shù)據(jù)明顯是有問(wèn)題的。
隨后,兩人分析了萬(wàn)辛克過(guò)去幾年發(fā)表的幾十篇論文,發(fā)現(xiàn)了大量“異常”,比如有4篇關(guān)于吃比薩的論文(其中一篇的結(jié)論是“只要有女人在,男人會(huì)吃掉更多比薩”),里面有150多處數(shù)據(jù)不一致。兩人向萬(wàn)辛克所在的院系以及負(fù)責(zé)學(xué)術(shù)規(guī)范的相關(guān)機(jī)構(gòu)發(fā)了電郵。逐漸地,郵件回復(fù)變成了“正在調(diào)查”這樣的口徑。
于是,兩人決定把疑問(wèn)公開(kāi)。2016年,布朗和幾名伙伴先發(fā)了一篇文章,名叫“數(shù)據(jù)燒心:想要消化康奈爾食品和品牌實(shí)驗(yàn)室4篇比薩論文的企圖”,文中進(jìn)行了詳細(xì)的數(shù)據(jù)分析;然后,希瑟爾斯在博客平臺(tái)Medium上發(fā)表多篇文章,提出了萬(wàn)辛克研究的問(wèn)題所在。
這吸引了大量關(guān)注,歐美主流媒體先后報(bào)道,有記者在調(diào)查后也對(duì)萬(wàn)辛克的研究提出了質(zhì)疑。2017年,在重重壓力之下,萬(wàn)辛克通過(guò)發(fā)言人誠(chéng)懇道歉,并不得不對(duì)過(guò)去幾年發(fā)表的十幾篇文章進(jìn)行修改,其中有5篇被撤稿。
如今,兩人在圈內(nèi)已經(jīng)擁有了一定的名聲,不少研究人員和科研機(jī)構(gòu)會(huì)將可疑論文發(fā)給他們進(jìn)行調(diào)查。
希瑟爾斯相信,他和布朗的舉動(dòng)代表的只是論文分析技術(shù)不斷發(fā)展的開(kāi)始,待其改良并正式化后,人人都有望掌握。他希望,將來(lái)能設(shè)計(jì)出一種可升級(jí)的在線課程,來(lái)傳播這些方法。