□文│盛艷燕
科研不端行為是指在研究和學術領域內的各種編造、作假、剽竊和其他違背科學共同體公認道德的行為,以及濫用和騙取科研資源等科研活動過程中違背社會道德的行為。[1]科研不端行為可能發生在不同科研活動中,其具體的表現形式豐富多樣,[2]現有研究歸納了多種科研不端行為,對問卷調查處理中的科研不端行為關注較少。作為一種重要的科研方法,問卷調查被廣泛應用于各種科研領域,眾多研究結論來源于問卷調查數據的支持。[3]問卷調查數據的處理過程包括問卷調查數據的獲得、整理、分析、匯報等過程,如果在問卷調查數據處理過程中發生科研不端行為,這將嚴重影響研究結論的科學性。
關于如何預防和減少問卷調查數據處理過程中的科研不端行為,研究者認為應該積極采取多種措施,包括匯報問卷調查數據的處理過程、提交原始數據進行驗證、同行評議、數據出版等,[4]而數據出版被認為是抑制科研不端行為的有效措施。[5]但是,現有研究僅僅從理論上分析了數據出版抑制科研不端行為的可能性,缺乏相應的證據支持。那么,數據出版是否能有效抑制問卷調查數據處理中的科研不端行為呢?本文提煉了問卷調查處理過程中的科研不端行為,實證檢驗了數據出版對問卷調查數據處理中的科研不端行為的影響,為推動數據出版在問卷調查中的科研不端行為治理中的應用提供證據支持。
為了確定數據出版是否影響問卷調查數據處理中的科研不端行為,首先必須明確問卷調查數據處理中科研不端行為的具體內容。由于暫未發現專門針對問卷調查數據處理中科研不端行為的問卷,所以本文遵循標準化的問卷開發程序編制了《問卷調查中科研不端行為》問卷,作為整個問卷的一部分。
由于基于問卷調查的研究者往往不需要出版數據,如果他們的科研不端行為在要求數據出版的條件下有顯著區別,說明數據出版對問卷調查中科研不端行為有顯著影響。因此,根據《問卷調查中科研不端行為》問卷對應編制了《數據出版對問卷調查中科研不端行為的影響》問卷,作為整個問卷的一部分。
為了方便調研,將個人基本情況作為第一部分,包括性別、年齡、學歷、地區、身份等。將《問卷調查中科研不端行為》問卷作為第二部分,將《數據出版對問卷調查中科研不端行為的影響》問卷作為第三部分。調研收集數據后,通過比較兩組數據是否存在顯著差異,來說明數據出版是否對問卷調查數據處理中科研不端行為有顯著影響。
按照擬定的研究思路,編制問卷首先要確定科研不端行為的內容。一般采用訪談法和內容分析法提煉題項,編制成初始問卷后采取探索性因子分析法和驗證性因子分析法確定其內容及構成,最后確定正式問卷。
先從現有文獻中歸納與問卷調查數據處理有關的科研不端行為,再選擇有多次問卷調查經驗的10名教師和10名博士研究生進行訪談并錄音。訪談的問題有:您做過問卷調查嗎,做過幾次?最近一次問卷調查是什么時候,您是如何選擇問卷調查對象的,您與調查對象是如何接觸的?獲得的調查數據符合您的預期嗎,您是怎么處理這些數據的?您從數據中得到的結論會全部匯報出來嗎,哪些匯報而哪些不匯報呢?
將訪談的內容轉化成文字,再采用內容分析法進行編碼分析。編碼分析的方法是先按詞語進行編碼,再將詞語按屬性進行分類,再按邏輯關系排列。合并意思相同的編碼后,由兩名從事過科研不端行為研究的教師對編碼內容的合理性和邏輯關系的合理性進行分析,經過反復的修改,最終得到56個編碼。
將編碼的內容按邏輯關系進行組合,再用第一人稱的行為描述語句表達出來,共獲得16個行為描述語句,形成問卷的題項。問卷編制后請10名博士研究生進行反復閱讀和修正,直到問卷題項的表述清晰明確,并將其命名為《問卷調查中的科研不端行為》。
根據16個行為描述語句,加上“假如要提交原始問卷數據”的前提,編寫問卷第三部分。例如,在問卷第二部分有一個題項是“根據我的經驗,我對問卷調查對象進行了篩選,排除了可能產生不利影響的調查對象”,對應問卷第三部分的題項是“如果要提交問卷原始數據,我會對問卷調查對象進行篩選,排除可能產生不利影響的調查對象”。
每個題項采用5點計分法。“1”表示完全不贊同,“2”表示不太贊同,“3”表示一般,“4”表示比較贊同,“5”表示完全贊同。
1.樣本與數據來源
問卷星是收集數據的主要途徑。先在問卷星上制作問卷,再從10名教師和博士生開始填寫和轉發問卷,然后利用QQ、微信等途徑尋找可能填寫或轉發問卷的人,利用滾雪球的方法不斷轉發,逐步積累數據,共獲得198份網上問卷。剔除填寫時間少于120秒、學歷為專科的問卷后,共獲得195份問卷。
樣本分布情況如下。男性97人,占總人數的49.7%,女性98人,占總人數的50.3%。年齡在30歲及以下的人有118人,占總人數的60.5%;31歲至40歲的人有53人,占總人數的27.1%;41歲及以上的人有24人,占總人數的12.3%。學歷為本科的有32人,占總人數的16.4%;學歷為碩士(含在讀博士)的有114人,占總人數的58.5%;學歷為博士的有49人,占總人數的25.1%。
2.探索性因子分析
問卷調查中科研不端行為的內容和結構可以采用探索性因子分析法來確定。數據來源于本次調研的問卷第二部分,應用SPSS20.0的主成分因子分析法進行探索性因子分析,按照因子負荷大于0.5和特征值大于1提取公因子,刪除“我用一定方法隨機生產問卷調查數據”后,結果(見表1)顯示應提取3個公因子。
按照因子包括的題項進行命名。第一個公因子包括9個題項,它們分別是“我修改了原始問卷中的部分數字”“我讓已經填寫問卷的人代替其他人填寫問卷”“我修改了軟件處理結果中的數字”“按照我平時的經驗,我代替他人填寫問卷”“我虛報問卷數量”“我對調查對象的來源作了虛假說明”“我復制了一部分已填問卷中的數字”“我沒有按匯報的方法處理數據”“根據預期結論和經驗,我填補部分問卷的空白題項”,這些題項描述的是沒有進行真實的調查、沒有對調查進行真實說明的情形,所以將其命名為“造假行為”。第二個公因子包括3個題項,它們分別是“我沒有匯報軟件處理結果中無法解釋的部分”“我只匯報軟件處理結果中對自己有利的部分”和“我用多種方法處理數據,從中選擇一種最有利于自己的方法”,這些題項描述的是對數據處理結果沒有進行完整說明,只選擇了對自己有利的部分,所以將其命名為“隱瞞行為”。第三個公因子包括4個題項,它們是“根據我的經驗,我對問卷調查對象進行了篩選,排除了可能產生不利影響的調查對象”“根據我的預期結論,我引導問卷調查對象填寫問卷”“我剔除了對預期結論產生不利影響的問卷”和“我采用一定的方法隨機制造調查數據”,這些題項描述的是對問卷調查對象和數據進行篩選,所以將其命名為“挑選行為”。

表1 問卷調查數據處理中科研不端行為的探索性因子分析
3.驗證性因子分析
驗證性因子分析用來確定因子分析結果的穩定性。應用Amos17.0進行驗證性因子分析,結果見表 2。絕對適配度指數 p(x2/df)>0.5、RMSEA<0.5,增值適配度指數 GFI>0.9、TLI>0.9、CFI>0.9,簡約適配度指數 PGFI>0.5,PNFI>0.5,表示假設模型達到適配的標準。期望跨效度指數ECVI=0.234,假設模型的ECVI值小于獨立模型和飽和模型,表示假設模型可被接受。AIC越小表示模型匹配越好并且越精煉,假設模型的AIC值小于獨立模型和飽和模型,表示假設模型匹配度比較高。綜合以上分析,問卷調查中科研不端行為的探索性因子分析結果比較穩定,問卷的信度和效度比較高。

表2 考官評分策略問卷的擬合指數
正式問卷包括3個部分。第一部分是個人基本情況,第二部分是《問卷調查中科研不端行為》問卷,包括15個題項。第三部分是《數據出版對問卷調查中科研不端行為的影響》問卷,包括15個題項。
利用SPSS的K-S對問卷第二部分和第三部分的數據進行正態分布檢驗,結果表明兩部分數據都不符合正態分布。由于每份問卷是同一個人填寫的,問卷第二部分是沒有數據出版情況下科研不端行為的表現,而問卷第三部分是有數據出版情況下科研不端行為的表現,所以兩部分問卷的兩組數據形成配對樣本。結合數據的類型和分布狀態,我們選擇配對樣本非參數檢驗的Wilcoxon檢驗,這種方法比其他方法更有效,[6]其結果可以用來說明數據出版對問卷調查數據處理中的科研不端行為是否有顯著影響。
配對樣本非參數檢驗的結果見表3。題項(B)是沒有數據出版時的情形,題項(C)是有數據出版時的情形。B>C對應的數字表示題項(B)和題項(C)對應的數據之差為正的次數,B<C對應的數字表示題項(B)和題項(C)對應的數據之差為負的次數,Sig表示題項(B)和題項(C)的差異是否顯著。如果Sig<0.05,說明兩者有顯著差異,數據出版對科研不端行為有顯著影響。
在造假行為里,數據出版對9種科研不端行為有顯著影響。例如,相比有數據出版的情形,沒有數據出版時被調查者對“我修改了原始問卷中的部分數字”的贊同程度更高,說明數據出版減少了這種科研不端行為。Sig=0.00<0.05,說明有數據出版和沒有數據出版兩種情形下,這種科研不端行為有顯著差異。所以,數據出版能顯著減少這種科研不端行為。沒有數據出版時,被調查者對其他8種科研不端行為的贊同程度高于有數據出版的情形,其配對樣本非參數檢驗Sig都小于0.05,說明數據出版能顯著減少這8種科研不端行為。
在隱瞞行為里,數據出版對3種科研不端行為有顯著影響。例如,相比有數據出版的情形,沒有數據出版時被調查者對“我沒有匯報軟件處理結果中無法解釋的部分”的贊同程度更高,說明數據出版減少了這種科研不端行為。Sig=0.001<0.05,說明有數據出版和沒有數據版兩種情形下,這種科研不端行為有顯著差異。所以,數據出版能顯著減少這種科研不端行為。沒有數據出版時,被調查者對2種科研不端行為的贊同程度高于有數據出版的情形,它們是“我只匯報軟件處理結果中對自己有利的部分”和“我用多種方法處理數據,從中選擇一種最有利于自己的方法”,其配對樣本非參數檢驗Sig都小于0.05,說明數據出版能顯著減少這2種科研不端行為。

表3 配對樣本非參數檢驗結果
在挑選行為里,數據出版對1種科研不端行為有顯著影響,對2種科研不端行為的影響不顯著。例如,相比有數據出版的情形,沒有數據出版時被調查者對“根據我的經驗,我對問卷調查對象進行了篩選,排除了可能產生不利影響的調查對象”的贊同程度更低,說明數據出版強化了這種科研不端行為。Sig=0.0026<0.05,說明有數據出版和沒有數據出版兩種情形下,這種科研不端行為有顯著差異。但“根據我的預期結論,我引導問卷調查對象填寫問卷”和“我剔除了對預期結論產生不利影響的問卷”的配對樣本檢驗Sig>0.05,說明有數據出版和沒有數據出版兩種情形下,科研不端行為沒有顯著差異。所以,數據出版顯著增加了1種科研不端行為,而對另外2種科研不端行為沒有顯著影響。
本文研究表明,數據出版能減少“造假行為”和“隱瞞行為”中的12種科研不端行為,所以積極推動數據出版的發展有利于治理科研不端行為。目前,只有少量基于問卷調查的數據庫已經出版或開放共享,大量問卷調查數據仍然分散在不同研究機構和研究者手中,僅僅從公開發表的科研成果難以發現其中的科研不端行為,所以科研不端行為的治理只能依靠學術聲譽和自身素質的自我監督。當這種自我監督無效時,數據出版為治理科研不端行為提供了新的外部監督機制。
已有研究表明,數據出版在技術上可行、實踐上已經得到應用,未來應該進一步推動數據出版的發展。[7]為了提高數據出版在科研不端行為治理中的應用價值,未來應完善數據出版制度、加大數據出版的技術研發、建立分級數據出版制度,逐步推行科研數據強制出版。[8]
本文的研究表明,數據出版對2種科研不端行為的影響不顯著,可能的原因在于“引導調查對象填寫問卷”“剔除不利于自己的問卷”的行為比較隱蔽,即使提交了原始數據,也很難被發現。因此,治理科研不端行為應在推動數據出版的同時增強科研不端行為識別技術的研發。同行評議是數據出版的前提,也被認為是預防科研不端行為的有效手段,LaCour造假事件表明,[9]同行評議并不能保證發現每個領域內的科研不端行為,所以在同行評議的基礎上應該加強對科研不端行為識別技術的研發,總結和發現科研不端行為在數據上的表現規律,為同行評議提供方向指導。
數據出版對2種比較隱蔽的科研不端行為的抑制作用不顯著,卻強化了排除調查對象的行為,說明可能還有其他因素影響科研不端行為。數據出版為科研不端行為提供了外部監督機制,但可能使科研不端行為變得更加隱蔽,即使有數據出版,也很難發現。由于需要提交原始數據,為了讓調查數據出現預期的結果,排除不利的調查對象是比較可取的,所以數據出版強化了這種行為,這種科研不端行為產生于研究者的內在動機。所以,在推動數據出版的同時,治理隱蔽的科研不端行為應從個體因素、組織因素和社會因素多方面入手。[10]
[1]中國科學院.中國科學院關于科學理念的宣言、關于加強科研行為規范建設的意見[M].北京:科學出版社,2007
[2]袁維勤.“985”高校科研不端行為的“立法”研究[J].山東科技大學學報,2011(4)
[3]風笑天.社會調查中的問卷設計[M].北京:中國人民大學出版社,2014
[4]屈寶強,王凱.數據出版視角下的科學數據同行評議[J].圖書館雜志,2017(10)
[5]汪俊.成果共享視角下科研不端行為的治理機制[J].中國科學基金,2015(5)
[6]杜強,賈麗艷.SPSS統計分析從入門到精通[M].人民郵電出版社,2009
[7]何琳,常穎聰.國內外科學數據出版研究進展[J].圖書情報工作,2014(5)
[8]傅天珍,陳妙貞.我國學術期刊數據出版政策分析及建議[J].中國出版,2014(12)
[9]《科學》雜志論文數據造假現形記[EB/OL].http://www.360doc.com/content/15/0608/23/20625683_476675720.shtml
[10]趙君,鄢苗.科研不端行為的概念特征、理論動因與影響因素[J].中國科學基金,2016(3)