科技論文非學術不端復制比升高情況分析

2022-05-05 00:02:44萬茹張明麗徐聃旻

學會 2022年4期

萬茹張明麗徐聃旻

[摘要]科技論文是否存在學術不端直接影響稿件的取舍，而查重復制比高在有些情況下并非學術不端，如科技期刊規范的固定格式導致論文修改后的復制比升高;期刊延時出刊導致的復制比升高;數據庫收錄時間導致的復制比升高;數據庫檢測問題導致的復制比升高;作者本人學位論文、基金項目同一系列論文的檢測導致的復制比升高等。由此，不能僅以復制比高等同于學術不端而否定科研成果。該文結合《臨床麻醉學雜志》出刊過程中出現復制比高的幾種情況，為編輯部取舍稿件提供借鑒。

[關鍵詞]論文復制比學術不端查重數據庫

[中圖分類號]G2375[文獻標識碼]A[文章編號]10019596（2022）040061-04

伴隨著學術界的發展與繁榮，我國學術論文發表數量已居世界前列。近年來國內外期刊因發現論文學術不端而撤稿的事件越來越多，期刊從業人員應引起高度重視。一稿多投、抄襲剽竊、重復發表、偽造數據等學術不端相關事件屢禁不絕，不僅違反學術規范、浪費資源、造成不正當競爭，而且有礙科技進步及社會發展。由于不同編輯部的要求和編輯人員的水平存在差異，有的稿件經學術不端檢測系統發現復制比超過編輯部規定的上限便被定義為“抄襲”，予以退稿。此做法存在不妥，查重復制比高雖有學術不端嫌疑，但在有些情況下并非如此，需要進一步分析復制比高的原因，并對復制比高是否屬于學術不端加以判斷。本文結合《臨床麻醉學雜志》（以下簡稱本刊），探討查重時復制比高而非學術不端的幾種情況，為編輯部取舍稿件提供參考。

一、常見復制比升高的原因

（一）科技期刊規范的固定格式

科技論文追求的是全期的規范一致，要求使用專業性術語、固定格式，尤其是臨床醫學類論文，多有明確的書寫格式。例如隨機對照，臨床研究就有常見的consort規范，其專門為醫學研究報告的書寫提供格式、用語參考[1]。《臨床麻醉學雜志》對論文的書寫就有著明確的規定。趙秋民提出在論文復制比>40%的時候，有可能出現格式性語言的重復，實驗方法和操作步驟的重復，疾病的病理生理機制、治療方案、結果判定標準的重復，統計學處理描述的重復四種情況[2]，本刊與其所述情況基本一致。《臨床麻醉學雜志》刊登的論文從摘要開始就有明確規定，摘要分為目的、方法、結果和結論四部分，方法中的第一句必須交代患者性別、年齡、BMI和ASA分級，隨后交代分組，結果與正文表述格式也需一致。在正文的資料與方法部分，一般資料的第一句格式為“本研究經醫院倫理委員會批準，患者或家屬簽署知情同意書”，此句在查重時幾乎都會被標記為重復。論文涉及的數據需要進行統計分析，而統計分析的文字表述，本刊也基本統一：“統計分析采用SPSS 250統計學軟件進行數據分析。正態分布的計量資料以均數±標準差（x±s）表示，組間比較采用獨立樣本t檢驗，組內比較采用重復測量的方差分析。計數資料以例（%）表示，組間比較采用χ2檢驗。P<005為差異有統計學意義”[3]，此段表述在涉及數據統計的論文中也幾乎都被標記為重復，從而提高了復制比。在本刊描述全身麻醉用藥時，對藥物使用的表述也經常與其他文章重復，但藥物的使用和劑量卻是麻醉方法中必須交代的內容。在本刊實驗研究中，動物實驗模型的表述同樣出現重復，例如反映小鼠的認知功能常會使用水迷宮實驗，該實驗方法的表述內容基本一致。醫學類專有名詞及其中英文名稱、定義的表述格式也有明確規定，例如“全膝關節置換術（total knee arthroplasty，TKA）”，將由以上種種重復引起的復制比增高歸為學術不端儼然不妥。XUEHUI學會2022年第4期2022年第4期科技論文非學術不端復制比升高情況分析XUEHUI

（二）期刊延時出版

期刊都應該按期準時出刊，有些期刊受諸多因素的影響，可能出現延時出刊，短期內問題不會顯現，但隨著時間的推移，按時出刊的期刊反而出現了抄襲的嫌疑。例如，他刊7月才出版本應2月刊出的期刊，而本刊4月刊出的同類論文，同年12月檢測結果卻是本刊刊出論文的復制比較高，復制了本應2月出刊卻延時至7月出刊的他刊論文，這種情況與不同期刊的收稿日期及出刊流程有關，這種復制比升高并非一定是本刊作者復制。雖然這種情況本刊并不多見，但仍存在一定的發生概率。

（三）數據庫收錄時間

與延時出刊引起的復制比升高相似，論文被數據庫收錄時間亦有可能引起非學術不端復制比升高的情況[4]。一篇已刊出的論文從刊出到數據庫收錄存在時間差，先投稿先刊出的論文由于納入時間較晚，查重時變成與后投稿、后刊出、卻先被數據庫收錄的論文重復，這種情況不應視為學術不端。

《臨床麻醉學雜志》一般在論文出刊前會進行多次查重。首先在作者投稿時，投稿系統會進行初步查重，使用的是萬方查重系統，之后作者每次修回稿件都可查重，其中較為重要的一次是在電子稿件排版為紙質稿時，使用中國知網科技期刊學術不端文獻檢測系統（AMLC）編輯部入口系統進行查重。以《臨床麻醉學雜志》2021年5期第一篇論文為例[5]，此文收稿時間為2020年5月，在2021年3月使用AMLC進行了一次查重，對查重結果進行分析，查重報告單中一共列出25條有重復文字的文獻，根據報告中列出重復文獻的時間（應該是論文的出刊時間），其中晚于本文收稿時間（2020年5月）的有15篇之多，僅重復文獻時間在2021年2月的就有5篇，但這15篇未必存在抄襲現象。其中2篇是本刊2020年10期稿件[6]和2021年1期稿件[7]，由于本刊出刊周期在10個月左右，數據庫列出的時間為出刊時間，其真正收稿日期均早于2020年5月，而2021年2月的5篇論文則難以確定其收稿日期是否在2020年5月之前。這15篇論文的重復文字均算作查重結果中的復制文字，導致復制比升高。

進一步分析發現，數據庫查重的文獻來源時間節點是進行查重這一操作的時間，而并不會區分作者的投稿時間，不同期刊查重時機、發表周期不同，因此每篇論文情況不同，難以一概而論，這就需要編輯進一步進行鑒別，區分內容，做出判定。

（四）數據庫檢測問題

隨著數據庫檢測技術的提高，越來越多的內容復制，甚至是隱性復制可以被檢測[8]。數據庫在檢測時，會將非正文內容作為正文內容計算復制比。摘要是否被當作正文會影響復制比，而由于論文文件格式、論文內容中小標題格式不同等原因，數據庫有時無法準確識別摘要與正文，大量的英文摘要文字會被當作重復字符導致復制比升高;而摘要字數過多時，也會被計入總字數，導致復制比的分母變大，從而降低復制比。本刊在檢測論文時甚至發現有些論文中的英文作者單位被標記為重復，造成了復制比升高[9]。

除了摘要，最常見的是參考文獻被當作正文內容計算復制比，導致復制比升高。謝文亮等指出，文后參考文獻被誤檢為正文[10]，這種復制比升高情況可以通過調整參考文獻標題避免。本刊一篇論文查重時復制比很高，深入分析原因后發現“參考文獻”小標題后被增加了幾個隱藏字符，參考文獻被當作正文計算復制比，將隱藏字符刪除再次查重，結果恢復正常。

2022年3月，本刊隨機選擇2021上半年4期含摘要的論文進行再次查重，發現61篇論文中有7篇論文復制比升高，其中6篇復制比升高范圍小于5%，且總復制比均小于15%;另1篇復制比升高66%，分析原因為文章結束后該頁空白處本刊對其進行了補白，增加了《臨床麻醉學雜志》中英文摘要撰寫規范，這部分內容重復率為49%且不屬于自引內容，故升高了復制比。

對本刊2021年5期的所有論文進行查重結果分析時發現，結果中被認為是正文的部分為黑色，而非正文部分則被系統自動識別為灰色。大部分論文結果中參考文獻顯示為灰色，并沒有納入正文部分，這是檢測時系統自動識別的結果。然而，系統對摘要、文題、作者和通信作者等信息有時能夠識別，有時卻無法識別，具體原因可能與文字格式等有關。系統是否能識別文章結構性內容的問題相信在以后數據庫檢測技術不斷提高時會越來越完善，而編輯部也需要關注此類問題，遇到復制比高的論文需要進一步分析原因，以便于更準確地判定是否屬于學術不端。

二、精準規范復制比檢測范圍

（一）完善數據庫

當前國內常用的有知網的AMLC、萬方論文相似性檢測系統（PSDS）、PaperPass論文通行證、維普通達論文檢測系統（VTTMS）等[11]，科技期刊的學術不端檢測常用AMLC或者PSDS，VTTMS收錄更多的是書籍。不同的數據庫檢測系統只能檢測自身納入的文獻內容，而很多期刊與數據庫簽署了獨家發布，導致其他數據庫并未納入這些文獻。例如中華系列的文獻多與萬方簽署獨家發布，數據庫并未納入全部文獻，導致有些論文查重時復制內容未被檢測，復制比降低，此為數據庫檢測時存在的問題。盡量規范統一使用權威數據庫尤為重要，可以避免因使用不同數據庫查重而出現的復制比結果不同，導致影響編輯部對稿件的取舍和對作者學術誠信的判斷。

（二）納入復制比檢測的范圍

目前各檢測平臺中論文復制比檢測的納入范圍主要包括連續重復字數的檢測、格式與段落一致性的檢測、章節變換的檢測等。科技期刊固有的撰寫格式及科學概念的定義均不應列入計算復制比，作者第一次投稿時往往未按照期刊稿約格式內容寫作，在修改時被要求按照期刊稿約修改，很多原本自由寫作的內容被格式化，以及針對實驗模型的補充、科學概念定義的補充等均導致復制比升高，而此時的復制比升高并非學術不端。此外，由于平臺對參考物收錄的限制，大多數書籍提取內容未被納入復制比檢測范圍。所以，完善平臺各類參考物的收錄及對科技期刊固有模式和科學概念的有效識別，并將其精準納入復制比的檢測范圍，更能區分論文是否真正存在學術不端。

三、結束語

本文結合《臨床麻醉學雜志》，總結了幾種復制比雖高而非學術不端的情況，說明期刊編輯不能僅依據學術不端檢測系統的結果偏高便認定論文存在學術不端，而是應該仔細分析復制比高的原因，并排除上述情況后再進行判斷。但有關隱性學術不端、跨語種檢測等技術難題，目前尚未找到較好的解決方法，未來如何更加精準把控，杜絕學術不端，有待進一步的深入探討。

隨著各平臺學術不端檢測功能的不斷完善、數據庫更新周期的不斷縮短、編輯對高復制比內容的對比判斷能力不斷增強，人機結合愈發緊密，可以最大化地檢測出真正的學術不端。編輯部可以多次、動態地檢測論文復制比，并采取優先出版等方式，及時發布科研成果，縮短論文從投稿到發表的周期。同時，有關部門應加大論文學術規范宣傳力度和針對學術不端的打擊力度，從根本上減少學術不端行為，為中國科技論文營造良好的外部環境。

參考文獻

[1]陳玨璇，段玉婷，卞兆祥，等.更好地報告干預措施：描述干預措施的模板和報告規范[J].中國循證醫學雜志，2020，20（12）：81-90.

[2]趙秋民.正確處理文字復制比為0和>40%的論文[J].編輯學報，2014，26（2）：159-161.

[3]解鳳磊，高芳，王峰，等.SaCo可視喉罩聯合支氣管封堵器在微創胸腔鏡手術患者中的應用[J].臨床麻醉學雜志，37（5）：502-505.

[4]丁明剛.“引用日期”在文字復制比檢測中的作用探討[J].中國科技期刊研究，2016，27（3）：254-258.

[5]喬遷，康芳，黃祥，等.右美托咪定復合羅哌卡因胸椎旁神經阻滯對胸腹腔鏡聯合食管癌根治術術后恢復質量的影響[J].臨床麻醉學雜志，2021，37（5）：453-457.

[6]王麗，袁夢琦，西志夢，等.超聲引導下腹股溝韌帶上髂筋膜阻滯對老年患者股骨轉子間骨折閉合復位預后的影響[J].臨床麻醉學雜志，2020，36（10）：966-970.

[7]程傳喜，劉怡菲，舒愛華，等.羅哌卡因復合倍他米松胸腰筋膜平面阻滯在腰椎手術后靜脈鎮痛中的效果[J].臨床麻醉學雜志，37（1）：18-22.

[8]陸宜新.學術不端檢測中的隱性重復現象分析[J].中國科技期刊研究，2015，26（6）：552-555.

[9]高玉潔，陳利海，蔣衛清，等.不同濃度羅哌卡因收肌管阻滯對全膝關節置換術后鎮痛效果及股四頭肌肌力的影響[J].臨床麻醉學雜志，2020，36（11）：1055-1058.

[10]謝文亮，李俊吉，張宜軍.期刊學術不端文獻檢測系統誤檢分析[J].中國科技期刊研究，2013，24（6）：1126-1129.

[11]王福軍，冷懷明，譚秀榮.AMLC與PSDS檢測結果的比較研究[J].中國科技期刊研究，2014，25（9）：1154-1156.