摘要:科技期刊在傳承人類文明、薈萃科學發現、引領科技發展等方面發揮著積極作用。原始數據是科技研究成果的基礎和驗證依據,對于確保研究結果的可信度和可重復性至關重要。數據備案的目的是確保科技研究中所涉及的原始數據的完整性、可追溯性和可驗證性。然而,目前原始數據備案和數據共享方面存在一些問題,如數據共享不足和數據可信度難以保證等。文章通過分析原始數據備案與數據共享的背景和意義、科技期刊原始數據備案與共享工作中存在的問題,對原始數據備案的內容進行歸納與總結;提出科技期刊在原始數據備案與數據共享工作中應起到保障科學研究可信度、可重復性、透明度和開放性的作用,同時應承擔起保護作者權益的責任;重點闡述科技期刊應通過明確原始數據備案與共享的重要性,強調數據可信性和完整性;設立原始數據附錄或數據倉庫;引入數據審查專家;加強編輯和審稿人員的培訓等策略,推進原始數據備案與數據共享工作,以真正意義上推動科技創新和知識的傳播,促進科技成果的轉化和應用,為社會發展和進步作出積極貢獻。
關鍵詞:科技期刊;原始數據;數據備案;數據共享;研究成果
中圖分類號:G252 文獻標志碼:A 文章編號:1674-8883(2024)08-0243-04
課題項目:本論文為2022年度天津醫科大學腫瘤醫院天津市醫學重點學科(專科)建設項目“腫瘤學”研究成 果,項目編號:TJYXZDXK-009A
科技期刊作為學術研究的重要組成部分,具有促進科學研究和學術交流的關鍵作用,不僅是學術成果的重要發布平臺,還是評估學術質量和學者聲譽的重要依據。科技論文的發表對研究人員的職業發展和學術影響力有著重要的影響。隨著科學研究的不斷發展,原始數據在科研中的重要性日益凸顯。原始數據是科學研究的基礎,是驗證和復制研究結果的必要條件。
目前,存在著研究結果無法復制和驗證的問題,其中原始數據的缺失和不完整是重要原因之一。因此,科技期刊在原始數據備案方面承擔著重要的責任,應該鼓勵和推動原始數據的共享和備案,遵守科研活動規范,確保研究數據的真實性、實驗的可重復性[1],有助于提高科研的可信度。本文旨在探討科技期刊在原始數據備案與共享方面的作用和可采取的策略,以促進科學研究的可信度和可重復性。
(一)科學研究中原始數據的重要性
原始數據是研究過程中直接獲得的數據,包括實驗數據、觀察數據、調查數據等。其記錄了研究的真實情況,是驗證和復制研究結果的必要條件,具有不可替代性。通過原始數據,其他研究者可以重新分析、驗證和復制研究結果,從而驗證研究的可靠性和可重復性。為進一步加強和規范科學數據管理,保障科學數據安全,提高開放共享水平,更好支撐國家科技創新、經濟社會發展和國家安全,2018年國務院辦公廳發布《科學數據管理辦法》,指出原始數據是科學研究中最基本、最重要的數據形式[2]。為貫徹落實《中華人民共和國數據安全法》,2023年1月工業和信息化部、國家互聯網信息辦公室、發展改革委等十六部門發布了《關于促進數據安全產業發展的指導意見》[3],目的為保障數據持續處于有效保護、合法利用、有序流動狀態,打造提供技術、產品和服務的新興業態,推動數據安全,產業高質量發展,提高各行業各領域數據安全保障能力,加速數據要素市場培育和價值釋放,夯實數字中國建設和數字經濟發展基礎。中國科學院發布的《中國科學院期刊數據管理指南》提供了期刊數據管理的指導原則和操作指南,包括對科技研究數據備案和共享的要求和指導。以上規范的出臺說明科學研究中原始數據的重要性和不可替代性,對原始數據進行共享和備案有助于避免科學研究中的數據造假和誤導,提高科學研究的可信度。
(二)目前原始數據備案與共享存在的問題
目前,科技期刊在文章原始數據備案工作方面存在一些問題和挑戰。首先,許多作者并不重視原始數據的備案,或者缺乏對原始數據備案的意識,導致較多研究結果無法復制和驗證,影響了科學研究的可信度。其次,原始數據的備案和共享面臨著技術和隱私等方面的挑戰。備案數據的規模龐大、格式多樣,如何有效管理和維護是一個挑戰。同時,原始數據中可能包含個人隱私和商業機密等敏感信息,涉及法律和倫理問題,這就需要加強知識產權保護,對科學數據使用者和生產者的行為進行規范,才能夠體現對科學數據知識產權的尊重,采取有效的措施來保護數據的隱私性和合法性[4]。解決這些問題需要多個方面的合作和努力,共同制定和遵守相關的標準和規范,推動原始數據備案的發展,并提供相應的技術和制度支持。
科技期刊的可信度和可重復性依賴于原始數據的完整記錄和備案。原始數據備案可以確保研究結果的驗證和再現,保障科學研究的透明度和可靠性。原始數據備案需要包括數據來源、格式、質量等方面的內容,還需要考慮數據分析方法、數據引用等特定內容,以支持研究結果的驗證和再現,同時也為數據管理和后續使用提供重要的參考依據。
(一)數據描述
需要提供數據的來源,即數據是從何處獲取的;采集方式,即數據是通過何種方式收集的;時間范圍,即數據的采集時間段;地域位置,即數據采集的具體地點或范圍。
(二)數據格式
指明數據的格式,例如文本、圖像、音頻、視頻等。此外,還需要說明數據的組織結構,例如數據是否以表格形式存儲,或者是否使用數據庫進行管理。
(三)數據內容
說明數據中的變量、字段、屬性等信息。這些信息描述了數據的各個方面,如數據的測量指標、數據的分類屬性等。
(四)數據質量
說明數據的質量控制措施,如數據清洗、去重、異常值處理等。這些步驟旨在確保數據的準確性、完整性和一致性。
(五)數據許可
說明數據的使用許可和限制的范圍。在描述中,需要說明數據的使用是否需要獲得授權,以及是否存在特定的限制條件。這包括數據的開放程度、是否可以進行二次分析、是否可以進行商業用途等。
(六)數據文檔和元數據
數據文檔包括數據字典、數據說明和數據標準等。此外還可以提供其他相關的元數據,如數據質量評估和數據版本控制等信息。以上原始數據備案的內容可以根據具體情況調整和補充,以使原始數據能夠被其他研究人員理解、使用和驗證。通過備案,可以提高數據的可信度,促進科研成果的共享和交流。
(一)保障科學研究的可信度和可重復性
原始數據共享的重要性已經越來越被科研界所重視。2010年的“STAP細胞事件”涉及一篇發表在國際期刊《自然》(Nature)的研究論文,聲稱發現一種能夠通過簡單的處理方法將成體細胞轉化為干細胞的方法。然而,后續的研究發現該研究結果存在嚴重的數據造假和科學不端行為[5]。這一事件引發了廣泛的爭議和質疑,如當時的作者能夠公開原始數據,其他研究者就可以對其數據進行獨立的分析和驗證,很可能會更早地發現其中的問題。因此,通過共享原始數據,科研人員可以打造更加透明和可信的研究環境,提高研究的可信度,確保研究可重復。
科技期刊在確保研究成果的可信度和可重復性方面發揮著重要的作用,但并非唯一責任方。期刊方可以通過要求作者共享原始數據、進行數據審查和驗證、推動數據管理和標準化等措施,保障研究成果的可信度和可重復性。實際上,確保研究成果的可信度和可重復性需要整個科研系統的共同努力,包括作者、科技期刊、研究機構、政府監管部門等多方合作。作者應當遵循科學研究的倫理規范,確保實驗的可重復性和數據的準確性;科技期刊方應當嚴格審查和驗證提交的研究成果,推動數據共享和開放;研究機構和政府監管部門應當合作推出相關法規,監督和管理科研活動,確保科學研究的誠信和可信度。因此,確保研究成果的可信度和可重復性需要各方通力合作,以打造健康的科研生態環境。
(二)強化科學研究的透明度和開放性
在原始數據備案中,科技期刊方可以征詢作者的意見,是否可以將研究成果和數據公開共享,如作者同意公開共享,則可以為其他研究者提供使用和再利用的機會,能夠在現有數據的基礎上進行進一步的研究,將有助于避免重復實驗和數據收集,節約資源并加快科學研究的速度,作者本人也可以在增強自身科研能力的同時,提高自身科研數據素養[6]。科技期刊可以根據不同學科領域和研究類型,提出個性化的數據備案要求。例如,對于實驗研究,可以要求作者備案實驗設計、儀器設備參數、實驗過程等詳細信息;對于調查研究,可以要求作者備案問卷調查的設計、樣本選擇方法等。
(三)保護作者的權益
原始數據備案應該確保作者的知識產權得到尊重和保護。作者的知識產權得到充分的尊重和保護,這意味著科技期刊應尊重作者對其數據的所有權,并在數據共享過程中遵守相關的知識產權法律和規范[7]。在合理的數據共享使用機制下,通過制定數據使用協議,明dtti5znPO0OAOIk8b5ypzA==確數據使用的范圍和目的,并限制未經授權的數據使用等相關制度,確保作者的知識產權得到尊重和保護。
(一)明確原始數據備案與共享的重要性
備案原始數據的目的是保障科學研究的透明度和開放性,而原始數據共享是實現這一目標的重要手段之一。長期以來,是否公開所有數據存在爭議。多數期刊并不要求作者進行原始數據備案及共享,只有在有人質疑時才會要求共享。然而,隨著科研進展,越來越多人認識到公開數據可以再利用,并避免重復勞動。如在臨床醫學領域中,共享臨床試驗原始數據的倡議引導臨床試驗的變革,建立了臨床試驗的新價值觀和新規則[8]。
科技期刊可以通過社論、特刊、宣傳活動等方式,向作者與讀者宣傳和強調原始數據備案與共享的重要性,明確表示對共享數據的支持,并鼓勵作者在發表論文時進行備案及共享原始數據。如《自然》(Nature)出版集團等要求作者在審稿或返修階段提交原始數據,并鼓勵作者將數據提交至公共數據存儲庫[9],少數頂尖期刊要求必須提交數據,并且嚴格把控數據的質量和可用性,積極倡導作者共享數據,特別是鼓勵使用公共存儲庫。
(二)強調數據可信性和完整性
作者提交論文時,科技期刊應該對原始數據的可信性和完整性提出要求。作者應提供足夠的信息和文檔,確保原始數據的來源、采集方法、處理等可以被復制和驗證。相關內容可以是元數據和文檔,以便編輯和審稿人了解數據的背景和使用方法。同時在充分尊重和保護作者對數據、程序等原創內容的知識產權基礎上做好數據自愿公開工作[10],進行匿名化和脫敏處理等,并取得作者自愿公開數據的認可授權文件。
(三)設立原始數據附錄或數據倉庫
原始數據附錄是指在發表的研究論文中,附帶提供所使用的原始數據的詳細信息和相關文檔。科技期刊可以設立數據附錄或鏈接至數據倉庫,為作者提供一個共享原始數據的平臺。如設立或鏈接至一個在線數據庫,作者可以將原始數據上傳至其中,并在論文中引用該數據的標識符或鏈接,以便讀者訪問和驗證數據。國家人口健康科學數據倉儲(PHDA)是對國家政府性資金支持的科技活動所形成的人口健康領域相關科學數據、合作機構根據特定需求加工的相關科學數據、機構和個人產出的科學數據(如論文相關數據)進行數據資源存儲[11]。美國國家科學基金會資助建立的一個由非營利機構管理的儲存醫學、生物學、生態學數據的開放數據庫(Dryad),匯集了多種學科文章,鼓勵提交手稿的作者將研究數據提交至Dryad數據庫進行存儲并共享數據,與許多主流期刊合作,對每個文件進行必要的檢查[12]。科研數據庫備案平臺(RDD)主要用于臨床科研數據以及論文的備案,該系統可以規范地保全科研數據,大幅減少學術爭端。當作者將原始數據上傳到公共數據庫保存時,作者的名字應該永遠記錄并公開。這樣,公眾可以通過查閱數據了解這些研究者以及他們對某個科學問題和社會的貢獻。
第一,附錄部分:可以在文章的附錄部分提供原始數據。這種方式可以直接將數據與文章結合起來,讀者可以在閱讀文章時直接查看和分析數據。第二,數據附加文件:可以要求作者將原始數據作為附加文件提交。這些文件可以是數據集、電子表格、圖表或其他形式的數據文件,讀者可以通過下載和查看這些文件來獲取數據。第三,數據倉庫鏈接:數據倉庫由原來的數據庫系統進化發展而來,用于存儲、分析和報告,是面向分析的一個集成化數據環境[13],是一個獨立的在線平臺,專門用于存儲和管理科技研究數據。科技期刊方要求作者提供原始數據鏈接,讀者可以通過訪問數據倉庫獲取和使用數據。
不同期刊可以采用不同的方式設立數據附錄或數據倉庫,具體取決于期刊的要求和資源。無論采用哪種方式,旨在提供更全面、透明的科技研究數據,促進數據共享和科學研究的發展。
(四)引入數據審查專家
科技期刊可以引入數據審查專家對原始數據進行審查和驗證。這些專家可以對數據的質量、準確性和可重復性進行評估,確保數據的可信度。數據審查專家可以與編輯和審稿人合作,共同確保論文中數據的可靠性。
(五)加強編輯和審稿人員的培訓
真實性、完整性和可重復性是科學研究的基本要求,是判斷科研成果是否可靠的重要標準。科技期刊應該提供更多關于原始數據備案的培訓和指導[14],可以組織培訓課程、研討會等活動。培訓內容可以包括數據管理和驗證技術的介紹,以及如何評估和審查原始數據的準確性和可靠性。通過加強對編輯和審稿人的培訓,讓他們了解相關的數據管理和驗證技術,能夠在編輯和審閱稿件時更好地評估和驗證論文中的原始數據,增強其應對研究數據真實性、可重復性問題的能力[15],篩選出具有科學價值和方法正確的研究成果,避免發表低質量或無效的文章。
科研是一項需要廣泛合作的事業,需要各方共同努力以取得最終成果。
原始數據備案有利于促進科技研究的合作與共享,推動學術交流和創新發展;共享原始數據可以為其他研究者提供更多的資源,促進合作研究和跨學科交流。科技期刊在原始數據備案中承擔著重要責任,需要積極倡導并推進數據備案的流程。展望未來,科技期刊原始數據備案的發展方向應包括加強數據管理和存儲技術的支持,推動數據共享和開放獲取,鼓勵作者將原始數據共享,為合作研究和跨學科交流提供平臺;倡導數據的標準化和結構符合國際標準。同時,也需要應對數據備案過程中可能面臨的挑戰,如數據隱私保護、數據安全性和數據管理成本等問題,以推動科技期刊原始數據備案工作朝更加規范化、開放化和可持續的方向發展。
參考文獻:
[1] 中國科協全國學會學術出版道德公約[J].山東醫藥,2023,63(12):21.
[2] 中國政府網.國務院辦公廳印發《科學數據管理辦法》[J].中國科技財富,2018(4):5.
[3] 工業和信息化部等十六部門關于促進數據安全產業發展的指導意見(工信部聯網安[2022]182號)[J].電子政務,2023(2):F0002-F0003.
[4] 楊燕.高校教師科學數據安全行為研究[D].重慶:西南大學,2019.
[5] 楊寓涵.基于全球撤稿的科研誠信研究:現狀、實證及政策建議[D].上海:上海財經大學,2019.
[6] 田麗,李佳翼.英國科研數據共享服務的經驗與啟示:以Figshare平臺為例[J].圖書館學研究,2018(23):76-84.
[7] 陳靖壬.我國技術措施立法保護與限制的完善路徑:以《著作權法》第三次修訂為背景[J].西部學刊,2021(20):65-68.
[8] 吳泰相,卞兆祥,李幼平,等.臨床試驗原始數據透明化與共享:關于醫學研究倫理的哲學命題及其對臨床試驗的意義[J].中國循證醫學雜志,2018,18(6):538-542.
[9] 程銘,潘云濤,馬崢,等.國內外學術期刊出版數據政策研究[J].科技與出版, 2021(4):6.
[10] 關于《中國經濟學》鼓勵作者自愿公開論文原始數據及程序代碼的公告[J].中國經濟學,2023(3):371.
[11] 吳思竹,錢慶,周偉,等.面向人口健康領域科研項目數據匯交的數據倉儲設計與實現[J].數據分析與知識發現,2020,4(12):1-13.
[12] 林芳芳,趙輝.美國Dryad數據庫共享政策及啟示[J].中國科技資源導刊,2015,47(6):48-52,94.
[13] 吳露,龍翔凌.基于數據倉庫的公立醫院預算管理審計體系構建及相關問題探討[J].醫院管理論壇,2023,40(7):26-29,58.
[14] 劉曉蔚.探究傳媒的公信力與傳媒人的數據意識[J].傳媒論壇,2020,3(13):35-36.
[15] 陳序文,姚長青,雷雪.學術出版視角下科研成果可重復性保障機制研究[J].中國科技期刊研究,2023,34(11):1451-1457.
作者簡介 邢穎,編輯,研究方向:醫學編輯實務與編輯學理論。 范娟,編輯,研究方向:醫學編輯實務與編輯學理論。 劉惠琴,編審,研究方向:醫學編輯實務與編輯學理論。