康宏宇 錢 慶 李 姣 王 青 孫月萍 孫良龍 侯 麗
(中國醫(yī)學科學院/北京協(xié)和醫(yī)學院醫(yī)學信息研究所 北京 100020)
隨著開放獲取、開放研究、開放數(shù)據(jù)、開放創(chuàng)新不斷發(fā)展,重要科技大國陸續(xù)推出國家開放科技政策,以預印本交流為代表的新型學術(shù)交流模式正不斷沖擊傳統(tǒng)學術(shù)出版模式。預印本(Preprint)是指科研工作者的研究成果尚未正式在學術(shù)期刊上發(fā)表,出于和同行交流的目的,自愿先在學術(shù)會議上或通過互聯(lián)網(wǎng)發(fā)布的科研論文、科技報告等[1]。基于開放獲取和開放透明評議的預印本交流不僅可以快速、廣泛地傳播研究成果,避免正式出版中論文發(fā)表時滯問題,幫助科研人員確立個人科研成果首發(fā)權(quán),還可以讓作者提前了解讀者評論,有效提高論文質(zhì)量和交流效果,同時對于提升研究主體學術(shù)聲譽,爭取國家在領域內(nèi)科技學術(shù)話語權(quán)具有重要意義。
近些年在開放獲取、開放科研等大潮影響下,借助計算機網(wǎng)絡技術(shù)迅猛發(fā)展,預印本和基于預印本平臺的學術(shù)交流得到科學界高度關注[2]。美國物理學家保羅·金斯帕(Paul Ginsprarg)創(chuàng)立的首個預印本數(shù)據(jù)庫arXiv發(fā)展至今已成為典范。面向不同學科領域的預印本平臺不斷推出,包括生物科學領域的bioRxiv、農(nóng)業(yè)領域的AgrXiv、化學領域的ChemRxiv、心理學領域的PsyArXiv以及圖書情報學領域的e-LIS等。2016年由中國科學院國家科學圖書館建設的中國科學院科技論文預發(fā)布平臺ChinaXiv上線運營,旨在鼓勵我國科研人員將科研成果第一時間發(fā)布在國內(nèi)預印本平臺上。2020年初新型冠狀病毒肺炎(COVID-19)爆發(fā)期間,各大預印本系統(tǒng)發(fā)揮重要作用,對有關流行病學、臨床實驗、傳播趨勢、治療方案和臨床結(jié)局等方面的科研成果進行及時、快速的發(fā)布和報道。本文對包括arXiv、bioRxiv、ChinaXiv在內(nèi)的國內(nèi)外知名預印本系統(tǒng)進行詳細介紹,從其系統(tǒng)功能、投審稿機制、政策聲明、合作模式等方面進行對比分析和進一步思考。
1991年8月美國物理學家保羅·金斯帕在美國洛斯阿拉莫斯國家實驗室創(chuàng)立arXiv,現(xiàn)由康奈爾大學運營維護。最初arXiv僅面向物理領域公開征稿,隨著開放獲取發(fā)展,已經(jīng)擴展到物理、數(shù)學、計算機科學、定量生物學、定量金融學、統(tǒng)計學、電氣工程和系統(tǒng)科學、經(jīng)濟學8個學科領域[3]。截至2020年5月27日arXiv共收錄學術(shù)論文1 706 814篇。在新型冠狀病毒肺炎爆發(fā)期間,arXiv平臺以其涵蓋的計算機、物理學、統(tǒng)計學等領域為起點,快速發(fā)表與COVID-19相關的疫情傳播、流行病管理、趨勢預測、干預成效等研究內(nèi)容,借助人工智能、深度學習、數(shù)據(jù)建模等方法助力疫情防控。
2.2.1 在線提交[4]論文提交過程中,除需要填寫論文基本信息外,作者可以(La)TeX、AMS(La)TeX、PDFLaTeX、PDF以及帶有JPEG/PNG/GIF圖像的HTML等多種格式對科研成果進行上傳和提交。需注意系統(tǒng)不接受除a-z A-Z 0-9 _ + -., =字符外的其他字符出現(xiàn)在文件名中,文件名之間需要區(qū)分大小寫。為達到科研成果快速交流的目的,arXiv允許作者更新論文內(nèi)容,但更新版本時需明確指出新版本在哪些地方進行完善和更新,如添加參考文獻、更改錯別字或修改某節(jié)內(nèi)容的論點。作者可以撤銷未發(fā)布的論文,但已在系統(tǒng)發(fā)布的論文不可撤回。
2.2.2 閱讀瀏覽 用戶可以按照學科分類瀏覽系統(tǒng)發(fā)布的論文,也可按照提交時間(近1日、近5日、近1月、指定之間范圍提交)進行篩選瀏覽。同時arXiv論文瀏覽頁面提供該篇論文作者、摘要、引用格式、提交及修訂記錄;如果論文內(nèi)容是對前期研究的改進但內(nèi)容變化較大、需要作為單獨論文出現(xiàn)時,瀏覽頁面提供前期研究論文arXiv ID,便于用戶進行追蹤性閱讀。
2.2.3 檢索下載 arXiv允許用戶對論文進行多角度檢索,方便用戶快速、準確找到感興趣的論文,具體包括題名,作者(姓名、ORCID),摘要,評論,DOI,arXiv ID,期刊信息,美國計算機協(xié)會(Association for Computing Machinery,ACM)知識點分類,數(shù)學文獻分類法(Mathematics Subject Classification,MSC),全文,發(fā)表時間等多種類型的檢索。PDF是arXiv論文下載的主要格式,根據(jù)每篇文章提交內(nèi)容和格式不同,網(wǎng)站也提供PostScript、HTML、源文件等其他格式下載鏈接。
隨著預印本提交數(shù)量增多,arXiv論文審核機制從先期“自動提交,文責自負”逐漸轉(zhuǎn)變成“推薦提交、審核發(fā)表”并引入審核認可雙重機制,即先認可作者后審核論文,要求不活躍的研究者在提交預印本時得到該領域活躍研究者的認可[5]。雙重審核機制于2004年1月建立并實施至今,保證論文內(nèi)容基本質(zhì)量。
根據(jù)預印本系統(tǒng)定義及功能,論文在arXiv上發(fā)布后,作者本人仍然獨立擁有論文版權(quán),可根據(jù)其共享意愿授權(quán)論文發(fā)布后的共享范圍,具體是指知識共享許可協(xié)議(Creative Commons License,CC協(xié)議)中的多項條款,目前arXiv支持的共享范圍包括CC BY 4.0、CC BY-SA 4.0、CC BY-NC-SA 4.0 3類。另外為順應開放共享大環(huán)境,arXiv鼓勵作者以知識共享公共領域貢獻協(xié)議(Creative Commons Public Domain Dedication,CC0 1.0)的形式對論文元數(shù)據(jù)進行公開和發(fā)布。作者需要授權(quán)arXiv以非排他性且不可撤銷的許可進行論文分發(fā)與共享。已經(jīng)提交至預印本系統(tǒng)的論文可以在期刊繼續(xù)發(fā)表和轉(zhuǎn)讓給第3方,已提交到系統(tǒng)的論文一經(jīng)發(fā)布不可撤銷。
目前arXiv由康奈爾大學負責維護與管理,由康奈爾大學圖書館和美國國家科學基金會中的西蒙斯基金會共同提供經(jīng)費支持,其中康奈爾大學圖書館提供其預算的37%。為了arXiv 的穩(wěn)定性和持續(xù)發(fā)展,康奈爾大學圖書館制定一個多方籌措經(jīng)費的可持續(xù)發(fā)展規(guī)劃。2010年起arXiv在各學術(shù)機構(gòu)、研究中心和政府圖書館中實行會員制,根據(jù)近3年平均下載文章數(shù)排名收取會員費用。2010 年共有11個國家的123家機構(gòu)成為會員,獲得36萬美元收入, 2020年這項收入預計有55萬美元。
3.1.1 bioRxiv 目前生物醫(yī)學領域各項技術(shù)發(fā)展迅速、成果顯著,每年科研產(chǎn)出在所有學科領域中發(fā)文比例最高。2013年11月美國非營利性研究和教育機構(gòu)冷泉港實驗室借鑒arXiv預印本系統(tǒng)的建設經(jīng)驗,推出專門面向生物學領域的預印本平臺bioRxiv[6],旨在促進生物學領域科研成果快速交流與共享。涉及學科包括動物行為與認知、微生物學、生物化學、分子生物學、病理學等在內(nèi)的25個一級學科。截至2020年5月27日共發(fā)布83 701篇論文。為確保發(fā)布論文的科學性和專業(yè)性,bioRxiv邀請近140名領域科學家對提交的論文進行審稿。
3.1.2 medRxiv bioRxiv 只針對生命科學領域,不涉及醫(yī)藥領域。因此臨床實驗和其他與醫(yī)學相關的研究無法發(fā)表預印本[7]。2019年6月由美國冷泉港實驗室、耶魯大學和《英國醫(yī)學雜志》(BritishMedicalJournal,BMJ)共同創(chuàng)立medRxiv,面向全國醫(yī)學、臨床、健康相關領域的科學人員公開征稿。其中冷泉港實驗室負責全面經(jīng)營和維護medRxiv平臺及預印本服務器;BMJ憑借其在臨床研究發(fā)表和論文審查方面的長期經(jīng)驗,對醫(yī)學領域科研成果出版過程中的開放獲取出版、數(shù)據(jù)共享、倫理道德、利益沖突等進行研究;耶魯大學Harlan Krumholz和Joseph Ross則作為臨床研究人員給予預印本服務極大的支持。medRxiv涉及急診醫(yī)學、心血管醫(yī)學、腫瘤科學、老年醫(yī)學、衛(wèi)生經(jīng)濟學、衛(wèi)生政策研究、醫(yī)學教育、醫(yī)學倫理學、健康信息學等51個醫(yī)學相關的學科分類。從2019年6月發(fā)布第1篇論文至2020年5月27日的1年時間內(nèi),medRxiv共收錄1 811篇醫(yī)學領域論文,平均每月收錄并發(fā)布180篇論文;在新型冠狀病毒肺炎爆發(fā)期間,medRxiv收錄與COVID-19相關論文共3 448篇,可見medRxiv的出現(xiàn)及時為醫(yī)學領域科研論文的快速交流與傳播提供服務保障與支撐,為應對公共衛(wèi)生領域突發(fā)事件提供學術(shù)交流平臺。
3.2.1 投稿 由于生物學及醫(yī)學領域科學研究的特殊性,系統(tǒng)只接受相應學科領域中的研究性論文、系統(tǒng)評價及分析、臨床實驗方案/計算方法及數(shù)據(jù)類文章,不接受病例報告、敘述性評論、社論、信函、片斷性觀點/缺少實驗論證的假設、實驗室章程、學位論文和教科書摘錄等類型的文章[8]。當投稿論文涉及臨床試驗或前瞻性研究時,作者需要先在clinicaltrials.gov完成注冊,在論文中提供該中心的注冊編號,或說明所在國家/地區(qū)/機構(gòu)的倫理委員會的道德標準,提供該委員會的標準文件。提交稿件時,文本文件需為Word、WordPerfect或PDF格式, TeX文件(包括LaTeX)需要轉(zhuǎn)換成PDF格式才可提交,圖片和表格支持GIF/TIFF/EPS/JPEG格式的提交。
3.2.2 檢索瀏覽 系統(tǒng)主頁設計以簡約為主,主頁檢索僅支持單一輸入檢索,不支持作者、關鍵詞、DOI等分類檢索,分類檢索功能集成在高級檢索功能中。用戶可以在以下范圍進行限定檢索:時間范圍、學科分類、文章類型;作者、題目、摘要、全文;DOI;時間順序排序/相關度排序。高級檢索功能支持用戶在bioRxiv和medRxiv之間相互檢索,為用戶獲取領域內(nèi)的知識服務提供便利。
3.2.3 下載 論文一經(jīng)接受就以PDF格式進行發(fā)布并供用戶下載,同時技術(shù)部門會進行PDF到HTML和XML的格式轉(zhuǎn)換,PDF發(fā)布兩天內(nèi)會顯示全文的HTML和XML格式,為更廣泛的文獻挖掘奠定基礎。
bioRxiv和medRxiv都采取免費發(fā)表方式, 但開放程度與arXiv有所不同。bioRxiv和medRxiv為用戶提供CC BY、CC BY-NC、CC BY-ND、CC BY-NC-ND、CC0或不重用等多種知識共享許可方式。在隱私政策方面二者共同遵守冷泉港實驗室隱私政策[9],對個人身份數(shù)據(jù)、匯總信息、網(wǎng)站Cookies信息等的收集和使用進行詳細說明。
目前bioRxiv與medRxiv與多家期刊合作,形成"B2J(bioRxiv to journal)"[10]和"M2J(medRxiv to journal)"[11]合作模式,預印本發(fā)表后直接推薦到期刊接收同行評議,極大減輕作者在預印本發(fā)表后仍需尋找合適期刊并再次進行論文投稿的工作量,進一步推動科研成果的快速交流和傳播。其中bioRxiv擁有包括《臨床科學》(ClinicalScience)、《歐洲分子生物學組織雜志》(TheEMBOJournal)、《微生物學》(Microbiology)、《科學》(Science)在內(nèi)的近180種合作期刊;medRxiv的合作期刊包括《英國醫(yī)學雜志(開放獲取版)》(BMJOpen)、《公共科學圖書館·醫(yī)學》(PLOSMedicine)、《醫(yī)學互聯(lián)網(wǎng)研究雜志》(JournalofMedicalInternetResearch)、《細胞、組織、器官》(CellsTissuesOrgans) 等30種。另外bioRxiv于2017年獲得陳扎克伯格基金會(Chan Zuckerberg Initiative, CZI)的資助,保障平臺長期穩(wěn)定發(fā)展。
ChinaXiv(http://chinaxiv.org)于2016年6月正式上線提供服務,平臺由中國科學院國家科學圖書館維護和運營,是一個面向科研人員、規(guī)范的自然科學領域的中國科研論文開放倉儲庫,接收中英文科學論文預印本存繳和已發(fā)表科學論文開放存檔[12]。截至2020年3月14日平臺接收論文13 501篇,涵蓋物理學、生物學、地理科學、天文學、計算機科學、能源科學、材料科學等29個學科領域。
系統(tǒng)建設方面,ChinaXiv支持PDF/WORD/ WPS Office/ Latex等多種論文提交格式,音頻、視頻文件可以rar、zip壓縮包形式上傳。提交到系統(tǒng)的論文會通過自動檢查和關聯(lián)匹配輔助論文管理人員進行審查管理,確保論文質(zhì)量。論文提交過程中,作者可在CC BY 4.0、CC BY-SA 4.0、CC BY-NC-SA 4.0、CC0 1.0中選擇一種許可協(xié)議,使ChinaXiv有相應的權(quán)限對論文進行分發(fā)和共享。另外ChinaXiv鼓勵作者在提交論文手稿同時提交“論文責任者(論文作者)研究身份識別材料”,有利于平臺快速識別作者研究身份,進而及時公開論文手稿。ChinaXiv為用戶提供最新提交、熱門論文、學科分類等多維度論文瀏覽,便于用戶快速追蹤到關注的主題和文章。系統(tǒng)可根據(jù)用戶關注的學科分類、主題詞等提供個性化的定制推送服務。
目前ChinaXiv已與《中國科學院院刊》、《金屬學報》、《生態(tài)學報》、《工程熱物理學報》、《中國生物工程雜志》等22家期刊合作,建立優(yōu)秀稿件的雙向推送機制[13],合作期刊可從ChinaXiv遴選優(yōu)質(zhì)論文稿源,向論文提交者推薦其論文合適發(fā)表的期刊。同時在征得作者同意情況下,合作期刊可將優(yōu)質(zhì)論文預印本推送提交到ChinaXiv平臺。ChinaXiv與中國科學院心理研究所、中國生物工程學會、中國科學院武漢巖土力學研究所、北京大學中國語言學研究中心4家單位分別合作共建4個預印本子庫,拓展國內(nèi)預印本交流學術(shù)領域,分別是中國心理學預印本平臺PsyChinaXiv、中國生物工程預印本出版平臺、ChinaXiv巖土力學預印本平臺和中國語音樂律預印本平臺。
預印本系統(tǒng)相比于傳統(tǒng)期刊評審速度快、發(fā)表周期短,且作者能夠第一時間將學術(shù)成果與領域?qū)W者進行分享并快速得到反饋,大大縮短科學成果交流周期。這些優(yōu)勢使得預印本系統(tǒng)能夠快速發(fā)展,在科研人員中的影響力也逐漸提升,在提高學術(shù)交流時效性的同時促使科學研究模式向著開放科學和開放學術(shù)交流體系不斷發(fā)展。雖然各大預印本系統(tǒng)所面向的學科領域不同,但近些年都根據(jù)發(fā)展需要對系統(tǒng)可接受的學科分類進行擴展或建設分領域預印本子平臺,形成成熟的論文審核機制。預印本系統(tǒng)建立目的是向科研人員提供快速交流研究成果的渠道,使用開放著作權(quán)許可協(xié)議有助于加速這種交流[14]。目前國內(nèi)外預印本系統(tǒng)均使用知識共享許可協(xié)議,除共通的CC BY 4.0(署名)共享方式外,不同預印本系統(tǒng)為作者提供不同限定的開放協(xié)議,使開放程度略有差異,如arXiv和ChinaXiv支持CC BY-SA 4.0(署名-相同方式共享),而bioRxiv和medRxiv支持CC BY-NC署名-非商業(yè)性使用)和CC BY-ND(署名-禁止演繹)。對現(xiàn)有國內(nèi)外預印本系統(tǒng)在功能、學科領域、投審稿機制、政策等方面進行對比,見表1。

表1 國內(nèi)外預印本系統(tǒng)對比
預印本服務在本質(zhì)上鼓勵科研人員公平競爭,近年來其發(fā)展迅速且穩(wěn)定,已經(jīng)成為科技領域重要的資料來源之一,影響力不亞于領域內(nèi)任何一種重要期刊[15]。以arXiv為代表的預印本系統(tǒng)通過可持續(xù)發(fā)展模式,不斷探索,為預印本服務發(fā)展奠定基礎;之后以bioRxiv、medRxiv為代表的領域預印本系統(tǒng)相繼推出,為不同學科科研成果的精準交流提供支撐。與此同時,大型出版機構(gòu)及學協(xié)會對預印本投稿都采取積極政策,科研人員將科研成果在預印本平臺發(fā)布后無需顧慮是否可以再次在期刊上刊登,更有《公共科學圖書館·醫(yī)學》等期刊與預印本系統(tǒng)形成固定合作機制,為預印本刊登提供捷徑。鑒于此本文就預印本服務未來發(fā)展進行思考與展望。
近年來預印本服務憑借其發(fā)布速度快、便于學術(shù)交流、及時獲得反饋意見等優(yōu)勢迅速發(fā)展,也在一定范圍內(nèi)獲得不同學科領域科研人員的認可。預印本服務在為學術(shù)研究成果向全球科學界傳播提供重要渠道的同時,還為科研人員確立科研成果首發(fā)權(quán)。在開放科研大背景下,以學界自治為基礎的預印本學術(shù)交流模式正在改變傳統(tǒng)以期刊為主體的單一學術(shù)交流模式[2],成為全周期公開透明科研模式中重要的一種。
新型冠狀病毒肺炎的全球大流行,bioRxiv、medRxiv發(fā)揮了重要作用。此前我國一直缺乏面向生物醫(yī)學領域的預印本服務平臺。2020年1月科技部發(fā)布《科技部辦公廳關于加強新型冠狀病毒肺炎科技攻關項目管理有關事項的通知》,指出為確保高效率、高質(zhì)量完成新型冠狀病毒肺炎防控科技攻關任務,各項目承擔單位及其科研人員要堅持國家利益和人民利益至上,把論文“寫在祖國大地上”。由此可見,此次疫情的暴發(fā)更加突顯出建立我國生物醫(yī)學領域預印本倉儲平臺的緊迫性與必要性,讓最新的科研成果第一時間發(fā)布在國內(nèi)學術(shù)交流平臺上,加速研究成果本土傳播。同時也對預印本服務平臺提出更高要求,面對疫情快速發(fā)展必須做到快速響應,同時保證穩(wěn)定服務和嚴格質(zhì)控,確保論文科學性、合理性和正確性。
我國開放獲取的多項技術(shù)與服務正處于發(fā)展階段,預印本服務正是其中的一項公益性、基礎性、長期性的事業(yè),需要社會各界共同支持和參與。借鑒國際預印本服務發(fā)展經(jīng)驗,政策先行可以充分引導預印本服務發(fā)展方向并提高其認可度。在我國若能獲得各部委及各級研究機構(gòu)自上而下的政策支持,包括科研項目管理辦法等對預印本的采納,可以極大提高科研人員對預印本服務的認知度,進而營造更加自由、開放、和諧和國際化的學術(shù)交流環(huán)境。加強與領域?qū)W會、出版機構(gòu)、雜志社的合作,形成穩(wěn)定合作模式,為預印本正式發(fā)表提供捷徑。作為預印本系統(tǒng)主要服務對象,科研人員是其最大服務群體也是最大受益者,只有充分提高科研人員對預印本服務的認知度和認可度,才能保證預印本系統(tǒng)長期穩(wěn)定發(fā)展。