陳媛媛,王苑穎
2014 年,由多利益主體參與的“聯合共建數據公平港口”學術研討會在荷蘭萊頓召開,闡述科學數據共享基本理念,提出“可發現、可訪問、可互操作、可重用”FAIR 原則[1]。在歐盟“地平線2020”計劃(Horizon 2020)項目中,歐盟委員會研究與創新董事會提出鼓勵科研合作,要求歐盟及成員國建立開放數據發展制度,提升科研水平、促進科研創新[2]。歐洲大學協會科研開放獲取線路中表示工作重點是促使科研人員與利益相關者積極互動[3]。2018年《科學數據引用》國家標準實施,表明學術研究者可以規范引用科研數據,將促進數據所有者開放共享科研數據[4]。各個國家及組織提倡科研數據共享并提出推動科研數據的發展舉措,關注科研人員與利益相關者的持續對話。但數據濫用、數據權益模糊、缺乏數據監護使數據共享達不到應有的程度,科研數據開放共享涉及的數據擁有者、數據管理以及服務方的復雜利益沖突關系得不到改善,促使科研數據共享進程緩慢。因此,如何確保利益相關者的利益,明確其利益關系,尋求利益平衡至關重要。本文旨在從利益相關者視角,探究科研數據開放共享的利益相關者角色及責任、利益相關者互動關系、利益相關者協調策略,進而推動科研數據開放共享可持續、廣泛開展。
利益相關者理論1963年由斯坦福研究所提出,起初應用于企業治理問題研究,以尋求影響企業目標的利益相關者的平衡和利益實現。隨著研究不斷深入,學者從不同角度對利益相關者進行分析。弗里曼認為利益相關者是指任何對企業目標實現有影響,或受此目標實現影響具有可識別性的團體或個人[5]。克拉克森引入專用型投資,認為利益相關者承擔某種形式風險,其活動與企業目標實現相互影響。威勒結合克拉克森的緊密性維度,提出直接通過人的參與和企業聯系的利益相關者具有社會性;而未通過具體的人與企業間接聯系的不具有社會性。將利益相關者劃分成4個主體:(1)人與企業有直接關系的為首要的社會性利益相關者;(2)具有社會性的活動與企業形成間接關系為次要的社會性利益相關者;(3)不與具體的人發生聯系對企業有直接影響的為首要的非社會性利益相關者;(4)與人沒有直接關聯而對企業有間接影響的為次要的非社會性利益相關者[6]。隨著利益相關者理論影響力逐漸擴大,拓展應用于金融、教育、醫學等領域。
科研數據通過觀察、計算、實驗等手段產生,以數字形式進行存儲的信息,包括文本、數字、圖像、軟件、算法等[7]。科研數據是研究人員以及研究機構基于理論、調研、實驗等研究過程產生的各種形式的事實類、觀察類、實驗類數據[8]。筆者認為,科研數據是科研人員在個人科學研究過程中產生的觀察數據、科學實驗數據以及分析數據。科研數據共享是科研人員以正式或非正式途徑將數據分享給其他科研人員及公眾。科研數據共享過程涉及多個利益主體,引入利益相關者理論應用于科研數據共享的實踐,為界定利益主體、明確利益相關者的訴求、解決利益相關者的利益沖突問題提供理論依據。
本研究采用文獻資料分析方法,從科研數據開放共享概念及外延出發,篩選出相關的資料,參考黃如花、司莉、崔雁等界定的科研數據共享的利益相關者分類,在此基礎上歸納、總結,最終確定利益相關者類別為科研人員、科研機構、數據出版商、圖書館、數據中心、科研資助機構、政府及公共部門、行業協會。
借鑒網絡文化企業利益相關者分類的威勒模型[9],從兩維度出發:一維度根據與科學研究利益的相關性大小劃分為首要和次要的利益相關者;二維度是依據科研數據開放共享的影響力大小,來區分關鍵和非關鍵的利益相關者。繪制科研數據共享的利益相關者分類圖(見圖1),將科研數據共享的利益相關者分為首要關鍵利益相關者:科研人員、科研機構。科研人員既是科研數據的生產者也是使用者,科研數據共享的開展以其行為為核心。科研機構是數據知識產權的擁有者,兩者與科研數據利益和共享程度產生直接關系。次要關鍵利益相關者:數據出版商、圖書館、科研資助機構。科研資助機構作為科研數據開放政策導向,并為科學研究提供資金支持,對科研數據共享具有重要的影響力。數據出版商以及圖書館為數據出版發行的實行者,對科研數據開放共享均產生積極的促進作用。首要非關鍵利益相關者:數據中心;數據中心為科研數據管理提供技術支持、工具平臺設計以及技術培訓,雖然數據中心為主要的利益相關者,但對科研數據開放共享影響力相對較小。次要非關鍵利益相關者:政府及公共部門、行業協會。

圖1 科研數據共享的利益相關者分類
(1)科研人員。科研人員既是數據的生產方,也是數據的使用方。科研人員具有數據獲取和數據生產能力,在一定期限擁有優先使用權、著作權、署名權等權利。其任務包括創建數據、收集數據、處理數據、分析數據、提供可重用數據。科研人員個體共享主要是科研機構以及高校課題組之間無償共享科研數據,科研人員認為將科研數據、研究過程、科研成果進行分享會影響研究成果以及自身利益,探索科研人員數據共享的影響因素將有助于科研數據共享全面實現。影響科研人員共享既有主觀意志,如數據技能、使用以及理解能力;也有感知利益:學術優先權、社會評價、學術認可、預期回報、物質獎勵、自我價值感;以及感知風險:出版機會減少、科研成果被竊取、數據錯用、信譽受損等影響因素[10]。科研人員對數據共享認可態度、學術競爭是影響科研人員數據共享的主要原因。科研數據代表科研人員的學術貢獻程度,不同的學科領域,科研人員對數據所有權、領域研究目標以及數據共享的接受度產生差別[11],天文學、生態學領域數據共享程度高,而社會科學、醫學、生物學等領域數據一般包含敏感信息,共享相對保守。
(2)科研機構。科研機構是科學研究數據的重要來源,主要包括高校和獨立的科研院所,注重科研數據的生成、管理和應用。數據共享過程當中,科研機構是科研人員與科研資助機構的中間方,為科研人員提供相關的數據培訓以及數據服務,并對建立的科研數據庫存儲數據進行管理和監督。相關政策方面,科研機構制定訪問和使用政策約束本單位的科研活動,管理科研人員科研項目實施以及制定科研人員職業晉升的激勵措施和標準等。
(1)數據出版商。科研數據出版大致分為科研數據獨立的學術成果形式出版、學術期刊與科研數據集成出版兩類[12]。根據出版流程不同,科研數據獨立出版可以通過數據期刊出版,也可將其存儲于知識庫進行出版;學術期刊要求發表論文同時提供所用的支撐數據,學術期刊與科研數據集成模式產生,該模式分為由學術期刊自行出版、將科研數據存儲于數據庫中發布,幫助公眾理解以及評價研究成果。Nature、Science、PLoS ONE、美國生態學會ESA旗下的所有期刊等都要求與期刊有關數據存儲于數據庫中。科研數據的公開發行,出版商希望利用合法方式獲取高額利潤收入。積極與利益相關者建立密切聯系,構建科研數據運營模式,處理好科研數據發行過程的知識產權問題。
(2)圖書館。圖書館是數據存儲及共享的平臺,承擔科研數據收集、發布以及宣傳、管理任務,為用戶提供數據的管理及咨詢服務。另外,圖書館提供數據出版服務,幫助用戶了解出版的文件格式以及采用何種文檔出版。平臺上的期刊論文應遵循DCC 協議,具有可獲取、可讀性以及可評估性[13]。圖書館支持科研數據開放共享,在科研數據傳播過程中制定數據管理計劃,搭建數據管理平臺,積極與相關機構建立合作關系、優化整合機構資源,是科研人員與出版商的溝通橋梁。未來圖書館著眼于數據監護、數據素養教育、知識產權服務等領域,繼續拓展服務內容更好地推動科研數據研究的發展。
(3)科研資助機構。科學基金影響科研產出、學術影響力、合作創新,科研資助機構是統籌和支持科研項目順利進行的保障。科研資助機構除為科學研究提供資助以外,肩負數據管理計劃制定、數據規范化內容提交的責任。科研資助機構建立和發布正式的科研數據開放共享政策,明確利益相關者職責,設置相關的正常實施機制激勵以及約束利益相關者的行為。國外大多數國家的科研資助機構已制定了數據管理以及共享政策對數據共享提供政策支持。美國國家科學基金會(NSF)頒布的相關政策中表示以獎勵協商與資助方式支持數據清理傳播以及存儲;美國國立衛生研究院(NIH)的數據共享政策和實施指南提供數據共享政策聲明以及政策實施其他信息,認為數據共享應廣泛和免費提供,保護數據的機密和專有性[14]。英國研究理事會的《CRUK數據共享指南》規定涉及用戶隱私的個人信息科學數據共享時將數據進行匿名化處理,對于無法保護的數據需進行陳述。
數據中心。數據中心大多是政府主導建立的公益性機構,用于數據的存放、管理、信息處理服務以及數據引用的標準化制定。數據中心以密集型的學科為導向,匯集國家支持的重大課題、專題研究的數據成果,致力于提供數據支持以實現學科的可持續發展。世界范圍內已產生多個數據中心,如美國人類基因組計劃(HGP)、美國國家海洋與大氣部(NOAA)、英國數據存儲庫(UKDA)、澳大利亞海洋數據中心(AODC)等。國內也已成立多個數據中心,如國家基因組科學數據中心、國家天文數據中心、國家高能物理科學數據中心、國家空間科學數據中心等等。其中,國家基因組數據中心已能進行基因組學數據存儲,研究者將數據上傳至GSA數據庫之后可進行論文發表,數據論文發表將更加便捷。
(1)政府及公共部門。科研數據共享環境需要國家層面的數據管理政策以及相關法律法規的支撐,而政府在數據共享開放起著宏觀調控的作用,制定相關法律框架,通過強有力的政策體系,規范數據共享相關機構行為,確保提供的科研數據真實和準確。政府相關部門制定科研數據管理可持續發展戰略,加強知識產權機構管理,加大知識產權監管,維護社會公眾對科研數據合法的知情權和使用權。
(2)行業協會。行業協會主要是溝通聯絡、發布信息、促進科研數據共享聯盟形成,不直接參與科研數據的產生,是為其提供咨詢、監督、協調的社會中介組織。行業協會針對某一研究主題開展調查研究形成的調研報告、評估手冊等類型研究成果,在引用標準實施過程當中促進科研數據引用標準的宣傳推廣、科研數據標準的使用及實施[15]。
根據上文科研數據開放共享利益主體識別的劃分依據,明確利益相關者角色定位,了解科研數據利益相關者的利益訴求,建立利益訴求分析表。

表1 利益訴求分析表
利益相關者彼此之間的戰略互動在科研數據共享實踐占有舉足輕重的地位,根據科研數據共享利益相關分類,結合DCC數據生命周期,將上文利益相關者劃歸為兩大類:關鍵利益相關者和非關鍵利益相關者。構建科研數據開放共享的利益相關者互動關系模型,顯示科研數據開放共享的階段性特征以及利益相關者對話過程中存在的沖突。

圖2 科研數據開放共享的利益相關者互動關系模型
(1)科研資助機構與數據生成者。科研資助機構是影響科研數據開放的主要因素,開放獲取中,科研資助機構在提供政策支持、資金保障發揮重要作用,通過影響出版商的使用許可方案間接影響科研數據開放,成立的資助資金項目充分調動科研人員參加各種研究活動創建有價值的科研數據。科研資助機構頒布的政策致力于解決科研人員共享數據時面臨的數據存儲問題、數據安全問題、數據所有權等問題。雖然我國尚未形成完整的科研數據共享政策體系,但是國內學者針對科研數據共享相關政策制定已開展相關研究,張瑤等對國外科研資助機構的科研數據分領域、強制性存儲政策,制定科研數據管理計劃和完善監督機制的政策,科研數據共享過程中產權歸屬問題政策進行詳細論述[16]。黃國彬等調研英國6家科研數據資助機構的共享政策發現,涉及研究者的個人隱私會采取措施進行保護,涉及商業機密的科學數據給予限制[17]。由上述可知,國外的資助政策已相對完善,國內應該結合機構實際情況制定共享政策。
(2)數據生成者與數據出版商。科研工作者產生的數據共享有兩種方式:非正式共享和正式共享。非正式共享包括可以直接將數據共享給同事以及同領域研究者或上傳至學術社區進行共享;正式共享:利用公開出版物以及公共平臺,對科研過程前期數據、實驗數據在實驗成果出版發行時上傳至出版發行數據庫或數據直接出版供他人使用,具有規范性。開放共享要求作者將期刊論文存儲在機構庫中,供用戶免費使用,這對于傳統商業模式產生沖擊。傳統商業模式是作者將期刊論文版權轉讓于出版商,出版商通過收取訂購費用獲取收益。數據期刊轉讓之后,出版商為了獲利不同意免費或過早公開,作者應資助機構強制要求,將數據在機構知識庫中存儲,將侵犯作者已簽署的數據轉讓許可協議,與出版商發生權利沖突。
(3)數據出版商與圖書館。數據出版機構是獲取數據資源的主要來源,圖書館是對數據資源進行宣傳、推廣及使用,起連接用戶與平臺的橋梁作用,數據出版商和圖書館是相互促進、互惠互利的合作關系。不同之處在于數據出版機構生產經營是以盈利為目的,圖書館大多數是公益性的機構,雙方在合作過程當中會產生資源定價、市場競爭與版權保護的利益沖突[18]。數據庫的使用過程中,著作權是保障數據庫商利益的法定依據,圖書館與數據出版商合作在法律體系范圍內開展,數據出版商也提出嚴格的使用條件限制以控制圖書館對數據庫的使用。隨著數字傳播技術日益增強,數據進行數字化以及網絡化傳播時,數據資源侵權事件頻繁發生,著作權人、數據出版商的權益得不到保護。圖書館在開放期刊傳播當中,對未注明數據來源的資源從出版商網站進行獲取會造成侵權。開放獲取出版引起出版商商業利益失衡問題尚未解決,出版商根據作者支付數據費用情況決定開放程度,由于受資助的OA期刊數量相對較少,作者可能承擔高昂的出版費用對OA出版形成阻礙,而對于尚未開放的出版期刊論文,由圖書館承擔期刊訂閱費,科研數據開放共享更為艱難。處理數據出版商與圖書館的利益沖突,挖掘雙方優勢,取長補短,互利共贏。
(4)圖書館與數據使用者。圖書館是數據管理以及信息獲取的重要機構,為用戶提供研究和教學支持、數據引用、科研數據發表等服務,促進了科研數據的傳播和重用。用戶通過圖書館等管理平臺打印下載相關科研數據屬于復制行為,可在一定范圍內進行傳播,但是不能未經授權惡意復制、發行、篡改和再利用。數據引用不當可能引起科研數據知識產權擁有者和科研數據衍生成果之間產生知識產權的利益沖突,比如:擅自將他人科研數據進行傳播或放入自己科研成果中;惡意分解利用他人科研數據,破壞科研數據的完整性;數據引用時對作者信息標引不當等情況都會引起知識產權沖突問題。因此,合理規范引用數據,使數據生產者的成果得到認可和尊重變得尤為重要。
作為數據的使用者,科研人員需要對科研數據的重用屬性、授權對象、授權狀況以及授權范圍等進行確定,對不同類型科研數據在所在轄區內是否享有知識產權,是否符合版權和數據庫權利的保護標準,是否處于版權和數據庫權的保護期內進行判斷,遵守數據授權條款,尊重數據提供者的知識產權。標準化的數據引用,明確的數據責任主體和所有權促使更多科研人員加入數據共享的行列中。
(5)數據共享協作者與數據生產者。數據中心、政府及公共部門、行業協會是影響科研數據開放的非關鍵利益相關者,以規范科研數據開放共享行為。數據中心主要開展數據標準化和數據存儲,為科研數據管理提供技術支持,政府及公共部門、行業協會在處理科研數據相關利益方面發揮重要作用。政府在科研數據涉及國家機密和社會公共利益均衡共享與知識產權所有者權利,建立政策反饋機制,促進科研管理活動有效開展。2015 年,美國國家信息標準協會提出推薦采用元數據字段,作品知識產權和使用許可相關信息獲得理解和標識[19]。行業協會協助制定行業科研數據開放共享政策,為機構和個人開展科研數據活動提供指導。
在科研數據開放共享的利益相關者互動關系模型中,數據生成者的核心圈層,科研資助機構、圖書館及數據出版商構成的關鍵利益相關者內環,作為推進科研數據開放共享的重要內力,需要從以下幾方面入手。
在科研數據管理標準不統一情況下,科研數據管理機構基礎設施的開發、維護和利用需要相關人員具備高級技能。因此,應提高科研數據活動相關人員開放和數據重用技能,進行科研數據管理計劃編制、數據存儲、元數據標準等理論知識的教育與培訓。例如,歐盟第七框架計劃資助成立開放數據培訓項目FOSTER,匯集了在科研工作流程中應用的策略及技能,為科研人員開放科學實踐提供指導[20]。美國明尼蘇達大學圖書館針對研究生、教師和科研人員提供數據共享和重用課程,以自主學習和定期培訓方式理解數據管理要求和數據版權政策等[21]。賓夕法尼亞州立大學圖書館、弗吉尼亞大學圖書館、昆士蘭大學圖書館、愛丁堡大學圖書館分別針對科研人員數據素養意識、技能、應用和倫理4個方面開展數據素養教育[22]。建立完善的科研數據管理人才體系,擴大科研數據人才培養規模,有效提升科研人員共享認識,為推進科研數據開放打下堅實基礎。
科研數據的真實性與完整性需要科研資助機構進行監管以及維護,科研資助機構應采取針對不同學科領域、監督數據質量、保護科研人員隱私等方面制定數據標準和政策,增大對科研數據的保護力度,以及為科研數據共享提供實踐指導。根據不同學科制定數據標準,對科研人員數據存儲方式進行統一規定,提高科研數據的管理效率。我國的科研資助機構制定共享政策首先應該充分考慮數據的類型和共享的形式,依據不同學科、不同數據類別制定管理標準,更有利于數據的歸檔和保存。科研資助機構通過要求被資助者制定科研數據管理計劃和構建多元化評估體系,實現數據質量的監管,為科研人員營造良好的學術生態環境。科研數據管理計劃是科研數據從產生、分析、存儲、管理、共享階段的整個科研生命周期持續維護的保障。澳大利亞國家數據服務合作中心、荷蘭數據歸檔與網絡服務、美國校際社會科學數據共享聯盟等基金組織已發布了數據管理計劃相關政策[23]。國內應該盡快建立和完善政策,加快科研數據開放的進程。在制定數據管理計劃時,科研申請者對數據收集整理、數據位置、數據共享方式以及價值給予詳細描述,科研資助機構向科研申請者提供政策指南、工具模板以及線上指導服務,為申請人制定科研數據管理計劃提供幫助。之后,對科學研究進程進行實時監督,構建多元化評估體系,將科研成果評估與研究人員獎懲相關聯,制定鼓勵政策督促科研人員上傳科研數據。共享數據時,對涉及科研人員隱私需征求科研人員的意見,加強訪問權限管理,防止信息泄露。
標準化和規范化政策在科研數據開放共享的各個環節保障知識產權的清晰以及科研數據的合理使用,界定科研數據主體之間占有、使用、收益、處分關系[24]。科研人員將產權清晰、完整精確的科研數據進行整理以及公開出版發行,不僅保證數據質量,推動科研規范以及學術誠信,而且提高數據生產者共享數據的積極性。科研數據共享和知識產權保護統一又相互獨立,適度知識產權保護利于科研數據開放共享。
現行的知識產權法律法規不完善,依據科研數據共享體系的特點與實際情況建立知識產權成果歸屬的法律法規制度,共同維護利益相關者權益以及數據版權。版權保護強調保護版權人與出版商的權利適度,應該解決數據資源和開放獲取之間的矛盾沖突,建立圖書館與數據出版商的合作伙伴關系。對不同來源的科研數據再利用以法律形式明確其產權歸屬,降低科研數據交易成本,合理界定科研數據再利用中可轉移的數據權利類型。圖書館對于開放刊物的數據庫中明確注明作品原始來源以及使用許可,對于數據資源的使用情況及時反饋于出版商,以獲得出版商的支持。科學數據引用過程中增強用戶知識產權意識,引導用戶科學合理進行科研數據引用。圖書館積極開展知識產權咨詢服務,舉辦科研數據知識產權講座,介紹科研數據知識產權法律法規及相關政策。
科研數據管理與服務密不可分,圖書館是科研數據管理和情報服務的主要機構,為科研數據使用者提供咨詢、宣傳科研數據共享價值以及數據素養教育服務。若想提升管理機構科研數據管理服務水平,需要建立專門的業務服務機構推動科研數據共享的開展。2016 年,歐盟委員會計劃建立“歐洲開放科學云”,為科研人員提供數據存儲、共享以及再利用的虛擬科研環境,推動科研人員跨技術、無國界的共享和分析科研數據[25]。數據管理機構開展科研數據服務基于數據生命周期對數據進行管理以提高科研效率。數據收集時,建立完整的數據收集平臺,科研人員自由選擇數據分級的保護模式和級別;數據分析階段,管理機構依據科研人員數據需求提供情報服務;數據共享階段,圖書館根據實際情況給予數據共享政策制定建議,并幫助機構完善相關的政策法規,以及采用防火墻、認證、訪問控制等技術對科研數據分層保護。面向科研人員多樣化需求應該豐富數據管理平臺的科研數據服務需求,利用數據管理工具DMPTool等幫助科研人員制定項目開展前的數據管理計劃;提供數據庫列表、法律咨詢服務以及后期項目的數據存繳;進一步建設數據存儲平臺,應用Hadoop 和NoSQL 等新技術處理大數據,提供用戶可長期訪問的數據存儲格式。
利益相關者的合作有利于推動科研數據開放共享。研究人員、科研機構、數據管理機構與出版商間的協作,能夠幫助制定開放獲取的科研數據政策,有助于明確各個利益相關者的責任以及作用。政策實踐與國際接軌,加強國際間的合作,可釋放開放數據的巨大潛力。與科研人員積極對話有利于了解其在科研數據活動中對基礎設施以及服務需求,協調不同利益主體的不同訴求。出版商認識到科研數據的巨大價值,與利益相關者建立密切聯系,建立科研數據的運作模式,出版經過同行評審的數據雜志,推進科研數據進入學術交流和評價體系。圖書館作為數據聯絡服務方,整合機構業務優勢,與其他圖書館和國家相關基金會等機構采用合作機制,促進科研數據資源的高效運轉。如大英圖書館DataCite是全球性的服務項目,參與合作機構包括英國考古學數據庫服務、英國國家資料庫、英國環境研究委員會、英國科學技術實施委員會以及華大基因[26]等。國家和科研機構、科研資助機構合作成立科研數據開放共享基金,能夠為國家、行業以及機構重點課題項目數據共享提供充足的資金支持。