何 琳 常穎聰
(南京農業大學信息科技學院 江蘇南京 210095)
在大數據、數字化的背景下,科學研究將越來越依賴于對大量可獲取數據的分析,因此科學數據的采集、管理與分析越來越受到科學界的重視。科學數據共享指科研人員將支撐其研究的科學數據在互聯網上進行公開,并支持免費獲取的行為,允許任何用戶以任何目的免費通過互聯網進行下載、復制、分析及重新處理利用,不受資金、法律或其他技術壁壘的制約。聯合國教科文組織(The United Nations Educational,Scientific and Cultural Organization,UNESCO)提出科學數據為三種開放存取信息資源(科學出版物、教育資源、科學數據)之一,得到了全世界的認同和重視。
科研人員作為科學數據的生產、使用和管理者,是否積極倡導并參與數據共享將直接影響到科學數據公開獲取的促進和發展,因此發現能夠影響其意愿的因素并給予改善能夠在一定程度上促進數據共享的發展進程。相對于歐美國家較為積極的數據共享模式,國內仍處于發展階段,還未從政府層面建立起科學數據共享的促進措施。為了解國內科研人員對科學數據共享的認知以及影響數據共享的因素,本文借鑒經典心理意向模型計劃行為理論(Theory of Planned Behavior,TPB)和技術接受模型(Technology Accept Model,TAM),針對科學數據共享的特點,建立科學數據共享意愿模型,通過對國內300余名科研人員的調研,利用結果方程模型對科研人員數據共享意愿及影響因素進行研究。
2011年,Adrian Mulligan利用在線調查的方法對6344名科研人員進行訪問,發現有75%的科研人員希望使用其他研究者的數據但不愿意共享自己的數據,主要原因是科研人員不了解數據共享對學術交流的影響,不清楚數據共享能否獲益;只有52%的表示愿意向他人提供科學數據,同年Christine L.Borgman 對 1700 名研究人員進行調查,結果表明53%的科學家愿意通過郵件向有數據需求的人員分享數據,55%的科學家選擇在自己的博客上公開數據,而75%的科學家因為耗費時間而不愿進行數據共享。1329名研究人員參與了Carol Tenopir等針對數據共享意愿的調查問卷,其中32.3%有與他人共享數據的經歷,但只有11.6%支持無條件的公開數據,以學科歸類結果顯示,氣象科學的科研人員態度最積極,占49%;醫學類則只有13%的科學家愿意共享自己的數據。Philippa Broadley等則發現科研人員拒絕數據共享主要是擔心數據的惡意使用、篡改、知識產權等問題。同樣,在針對生物多樣性領域專家科學數據共享態度調查中Neela Enka發現研究者愿意參與數據共享,但對時間花費、缺乏統一標準、數據錯用、數據保密等方面的擔憂阻礙其實施數據共享。Heather A.Piwowar利用文獻計量的方法對11603篇文獻進行分析發現,首先有數據共享或數據使用經驗的科研人員更愿意共享科學數據;其次期刊支持公開獲取、要求數據共享強烈程度以及科學數據是否受重大科研項目基金支持同樣影響科研人員數據共享行為。張晉朝在我國高校科研人員科學數據共享意愿研究中發現科研人員的自我價值感知、互惠預期、人際信任、形象是形成共享信念的重要維度,信念對科學數據共享意愿存在間接顯著性影響,主觀規范對科學數據共享意愿存在直接顯著性影響。
綜上所述,可見國內外學者對科學數據共享影響因素開展了不同程度的研究,大多數研究集中于對歐美國家科學研究人員進行調研,國內雖然也進行了類似的研究,但調研尚不全面,未考慮到科研人員的感知風險和感知成本。因此本文對國內外研究成果加以整合,針對我國科研人員對科學數據共享的態度進行調研,將科研人員對數據共享的態度、疑慮等內容加入調查問卷中,利用結構方程模型,以更加全面的角度調查影響國內科研人員數據共享意愿的因素,以期為我國科研數據共享的促進提供些許建議。
本文針對科學數據共享的特點擬引入經典行為預測理論TPB及技術接受模型TAM建立科學數據共享意愿模型來研究影響我國科研人員數據共享行為的影響因素。
TPB由理性行為理論(Theory of Reasoned Action,TRA)發展而來。TRA認為行為意向受態度和主體規范影響。由于TRA并不能完全解釋或預測某些實際行為,1985年Ajzen在TRA的基礎上增加了感知行為控制力——TPB。TPB是目前社會心理學中最著名的態度行為關系理論,該理論認為行為意向是影響行為最直接的因素,受態度、主觀規范和感知行為控制,一個人的態度越積極、主體規范和感知行為控制越強,則執行某種行為的意向越強,也就越可能最終執行某種行為。1989年,Davis將TRA和TPB應用到信息系統領域用以解釋用戶對信息技術的接受行為,提出了技術接受模型(Technology Accept Model,TAM),該模型認為使用行為意愿由使用態度和感知有用性決定,使用態度是由感知有用性和感知易用性決定的,而感知有用性受感知易用性和外部變量的影響。
近年來,TPB、TAM被廣泛應用于對各種新事物的解釋和預測行為之中,如網絡購物意愿、知識共享因素、數字圖書館、ERP使用等。大量研究表明TPB、TAM在解釋和預測行為意向方面十分有效。
本文基于TPB、TAM理論構建了科研人員數據共享意愿模型,如圖1所示。

圖1 科研人員數據共享意愿模型
縱觀國內外學者對科學數據共享影響因素研究,雖然多數學者采用問卷調查采集數據,而研究方法主要采用定性分析,且每次研究均集中在一個方向,對數據共享影響因素并沒有全面的研究。本文對已有研究成果進行整理改進,總結為主觀規范、感知行為控制、感知成本消耗、感知風險、感知有用性、數據共享態度六個方面,采用結構方程模型的方法,定量研究數據共享意愿影響因素。
模型綜合了TPB、TAM的影響因素變量,并做出改進:首先根據科研人員對數據共享帶來風險的擔憂,增加感知風險因素,更加科學的測量數據惡意使用、核心內容泄露等風險因素對數據共享的影響;其次,國內還未從政府層面建立科學數據共享的促進措施,促進數據共享的條件仍然不具有廣泛的影響力,也未得到大力宣傳,因此增加感知行為控制對數據態度影響路徑會更加全面的測量感知行為控制對數據共享行為的影響。
數據共享意愿是理論模型的因變量,指科研人員將科學數據進行共享的主觀意愿強烈程度。在TPB和TAM中,意愿是行為的直接決定因素,個人的意愿越強,實施行為的可能性越大。行為意愿的強弱受個人因素的影響,即一個人對執行某種行為的態度的影響。行為態度是個體對執行某特定行為喜愛或不喜愛程度的評估。因此假設:
H1:數據共享態度對數據共享意愿有正向影響,即科研人員對數據共享態度越積極,數據共享意愿便會越強烈。
主觀規范是指個體在決策是否執行某特定行為時感知到的社會壓力,它反映的是重要他人或團體對個體行為決策的影響。Karahanna等研究發現主觀規范對用戶接受新信息系統的意愿有正向影響。由于科研界社會群體的特殊性,科研人員所感知的社會壓力主要來自于同事,同學科的專家學者等。因此假設:
H2:主觀規范對數據共享意愿有正向影響,即感知的社會壓力越大,數據共享意愿便會越強烈。
感知行為控制是指個體感知到執行某特定行為容易或困難的程度,它反映的是個體對促進或阻礙執行行為因素的知覺。本研究將感知行為控制測度項集中在科研人員對數據共享促進因素的感知。因此假設:
H3:感知行為控制對數據共享態度有正向影響,即感知的促進因素越有利,數據共享態度便會越積極。
H4:感知行為控制對數據共享意愿有正向影響,即感知的促進因素越有利,數據共享意愿便會越強烈。
感知易用性是TAM模型中非常重要的變量,是用戶主觀上認為使用某一特定系統所付出努力的程度。數據共享不僅包括技術的阻礙,更多的是社會因素。Carol等在調查中發現有53.6%的科研人員認為數據共享花費不必要的時間,39.6%的表示缺乏資金支持。所以本研究中將感知易用性的測度內容集中在科研人員對數據共享所付成本的估計,如時間、資金的消耗,因此調整為感知成本消耗。因此假設:
H5:感知成本消耗對采納行為態度有負向影響,即感知成本消耗越高,數據共享態度越消極。
感知風險是指科研人員對數據共享可能造成的風險的感知。在Neela Enke對生物學科領域專家對科學數據共享態度調查中發現,科研人員擔心數據共享會引起數據錯用、保密問題等方面的擔憂。Jelte M.Wicherts等調查顯示科研人員擔心數據共享之后可能會揭示研究中的錯誤或者其他學者再分析會生成與原結果相反的結論。由此可見科研人員擔心數據共享后會帶來數據錯用、篡改、剽竊等風險。因此假設:
H6:感知風險對數據共享態度有負向影響,即感知風險越高,數據共享態度越消極。
感知有用性是TAM主要的衡量指標,指用戶主觀上認為某一特定系統能夠所提升的工作績效程度。對于科研人員而言,數據共享可以提高相關科學論文的可信度、被引率,同時能夠提高在同行中的知名度。Heather A.Piwowar研究發現公開分享的數據對期刊的引用率有69%影響,且期刊的影響因子與數據共享的程度呈正比。Carol在調查中發現68.6%的科研人員認為數據使用時標注引用是非常重要的。因此假設:
H7:感知有用性對數據共享態度有正向影響,即科研人員感知有用性越高,則數據共享態度越積極。
H8:感知有用性對數據共享意愿有正向影響,即科研人員感知有用性越高,數據共享意愿越強烈。
問卷設計基于上文的理論模型和研究假設,由三部分組成,第一部分為引言,對數據共享的概念、意義進行了闡述;第二部分為個人基本信息的測量,主要了解科研人員的基本統計學信息;第三部分為問卷的主體部分,主要是對數據共享行為影響因素的測量,該部分所有測度項均采用5等級李克特量表形式進行測量,其中:1=“非常不同意”;2=“不同意”;3=“不確定”;4=“同意”;5=“非常同意”。
本研究的調查對象為國內研究所、高校的科研人員。在初步完成問卷設計后邀請了30位博士生、講師及副教授、教授等進行了預調研,根據反饋對問卷中模糊題項進行了修正。正式問卷通過問卷星進行發放,調查持續3周,回收問卷330份,剔除無效問卷2份,最終有效問卷328份。
本次研究對象男女比例基本持平,年齡主要集中在26~45歲之間,中級職稱以上占64.32%,且72.25%的調查對象來自985、211高校及研究所。參與本次調研的科研人員理工學科的較多,99.7%的有參與科研項目經歷(見表1、表2)。

表1 調查對象基本統計學信息
信度(Reliability)主要衡量的是測量結果的一致性、穩定性和可靠性,一般通過內部一致性系數(Cronbach'a)來描述測量。大多數學者認為0.7是一個合適的標準閾值,而對于尚未驗證過的變量,達到0.6便可接受。量表的信度主要反映測量值與真實值的接近程度。因素負荷量值介于0.5至0.95之間,表示模型的基本適配度良好。潛在變量的組合信度CR(Composite Reliability)是模型內在質量的判別準則之一,可作為檢驗潛在變量的信度指標,若潛在變量的組合信度大于0.6,則模型內在質量理性。表3數據顯示本研究調查問卷的Cronbach'a值,因素負荷量,CR均滿足標準,因此問卷具有較好的信度和效度。

表2 調查對象科研背景信息
本研究利用AMOS17.0對模型假設進行了檢驗,模型檢驗標準及檢驗結果數據見表4。
表4數據顯示模型擬合指標均符合規定適配值,因此構建的假設模型成立。大部分學者認為,解釋的變異量R達到30%可認為模型達到了較好的解釋性,吳明隆認為R高于0.5表示模型的內在質量檢驗良好,本研究數據共享意愿被潛在變量解釋的變異量為0.778,因此模型均具有較好的解釋力。
在模型成立的前提下檢驗研究假設是否成立,上文驗證模型通過,假設檢驗結果見表5。
結構方程模型中,顯著性指標p<0.05時則認為假設成立,表6顯示本文提出的大部分假設成立,不成立的假設分別為H4、H5、H8,由此可以得出以下結果:
(1)科研人員對數據共享的態度直接影響其意愿。態度是TPB、ATM模型中的核心概念,也是本研究中的主要影響因素。即科研人員對數據共享的態度越積極,數據共享意愿更強烈。
(2)主觀規范正向影響科研人員數據共享意愿。領導、同事或學科內其他科學家數據共享的行為導向對國內數據共享行為影響較大,即他人積極參與數據共享時,科研人員數據共享的意向更大。
(3)感知行為控制正向影響數據共享態度,對數據共享意愿影響不顯著。Ajzen發現當態度或主體規范具有較大影響的情況下,感知行為控制對意向的預測力便較弱,
因此本研究模型假設模型中態度、主體規范對意愿的影響力較大,而感知行為控制即研究人員所在單位的獎勵政策,課題資金支持機構對數據共享的要求強烈程度,期刊雜志社優先出版數據共享的論文等條件只能影響其數據共享的態度。

表3 問卷信息

表4 科研人員數據共享影響因素模型擬合指標值

表5 科研人員數據共享影響因素假設驗證
(4)感知風險負向影響數據共享態度,感知成本消耗對態度影響不顯著。這說明科研人員擔心數據共享可能帶來的風險,如數據篡改,惡意使用,泄露核心內容等,而時間、資金等成本問題并不影響其數據共享態度。其原因可能是時間、資金確實充裕,也可能是因為對數據共享的成本消耗并不了解。
(5)感知有用性正向影響數據共享態度,對數據共享意愿影響不顯著。這說明數據共享能夠帶來的好處,如被引率的提升、學科內影響力的提高等只能影響科研人員對數據共享的態度,即感知到的好處越多越有益,科研人員對數據共享的態度越積極。
本文基于TPB和TAM理論,結合科學數據共享的特點,構建了科研人員數據共享意愿模型,利用AMOS17.0對模型進行了驗證,模型適配度均良好。研究結果表明直接影響科研人員科學數據共享意愿的因素包括數據共享態度、主觀規范兩個方面,感知行為控制、感知風險、感知有用性通過科學數據共享態度間接影響科研人員科學數據共享意愿。研究結果說明目前國內科研人員對數據共享仍處于初步認知階段,表現為強烈的從眾心理,同時科研人員雖然十分關注科學數據,但并不了解數據共享可能帶來優勢與風險。因此針對目前科研人員對科學數據共享的認知現狀,本文對科學數據共享發展提供以下建議:
(1)利用社群影響力,廣泛宣傳科學數據共享理念。假設H1、H2結果表明科研人員數據共享意愿受其數據共享的態度以及主觀規范的直接正向影響,因此利用領導、同事或同行專家學者等社群影響力加大科學數據共享宣傳,消除科研人員對數據共享的消極態度,使其認識到數據共享的重要性、必要性和科研益處,增強數據共享的積極性,可以達到事半功倍的效果。因此可以采取:①“自上而下”方法,即針對高層領導宣傳,通過領導決策層的行為導向影響科研人員的數據共享意愿;②“同行先進代表宣傳”方法,即倡導學科內數據共享先進代表對數據共享的作用與意義進行宣傳,尤其是提高論文被引頻率,提高學科影響力等方面的影響,從而吸引科研人員的參與。
(2)科學數據共享政策化,強調數據共享必要性。假設H3結果證明感知行為控制正向影響數據共享態度,實際表現為如果課題資金支持機構對數據共享的要求越強烈,期刊雜志支持數據共享的科研論文優先出版的權限越高,單位對數據共享獎勵政策越完善,科研人員數據共享的態度則會越積極。
在歐美國家有來自國家基金組織、科研機構、期刊出版界對數據共享的一系列強制性政策,如美國國家航空航天(NASA),英國研究理事(RCUK),美國國立衛生研究院(NIH)等,要求凡是受其基金資助的科研項目必須共享科學數據;美國科技政策辦公室(OSTP)要求由聯邦資金全部資助或部分資助產生的非保密性科學數據須存儲并支持公開獲取;Nature要求作者在投稿時必須提交公開科學數據的相關數據庫。由于國內科學數據共享仍處于起步階段,因此可以通過借鑒歐美國家較為成熟的模式,將數據共享制定為基金組織、雜志期刊的強制政策,同時用提高獎勵政策的方法提高科研人員數據共享的積極性。
(3)建設科學數據共享管理方法法律體系,降低數據共享風險。假設H6證明感知風險負向影響數據共享態度,實際是科研人員擔心數據共享后可能造成的惡意使用、篡改和泄露研究核心內容等數據知識產權保護問題。因此如何確保數據共享后的保密性,避免數據共享者損失等成為促進數據共享進程中需要解決的重要問題。
科學數據知識產權保護和科學數據共享是一對矛盾體,如果過分強調科學數據的知識產權保護將妨礙數據共享,但忽視數據知識產權保護將打擊數據生產者的積極性。國外有如CC0等政策規定,數據共享默認放棄所有相關法律權利,數據再使用者可以自由復制、修改、使用和分發科學數據,也可以用作商業目的。而國內尚沒有專門對科學數據共享活動加以規范的法律條例和管理辦法。因此建立科學數據共享管理方法的法律體系,明確規定數據共享核心知識產權,數據惡意使用后果責任承擔等是消除科研人員對數據共享風險認知的根本辦法,也是健康健全數據共享環境的法律保障。
(4)完善科學數據引用評價機制,提高數據共享增值效益。假設H7結果顯示感知有用性正向影響數據共享態度,即科研人員重視數據共享能夠帶來的利益,包括提高論文可信度、引用率,提高學科影響力等數據共享增值效益,且利益越高越好,科研人員數據共享的態度越積極。通過一系列措施增加數據共享增值效益,提高科研人員數據共享積極性,可以有效地促進科學數據共享發展。首先需要完善數據引用模式,理想的數據引用應與傳統文獻引用方式一樣,在參考文獻部分對數據進行引用標注;其次借鑒傳統文獻的計量方法,將數據引用排名納入科學評價體系,規范化數據共享增值效益評價機制;最后定期推出數據引用排名,數據影響因子排名、科研人員數據質量排名等一系列正規文件,明確數據共享科研影響力。
[1] Panton Principles-Principles for Open Data in Science[EB/OL].[2014-07-01].http://pantonprinciples.org/.
[2] Open Access policy concerning UNESCO publications[EB/OL].[2014-06-24].http://www.unesco.org/new/file admin/MULTIMEDIA/HQ/ERI/pdf/oa_policy_rev2.pdf.
[3] Adrian Mulligan.The effect of the internet on researcher motivations behavior and attitudes [J].Emerald Group Publishing Limited,2011,67(2):290-311.
[4] Borgman C L.Big data, little data, no data:The contested landscape of data sharing and reuse [EB/OL].[2014-06-24].http://works.bepress.com/borgman/275/.
[5] Carol Tenopir, Suzie Allard, Kimberly Douglass, Arsev Umur Aydinoglu, Lei Wu, Eleanor Read, Maribeth Manoff, Mike Frame.Data Sharing by Scientists: Practices and Perceptions[J].PLOS ONE.2011,(6):1-21.
[6] Philippa Broadley, Kerry Raymond.Researcher Attitudes to Data Sharing:Cultural Change Requires Better Motivations [EB/OL].[2014-06-24].http://eprints.qut.edu.au/53403/.
[7] Neela Enka.The user’s view on biodiversity data sharing——investigating facts of acceptance and requirements to realize a sustainable use of research data[J].Ecological Informatics,2012,(11):25-33.
[8] Heather A.Piwowar.Who Shares Who Doesn’t Factors Associated with Openly Archiving Raw Research Data[J].PLOS ONE,2011,(7):1-13.
[9張晉朝.我國高校科研人員科學數據共享意愿研究[J].情報理論與實踐,2013,36(10):25-30.
[10] Ajzen I.From intentions to actions: A theory of planned behavior[A].J.Kuhl&J.Beckmann(Eds.).Action control: From cognition to behavior[M].Heidelberg, Germany:Springer,1985:11-39.
[11] 段文婷,江光榮.計劃行為理論述評[J].心理科學進展,2008,16(2):315-320.
[12] 余莉.計劃行為理論的發展綜述[J].科教文匯,2008,(2):170.
[13] Davis F.D.,Perceived usefulness, perceived ease of use and user acceptance of information technology [J].MIS Quarterly.1989,13(3):319-339.
[14] Ajzen I.The theory of planned behavior[J].Organizational behavior and human decision processes.1991,50: 179-211.
[15] Karahana E,Straub D W, Chervany N L.Information technology adoption across time:a cross-sectional comparison of pre-adoption andpost-adoption beliefs[J].MIS Quarterly,1999,23 (2):183-213.
[16] Wicherts J M, Bakker M, Molenaar D.Willingness to share research data is related to the strength of the evidence and the quality of reporting of statistical results[J].PLoS ONE,2011, 6(11): e26828.
[17] Piwowar H A, Day RS, Fridsma DB.Sharing Detailed Research Data Is Associated with Increased Citation Rate [J].PLoS ONE,2007,2 (3): e308.doi:10.1371/journal.pone.0000308.
[18] Heather A.Piwowar , Wendy W.Chapman.A Review of Journal Policies for Sharing Research Data[C].Proceedings ELPUB 2008 Conference on Electronic Publishing,2008.
[19] 袁順波.科研人員采納自存儲的影響因素研究[J].圖書情報知識,2014,(2):72-83.
[20] 吳明隆.結構方程模型—AMOS的操作與應用[M].重慶:重慶大學出版社,2013.
[21] Nature[EB/OL].[2014-07-28].http://www.nature.com/authors/policies/availability.html.
[22] 何琳,常穎聰.國內外科學數據出版研究進展[J].圖書情報工作,2013,58(5):104-110.
[23] Creative Commons CC0[EB/OL].[2014-07-09].http://creativecommons.org/publicdomain/zero/1.0.
[24] 吳立宗,王亮緒,南卓銅,等.科學數據出版現狀及其體系框架[J].遙感技術與應用, 2013,28(3):383-390.