胡媛 王倩妮



摘? 要:[目的/意義]在第四研究范式下,大數據時代的來臨使得高校學生的科研數據需求日益旺盛,深入探究影響科研數據需求管理的關鍵因素組合,便于引導高校學生對科研數據需求進行管理,促使各環節下衍生出的數據需求規范化。[方法/過程]本文采用fsQCA方法對問卷數據進行處理,分析了技術、服務、情境、用戶因素在何種組合下,能夠促進科研數據需求管理的發生。[結果/結論]研究結果揭示了引致高校學生進行科研數據需求管理的3組構型,其中用戶因素在科研數據需求管理工作中最為關鍵。最后針對得到的條件組合提出相應建議,為落實科研數據需求管理相關工作提供啟示。
關鍵詞:高校學生;科研數據;fsQCA;數據需求管理;影響因素
DOI:10.3969/j.issn.1008-0821.2020.10.011
〔中圖分類號〕G25076? 〔文獻標識碼〕A? 〔文章編號〕1008-0821(2020)10-0104-09
Research on the Influencing Factors of Scientific Data
Demand Management of University Student
——Based on fsQCA Method
Hu Yuan? Wang Qianni
(School of Management,Nanchang University,Nanchang 330031,China)
Abstract:[Purpose/Significance]Under the fourth research paradigm,the advent of the era of big data makes the demand for scientific research data of college students increasingly vigorous.In-depth exploration of the key factors influencing the requirement for the data demand management can help guide college students to manage the demand of scientific research data and promote the standardization of data demand derived from each link.[Method/Process]In this paper,fsQCA method was adopted to process the questionnaire data.The combination of technology,service,context and user factors was analyzed to promote the occurrence of scientific research data demand management.[Result/Conclusion]The research results revealled three configurations that affected college students scientific research data demand management,among which the user factor was the most critical.Finally,corresponding Suggestions were put forward according to the obtained conditional configurations to provide enlightenment for the implementation of scientific research data demand management.
Key words:university student;scientific data;fsQCA;data demand management;influencing factors
在數據密集型科學研究范式的主導下[1],科研數據作為一種重要的學術資源,對高校學生從事日常學術活動的影響與日遞增。研究者在進行研究任務的各環節中不可避免地產生科研數據需求,并引發后續的數據搜尋、利用、共享等數據行為[2]。就目前的科研數據利用現狀來看,仍然存在科研數據資源冗余[3]、數據利用效率較低[4]、科研人員數據素養水平有限[5]等問題,導致高校學生的科研數據需求無法得到有效滿足。同時,高校學生尤其是碩、博士生,作為科學研究工作的重要參與主體,對其數據需求的管理尤為重要。
現有研究對于科研數據需求管理的探討較為有限,最為常見的是圍繞數據本身探討數據管理[6]、數據服務[7]、數據共享[8]等概念,力求從加強數據管理角度達成科研數據的增值,而往往忽略了數據需求這一根本性問題。要提高科研效率,維持科研數據的活力,必須引導高校學生根據實際情況調整自身數據需求,保證各階段各情境下的科研數據需求的有效性,使需求與研究目標精準匹配。與此同時,高校學生的科研數據需求管理受到多重因素作用,并非僅受個別因素的影響。因此,篩選出能夠觸發高校學生進行數據需求管理的關鍵因素,針對性地解決數據需求所衍生出的相關問題,促進高校科研工作高效開展和科研創新,是一個值得研究的重要科學問題。
因此,本文立足于高校學生的科研數據需求管理視角,通過定性比較分析方法,綜合分析影響數據需求管理的關鍵因素組合,找尋優化科研數據需求的最佳路徑,從而有效解決科研過程中出現的數據需求冗余、協調性差等問題。
本文使用fsQCA方法來檢驗技術、服務、情境、用戶4個解釋維度之間的關系以及它們如何共同影響科研數據需求管理過程。QCA的優勢在于能通過樣本間的充分比較和分析,提煉出多因素聯合影響既定對象的最佳組合形式。選定fsQCA展開后續研究,主要基于以下幾點考慮:1)傳統的數據分析方法聚焦于探討單變量對特定對象的影響程度和路徑,而fsQCA則可以有效處理多種因素的組合對結果的交互效應[24]。2)雖然多因素分析、聚類分析等方法也可以進行組態關系的研究,但并不能同fsQCA這樣去識別多種因素之間的依賴關系,產生隨機組合。3)fsQCA面向連續性變量,能夠準確量化界限模糊的條件因素。考慮到本研究中的影響因素存在中間狀態,因而選擇fsQCA方法對數據進行處理。
32? 量表設計
本實證研究基于先前理論研究展開,依據研究量表和相關參考文獻設計問卷。問卷采用李克特五點式量表進行調查,5表示“非常贊同”、3表示“中立”、1表示“非常不贊同”。其中1~3題項設置為統計參與調查人員的基本信息,第4~27題項為問卷主體部分,主要圍繞技術、服務、情境、用戶4個維度對科研數據需求管理的影響進行測量。最后一部分28~31題用來評定科研數據需求管理這一結果變量。
本研究將高校學生作為科研主體對象,主要由以下原因決定:一是在科研過程中,碩、博士生等高校學生為主要的科研參與者,涉及到實際性數據操作時,往往學生是第一手實施者;二是在提倡本科生創新創業教育背景下,本科生積極參與科研活動已是大勢所趨。為確保問卷題項是合理有效的,在發放問卷之前對相關科研工作者展開預調研,并對問卷內容進行了初步調整。
33? 數據收集
問卷自2019年5月份發放到8月份回收,期間通過線上調查的方式收集到200份數據樣本,其中剔除掉35份填寫時間過短和題項答案重復率過高的無效樣本,有效樣本為165份。數據調研對象為長期從事科研活動的博、碩士研究生以及部分參與科學研究、擁有科研項目經歷的本科生。數據來源于多個省市地域和不同學科的高校學生,保證了樣本數據的隨機性,將研究樣本的人口統計學信息展示如表2所示。
4? 數據處理與分析
41? 信效度檢驗
在進行定性比較分析步驟前,要先對問卷數據進行信度和效度檢驗。對問卷進行信度檢驗的目的是驗證各測量題項對于同一維度因子的內部一致性,一般用Cronbachs α系數、組合信度值(CR)和平均萃取平方差值(AVE)來表示問卷信度的高低。效度分析是對問卷總體的有效性進行觀察,分析理論上的構念結構是否與得到的測量結果相對應。效度越高意味著測量結果越接近預期達到的目標,通常可以通過內容效度和結構效度來觀察問卷的總體效度。
411? 信度檢驗
本文采用Cronbachs α系數來測量問卷信度,其中Cronbachs α系數大于07為可接受的臨界值,大于09視為信度很好,系數越趨近于1表明問卷設置越可靠。本文使用SPSS220分析樣本得到各分量表和總量表的Cronbachs α系數如表3所示,結果顯示,各維度因子的Cronbachs α系數均大于07,處于可接受范圍。
412? 效度分析
在正式發放問卷前已參考相關科研人員意見進行修改,故問卷的內容效度達到要求,采用因子分析法檢驗問卷的結構效度。同樣在SPSS220中對數據進行分析,表4結果顯示:KMO值為0840大于07,Bartlett球體檢驗顯著性水平為0000小于005,因此適合做因子分析。通過對問卷進行探索性因子分析,運行結果表明大部分指標在各因子上的負荷大于05,個別指標低于05及在2個因子以上的負荷值均大于05,應視為問卷的無效項剔除,最終保留表5中16個題項作為測量指標。從表5可以看到,總體上各變量之間區別效度較高,對應相同變量的不同題項之間也呈現出較好的聚合效度。
42? 變量校準及編碼
在進行組態分析之前,需要對問卷數據進行校準操作,以便將樣本數據歸為不同的集合隸屬。本研究在設計測量問卷時選用了李克特五點量表,必須相應地轉換成0~1之間的隸屬刻度[25]。我們首先計算題項T1、T2、T3的均值作為技術變量的原始數據,同理得到服務、情境、用戶、科研數據需求管理各變量的原始數據。再通過fsQCA30軟件對整合后的數據進行Calibrate校準處理,校準依據應結合理論知識和實際情況而定。本文借鑒Ragin C C[26]構建的3個校準臨界值:完全隸屬值(095),最大模糊值(05),完全不隸屬(005),運用Calilibrate程序處理原始值后得到最終變量校準結果(見表6)。由于樣本量較大,因此只展示部分樣本校準后的數據。
5? 結果分析
51? 單變量必要性分析
對單項條件變量分別進行必要性檢驗,一致性不低于09的條件變量為必要條件[27],運行fsQCA30進行變量的必要性分析。如表7所示,只有用戶因素的一致性高于09,成為影響科研數據需求管理的必要條件,其余條件的一致性都低于09,不構成必要條件。
52? 構建真值集
對數據進行組合和構型分析,在fsQCA30軟件中析出真值表集合,應共獲得2k種因果組合(k為條件變量個數)。根據Ragin的研究方案,將一致性閾值設定為08,案例閾值設置為3(使保留的有效案例不低于75%),滿足閾值的條件組合所構成的真值表如表8所示。表中組態指出了樣本中前因條件相互組合引致多重并發現象的可行路徑,能夠說明何種組合下最有可能激發高校學生數據需求管理的意愿。fsQCA 30軟件可得出復雜解、簡單解、中間解3種析出結果,中間解能夠較好地平衡理論與實際事實的出入,因此本研究選定中間解作為研究結果。本文采用Fiss P C的結果呈現形式[24],●代表核心條件存在,●代表邊緣條件存在,空白表示該條件出現或缺乏均可,表9處理結果中未出現所代表的核心條件缺失和所代表的邊緣條件缺失。
從表9中可以看出,有3種條件組合滿足要求,分別是技術*服務*用戶、技術*情境*用戶和服務*情境*用戶,對案例的總體覆蓋度達到8526%。其中,組態3的一致性最高,這意味著該條件組合是導致科研數據需求管理行為發生的最優路徑。具體結果分析如下:
1)組態1指出,促進高校學生數據需求管理的主要條件為技術、服務和用戶3種因素的組合。技術、服務因素貫穿在一系列的科研數據操作環節中,作為外界驅動條件會間接影響到科研主體數據需求的變化,而用戶因素則是從內部最根本地改變高校學生對自身數據需求的認知。內外共同作用之下,會極大推動高校學生對科研任務中的數據需求進行適配性調整。
2)組態2說明了外部技術因素和人員從事科研活動所處的情境以及人員自身因素都會致使高校學生對數據需求進行管理,這是由科研數據需求的動態特征和個性化分布所決定的。首先,高校學生執行科研任務過程中不斷衍生出新的數據需求,必須依托于技術手段來滿足。高校學生的數據需求能否與技術工具完美地匹配,決定了科研數據需求的有效性。相應地,高校學生因自身知識構造、感知能力不同,在不同情境下作出的需求反饋也各有所異。由此這3個維度構成的組態成為影響高校學生管理自身數據需求的主要路徑之一。
3)組態3表示在高校學生完成科研任務過程中,服務因素連同情境因素和用戶自身屬性最為顯著地影響了自身的數據需求管理意愿。服務是高校學生實現數據需求轉化為行為的重要支撐,情境致使高校學生的數據需求發生動態變化。此外,數據需求產生和改變時,高校學生的內部知識體系、感知能力等用戶屬性起到支配作用。科研主體為滿足因研究任務產生的數據需求時,利用各項個性化服務和知識服務對龐大復雜的數據資源進行篩選組織,并會根據應用情境整合為對自身而言利用價值高的數據集。因此,服務、情境和用戶因素也是導致高校學生進行數據需求管理的強有力條件集。并且從一致性大小可以看出,組態3是導致高校學生調整各階段科研數據需求的最優組合。
4)3種構型中均包含了用戶因素,說明用戶自身屬性對高校學生數據需求管理的影響較為關鍵,驗證了它作為核心條件的存在。用戶因素之所以如此顯著地影響到高校學生對數據需求的管理意愿和強度,主要與高校學生的數據需求受到用戶感知的調節和個人特質的影響有關。從用戶感知層面上看,用戶通過各種平臺數據庫搜尋和利用科研數據,期間產生有用性、易用性和滿意度的認知,而認知結果決定了用戶對數據的認可和利用程度,最終影響到用戶的實際需要。從個人特質層面上,高校學生具有學科特性,不僅擁有不同的專業知識和數據素養,個人所產生的自我效能感也有所差異。這些用戶屬性因素直接映射到具體研究任務中科研主體所產生的數據需求,決定了高校學生對數據的需求內容以及需求強度。
6? 結果分析與建議
在科研活動中數據需求的產生和迭代不可避免,要從根本上保證科研數據需求有效轉化為數據行為,必須從多角度捕捉科研數據需求管理的關鍵動因,從而聚焦到科研數據需求管理工作之中的重點,才能提升科研數據在學術研究中的價值。
本文借助fsQCA這一方法揭示出影響高校學生科研數據需求管理的關鍵路徑,分別為:1)技術、服務、用戶;2)技術、情境、用戶;3)服務、情境、用戶。研究結果表明。用戶因素涵括在引致結果發生的3種主要的條件組合中,成為驅動高校學生進行數據需求管理的核心條件,該研究結果與先前理論研究結論存在一致性,對用戶維度是科研數據需求管理的關鍵影響因素這一研究結論起到驗證作用。用戶因素顯著影響高校學生的數據需求產生以及階段性變化,用戶個人特質和用戶感知使得高校學生的數據需求呈個性化分布,各科研主體之間因學科背景、感知能力等存在差異,產生的數據需求并不相同,隨外界條件的改變對科研數據需求所作出的調整也大為不同。而情境因素主要作為外部刺激引起數據需求的變化或驅動需求的產生,其中任務情境和移動信息情境是科研活動的主要情境屬性,主要由高校學生團隊協作情況、科研活動涉及的學科領域、數據資源的表現形式等要素構成,高校學生的數據需求與各情境要素密切相關。技術因素和服務因素為數據需求管理提供外部支撐,作為科研數據需求管理活動中的工具與手段,主要發揮輔助性作用。因此,它們對科研數據需求管理的影響效果不如用戶因素顯著。最后,針對得到的構型組態,本研究提出以下建議:
1)重點關注高校學生的屬性特征,拓寬科研數據的應用范圍。科研數據需求管理的目標是使科研數據創造出更大的價值,必須深入挖掘高校學生的數據需求,識別并激發出數據需求方的深層需求,加強數據資源的可重用性。同時,通過對高校學生的學科屬性、知識結構和感知能力等展開跟蹤,形成數據需求層面的用戶畫像,不僅能夠規范化單個科研主體的數據需求,還可映射到協同群體之中,使得科研數據需求管理工作更加高效化。
2)通過相關技術手段加強對高校學生的數據需求動態變化的掌握。科研主體的數據需求管理活動扎根于科研情境之中,根據不同的情境要素,如科研任務的履行難度及緊迫性、數據資源的屬性和呈現形式不同,科研主體隨之衍生出的數據需求存在差異。將情景感知技術、協同算法等引入到數據需求管理工作中,能夠多維度多方位地識別不同階段下科研主體的數據需求,幫助科研主體及時、全面、精準地進行彈性調整,最大限度地滿足高校學生各研究環節下對數據的需要。
3)服務提供商應提供嵌入式服務與科學的技術工具,服務與技術應嵌入用戶知識環境,提供商應參與用戶知識創新的過程之中。可通過構建大數據資源體聯盟,建立起全面完善的元數據資源庫,為用戶提供集組織、查詢、儲存、共享等功能于一體的服務機制。通過技術和服務等手段的干預,引導科研用戶及時調整數據需求,使得高校學生所獲取的數據都被有效利用,發生有助于科研活動的數據行為。
參考文獻
[1]Hey T.The Fourth Paradigm-Data-Intensive Scientific Discovery[M].E-Science and Information Management.Springer Berlin Heidelberg,2012.
[2]洪程,錢鵬.高校研究生科學數據需求與利用行為調查分析——以東南大學為例[J].國家圖書館學刊,2014,23(1):16-21.
[3]王翠萍,李佳潞.國外高校圖書館科學數據服務現狀與啟示——以五所高校圖書館為例[J].圖書館工作與研究,2017,(10):31-36.
[4]孟祥保,常娥,葉蘭.數據素養研究:源起、現狀與展望[J].中國圖書館學報,2016,42(2):109-126.
[5]沈婷婷.數據素養及其對科學數據管理的影響[J].圖書館論壇,2015,35(1):68-73.
[6]魏悅,劉桂鋒.基于數據生命周期的國外高校科學數據管理與共享政策分析[J].情報雜志,2017,36(5):153-158
[7]遲玉琢,王延飛.國外高校科研數據服務需求識別模型特點與啟示[J].圖書情報工作,2016,60(4):37-43.
[8]Si L,Xing W,Zhuang X,et al.Investigation and Analysis of Research Data Services in University Libraries[J].The Electronic Library,2015,33(3):417-449.
[9]胡媛,艾文華.工程化視角下的科研數據需求管理模型構建[J].情報雜志,2019,38(3):187-193.
[10]Gregory K,Groth P,Cousijn H,et al.Searching Data:A Review of Observational Data Retrieval Practices[J].2017.
[11]Tenopir C,Sandusky R J,Allard S,et al.Research Data Management Services in Academic Research Libraries and Perceptions of Librarians[J].Library & Information Science Research,2014,36(2):84-90.
[12]Gao J,Yang H.Information Search Model Based on Ontology and Context Aware Technologies[M].Information Computing and Applications.Springer Berlin Heidelberg,2010.
[13]Eltabakh M Y,Aref W G,Elmagarmid A K.A Database Server for Next-generation Scientific Data Management[C]//IEEE International Conference on Data Engineering Workshops.IEEE,2010.
[14]徐永麗,李秀英.網絡環境中用戶信息需求障礙分析[J].圖書館理論與實踐,2004,(6):24-25.
[15]宋雪雁,王萍.信息采納行為概念及影響因素研究[J].情報科學,2010,28(5):760-762,767.
[16]張晉朝.高校科研人員科學數據獲取意愿研究[J].情報雜志,2013,32(6):70-75,106.
[17]Katriina Bystrm,Murtonen K,Kalervo Jrvelin,et al.Task Complexity Affects Information Seeking and Use[J].Information Processing & Management,1995,31(2):191-213.
[18]Si L,Xing W,Zhuang X,et al.Investigation and Analysis of Research Data Services in University Libraries[J].The Electronic Library,2015,33(3):417-449.
[19]Tenopir C,Sandusky R J,Allard S,et al.Research Data Management Services in Academic Research Libraries and Perceptions of Librarians[J].Library & Information Science Research,2014,36(2):84-90.
[20]Kim,Youngseek.Fostering Scientists Data Sharing Behaviors Via Data Repositories,Journal Supplements,and Personal Communication Methods[J].Information Processing & Management,2017,53(4):871-885.
[21]胡媛,艾文華,胡子祎,等.高校科研人員數據需求管理影響因素框架研究[J].中國圖書館學報,2019,45(4):104-121.
[22]Longest K C,Vaisey S.Fuzzy:A Program for Performing Qualitative Comparative Analyses(QCA)in Stata[J].The Stata Journal,2008,8(1):79-104.
[23]鄧勝利,付少雄.定性比較分析(QCA)在圖書情報學中的應用——以網絡社區健康信息搜尋影響因素研究為例[J].情報理論與實踐,2017,40(12):23-28,11.
[24]Fiss P C.A Set-Theoretic Approach to Organizational Configurations[J].The Academy of Management Review,2007,32(4):1180-1198.
[25]Mendel J M,Korjani M M.Theoretical Aspects of Fuzzy Set Qualitative Comparative Analysis(fsQCA)[J].Information Sciences,2013,237(Complete):137-161.
[26]Ragin C C.Set Relations in Social Research:Evaluating Their Consistency and Coverage[J].Political Analysis,2006,14(3):291-310.
[27]Skaaning S E.Assessing the Robustness of Crisp-set and Fuzzy-set QCA Results[J].Sociological Methods & Research,2011,40(2):391-408.
(責任編輯:孫國雷)