999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國內外數據素養研究的文獻計量分析

2020-01-19 03:33:56余維杰陳思琪中山大學資訊管理學院
圖書館理論與實踐 2019年12期
關鍵詞:圖書館素養研究

余維杰,陳思琪,陳 序(中山大學資訊管理學院)

1 引言

“數據素養”(Data Literacy),也稱“數據信息素養”(Data Information Literacy),其概念最早起源于國外,由信息素養引申、細化而來。數據素養是指在科學數據的采集、組織和管理、處理和分析、共享與協同創新利用等方面的能力,以及在數據的生產、管理和發布過程中的道德與行為規范。[1]與信息素養相比,它更側重于數據的生產、保存與管理等技術性強的方面,測度體系也更關注對結果的評價。[2]

數據素養的重要性日益顯著,業界對其重視程度也越來越高,數據素養在學術領域的研究成果不斷涌現,研究熱度也不斷上升。早在2001年,英國學者大衛·鮑登(Bawden David)發表了關于信息和圖書館領域中用詞研究的文獻。[3]隨后,以數據素養為研究主題的學術文獻不斷涌現,這些研究成果主要圍繞用戶數據行為、數據素養與圖書館領域的關系、數據素養與醫療健康領域的關系、數據素養的培養等主題展開討論。但是,這些研究成果基本上都側重于對某一主題的深入探討,只有少數成果涉及對數據素養研究進行整體的評述和分析。

在我國,最早的數據素養研究論文是2011年發表的《論物理教育中數據素養的培養》,文章深入探討了信息時代中數據素養和物理教學的關系。[4]隨后,數據素養受到學者越來越多的關注。從目前的研究成果來看,我國對數據素養領域的研究分析更側重對數據素養的內涵、構成要素的分析,對用戶數據素養的培養探討,以及對數據素養與圖書館的關系探討,[5]它們都側重于對某一主題的數據素養研究進行定性的解讀剖析。在國內眾多數據素養領域的研究成果中,只有少數研究成果是從定量的角度進行剖析與解讀,數據素養研究的定量分析存在較大空缺。

因此,本文采用文獻計量法,對國內外數據素養領域內文獻進行統計分析和比較研究,從定量和定性雙重角度總結其成果和研究態勢,為數據素養領域更深層次的應用研究提供參考。

2 數據來源與研究方法

2.1 數據來源

在國內文獻數據方面,文章以CNKI(中國知網)數據庫為數據來源。檢索式為:(關鍵詞=“數據素養”or“數據信息素養”)or(題名=“數據素養”or“數據信息素養”)or(主題=“數據素養”or“數據信息素養”),進行精確匹配檢索,時間跨度為2018年及以前,一共檢索到文獻503篇。經刪除重復、通知、簡訊、報導等非學術文獻以及與主題弱相關的文章,最終得到有效樣本文獻462篇。將這462篇文獻的題錄數據以EndNote格式和Excel格式導出,為后續的數據分析研究做準備。

在國外文獻數據方面,以WebofScience的SCI-E和SSCI作為數據來源。檢索式為Topic=(“Data Liter acy” or(Data and“ Information Literacy”) or Title=(“Data Literacy”or(Data and“Information Literacy”)),檢索語種為英語,最終得到有效樣文文獻473篇。

2.2 研究方法

文獻計量法是從定量的角度出發,對文獻體系和文獻計量特征進行分析的研究方法。其分析對象主要有文獻數量、作者分布、期刊分布等外部特征和關鍵詞分布等內容特征。本文主要采用文獻增長規律分析、來源期刊載文情況分析、作者發文情況分析和關鍵詞分析,借助 Excel、文獻題錄分析工具SATI、SPSS和UCINET等統計工具,對數據素養領域的研究現狀和發展趨勢進行定量研究。

3 數據素養研究的文獻計量分析

3.1 文獻增長規律分析

文獻增長規律能在一定程度上反映出某個研究領域的發展狀況。文獻邏輯增長模型提出文獻增長包括三個階段:早期階段呈指數增長;中期階段增長率開始變小,出現轉折點;后期文獻累積量增加緩慢并且趨于一個極限值。[6]

從圖1可以看出,我國數據素養領域的相關研究始于2011年,隨后發文量呈現逐年快速增長趨勢,截至2018年底,已有462篇公開發表的文獻。根據文獻計量學理論中的文獻指數增長規律,對2011-2018年CNKI收錄的數據素養領域研究的累積發文量進行曲線擬合,發現可用指數函數y=1.8812e0.7309x擬合,決定系數R2的值為0.9857,表明此函數曲線可描述累積發文量隨時間增長的情況。從擬合曲線走勢來看,我國的數據素養研究文獻現處于早期的增長階段,尚未到達文獻邏輯增長模型中的增長率減小階段。由此可知,未來國內學者對數據素養領域的研究熱度依然會呈上升趨勢。

圖1 CNKI收錄的數據素養研究文獻的年代分布

圖2 是國外數據素養研究文獻的年代分布,早在2001年就有國外學者發表了關于信息和圖書館領域用詞研究的文章,[3]隨后4年的發文量都為個位數,增長較為緩慢。總體來看,國外數據素養領域的研究呈現出一直平穩增長的趨勢,并沒有出現類似我國發文量快速增長的情況。此外,國外數據素養研究文獻與文獻指數增長模型或文獻邏輯增長模型的符合度較低,無法用指數函數曲線擬合分析。但發現其更符合冪函數的曲線特點,可用冪函數y=0.8816x2.1343擬合,決定系數R2的值為0.9943。從圖2呈現的數據節點分析,國外學者對數據素養領域研究的熱度呈現階段性變化,2008年、2009年、2013年、2017年的發文量均分別比其前一年的發文量低,但隨后會出現小幅度的增長。由此可以推測,國外數據素養領域研究的文獻數量每4年或5年為一個增長階段,每一個階段內呈現先逐步增長再有所下降的態勢,而階段之間呈現總體增長態勢。

3.2 來源期刊分布

通過對某領域學術文獻的來源期刊進行分析,可以掌握該領域的核心期刊,了解該領域的空間分布特點。

圖2 SCI-E、SSCI收錄的數據素養研究文獻的年代分布

經統計發現,國內關于數據素養研究的462篇文獻分布在245種期刊中,平均每種期刊刊載文獻1.89篇。在這245種期刊中,發表1篇文獻的有174種,發表2篇的有36種,發表3篇的有9種,發表4篇的有7種,發表5篇及以上的共有19種。而國外關于數據素養研究的473篇文獻分布在145種期刊中,平均每種期刊刊載文獻3.26篇。在這145種期刊中,發表1篇文獻的有92種,發表2篇的有19種,發表3篇的有9種,發表4篇的有1種,發表5篇及以上的共有24種。表1為國內外數據素養領域載文量最多的前12種期刊,綜合對比來看,國外數據素養領域期刊的刊均發文量更高,原因是數據素養研究起源于國外,且國外研究的時間更長。

表1 國內外發文量排名前12的期刊及載文量

文獻計量學中的布拉德福分散定律描述了科技論文在期刊中的分布規律,運用此定律,結合本研究的樣本數量,將來源期刊按照其刊載的文獻數量進行降序排列,并且劃分出4個區域(核心區、相關區、弱相關區、非相關區),使每個區內期刊載文量約為全部期刊載文量的1/4,并且盡量使核心區、相關區、弱相關區、非相關區含有的期刊數量滿足1:n:n2:n3的比例關系。[7]表2為中英文期刊進行區域劃分后的結果。可見,無論是中文文獻還是英文文獻,布拉德福常數n僅對于前三個區域的描述程度較高,說明依據布拉德福定律能較為準確的得出刊載數據素養領域研究文獻的核心區期刊。從表2還可以看出,與國內相比,國外數據素養領域的文獻更明顯地集中在少數期刊中,形成的核心區期刊群更穩定,進一步體現出國外的數據素養領域研究更成熟。

表2 中英文期刊區域分析法劃分

3.3 作者發文情況分析

洛特卡定律描述了科學工作者和科學論文產量之間的數學規律,核心思想可表述為:發表x篇文章的作者數量是發表1篇文章作者數量的1/x2,且發表1篇文章的作者數是全體作者的60%左右。[8]利用此規律可以對某領域的作者發文情況進行分析。

表3展示了國內外數據素養領域作者發文量的情況。經統計,國內的462篇文獻共涉及572位作者,其中發文量1篇的作者有484人,占作者總數的84.62%;發文量2篇的作者有57人,約為發文1篇作者數的11.78%;發文量3篇的作者有16人,約為發文1篇作者數的3.31%。而國外的473篇數據素養文獻共涉及1,052位作者,其中發文量1篇的作者有950人,占作者總數的90.30%;發文量2篇的作者有59人,約為發文1篇作者數的6.21%;發文量3篇的作者有25人,約為發文1篇作者數的2.63%。

表3 作者發文量統計

綜合對比來看,國內外數據素養領域發表1篇文章的作者為絕大多數,都超過作者總數的80%,遠高于洛特卡定律中提出的60%。由此表明,國內外數據素養領域研究的發展處于上升階段,核心作者群還未形成。此外,國內數據素養領域每篇文獻平均約由1.24位作者完成,國外數據素養領域每篇文獻平均約由2.22位作者完成,說明在數據素養領域,國外論文合著情況較國內更顯著。

表4列舉了國內外數據素養領域主要發文作者的發文量及其所屬單位,可以看出,無論是國內還是國外,大學學者都是數據素養領域研究的主力軍。

表4 國內外主要發文作者所屬單位及發文量

3.4 關鍵詞分析

研究將收集到的文獻題錄信息導入SATI,提取文章的關鍵詞并且進行關鍵詞詞頻統計。詞頻按從高到低排序,從中文文獻中截取詞頻大于7的關鍵詞,得到23個高頻關鍵詞(見表5);從英文文獻中截取詞頻大于6的關鍵詞,得到25個高頻關鍵詞(見表6)。

表5 國內數據素養研究高頻關鍵詞(詞頻>7)

表6 國外數據素養研究高頻關鍵詞(詞頻>6)

為了后續進行因子分析、系統聚類分析以及社會網絡分析,把獲取到的中文和英文文獻題錄信息分別導入SATI,利用其直接生成矩陣,分別得到國內外數據素養研究的高頻關鍵詞共詞矩陣、高頻關鍵詞相關矩陣、高頻關鍵詞相異矩陣。

3.4.1 因子分析

因子分析是一種在變量中找出隱藏的具有代表性因子的統計分析方法,目的是用盡可能少的因子描述眾多指標間的聯系,基本思想是把研究對象變量分組,使同組內的變量相關性較高,不同組的變量相關性較低。[9]

將生成的高頻詞相關矩陣導入SPSS,選擇主成分法、協方差矩陣、最大平衡值法對其進行因子分析,得到因子數和涵蓋的信息量表,以及各因子成分。結合本次分析的樣本數量,參考統計學慣例,規定在本次分析中旋轉后因子的絕對值大于0.5才被接受。

根據分析結果,從23個中文高頻關鍵詞中提取出10個因子,它們能解釋全部信息的50.287%。由表7可知,第一個因子主要解釋了數據素養和大數據,第二個因子主要解釋了高校圖書館和信息素養,第三個因子主要解釋了數據素養教育和科學數據,第四個因子主要解釋了MOOC和信息素養教育,第五個因子主要解釋了科研數據管理,第六個因子主要解釋了圖書館和互聯網+,第七個因子主要解釋了數據分析和科學數據素養,第八個因子主要解釋了教育大數據和數據管理,第九、第十個因子分別解釋了大數據時代和教師專業發展。

從25個英文高頻關鍵詞中提取出10個因子,它們能解釋全部信息的50.050%。由表8可知,第一個因子主要解釋了信息和素養,第二個因子主要解釋了行為和信息搜尋,第三個因子主要解釋了學生和學習,第四個因子主要解釋了信息檢索和情報研究,第五個因子主要解釋了循證實踐和護士,第六個因子主要解釋了學術圖書館和圖書館員,第七個因子主要解釋了教育,第八個因子主要解釋了圖書館和尼日利亞,第九個因子主要解釋了數據素養和健康素養,第十個因子主要解釋了研究。

中文高頻關鍵詞的因子分析結果顯示,提取到的10個因子中,存在過半的因子主要解釋了數據素養領域教育方面的問題,每個因子之間相關性較高,可見我國當前數據素養的研究熱點集中于此。此外,通過第二個因子的解釋,可以看出圖書館,尤其是高校圖書館與用戶的數據素養培養密切相關。而通過對英文高頻關鍵詞的因子分析可發現,提取到的10個因子里,同組因子內關鍵詞相關性較高,不同組因子之間相關性較低。總體來看,國外數據素養領域的研究范圍較我國更分散,主要分布在圖書館職能與角色、與數據相關的行為、校內教學、在線學習等方面。

表7 國內數據素養研究高頻關鍵詞旋轉成分矩陣

表8 國外數據素養研究高頻關鍵詞旋轉成分矩陣

3.4.2 系統聚類分析

系統聚類分析能夠利用高頻關鍵詞反映某學科或主題的研究熱點,定量反映出詞與詞之間的親疏關系,進而反映這些詞所代表的主題內容的結構。[10]

本研究將生成的中英文高頻詞相異矩陣分別導入SPSS,選擇組內連接法,采用Minkowski距離對其進行系統距離分析,分別得到中文高頻詞聚類樹狀圖(圖3)和英文高頻詞樹狀圖(圖4)。

圖3 國內數據素養研究的高頻關鍵詞系統聚類樹狀圖

圖4 國外數據素養研究的高頻關鍵詞系統聚類樹狀圖

從圖3可以看出,在數據素養領域,國內數據素養研究文獻的23個高頻關鍵詞可聚為4類。第1類:數據素養、大數據、信息素養、圖書館、教育、MOOC、大數據時代、圖書館員、信息素養教育、高校教師、數據新聞;第2類:教育大數據、教師專業發展;第3類:科學數據、素養教育、數據管理、高校;第4類:高校圖書館、數據素養教育、科研數據管理、科學數據素養、互聯網+、數據分析。根據系統聚類結果可以發現,隨著大數據時代的到來,對數據素養提出了更高的要求,并且主要集中在教育方面,尤其是針對高校師生以及科研人員的數據素養培養。此外,圖書館與數據素養也呈現出緊密關系,圖書館在培養用戶數據素養中起著非常重要的作用,也承擔著相應的職責。在大數據時代,提升數據素養不僅是對高校師生及科研人員提出的要求,也是對圖書館員、新聞工作者提出的要求,大數據已經全面滲透到各個行業、各個領域,數據素養是每個企業甚至每個員工應該具備的一種專業素養。

從圖4可以看出,國外數據素養領域研究文獻的25個高頻關鍵詞可聚為4類。第1類:信息、素養、評定、因特網、研究;第2類:圖書館、尼日利亞、學術圖書館、圖書館員、高校圖書館、高等教育、數據素養;第3類:學生、學習、信息檢索、情報研究、高中、健康素養;第4類:循證實踐、護士、在線學習、信息搜尋、行為、信息素養、教育。根據系統聚類結果不難發現,國外數據素養領域研究,主要集中于用戶數據行為、數據素養與圖書館領域的關系、數據素養的培養等方面。可見圖書館以及學校都在培養用戶數據素養的過程中擔任非常重要的角色。此外,醫療健康領域也強調了數據素養的重要性。

對比國內外數據素養領域的高頻關鍵詞聚類結果,發現以下特點。① 國外數據素養領域研究的涉及面更廣泛,具體包括了各級學校教育、各類圖書館、用戶數據行為、醫療健康領域等;而國內更多集中在高校教育和科研層面。② 國外對學生數據素養的培養從更早的階段開始(第3類聚類結果中出現關鍵詞“高中”);而國內更多強調的是高校學生的數據素養培養。原因是國外已經形成較為系統的數據素養培養體系,而國內尚未形成完備的教育體系。[11]③ 國外在數據素養領域研究中更重視具體行為,對數據行為的研究更細化,如高頻關鍵詞中出現的循證實踐、在線學習、信息檢索等;國內對具體數據素養相關行為的探討較少,在高頻關鍵詞中未有具體體現。但是,國內外數據素養領域研究仍存在一些共同點。① 國內外都認為圖書館對用戶數據素養的培養和發展起著非常重要的作用。② 數據素養都體現在除教育科研外的其他領域,國內對新聞工作者提出了數據素養要求,國外在醫療健康領域強調了數據素養的重要性。

3.4.3 社會網絡分析

社會網絡分析是由社會學家根據數學方法以及圖論發展而成的定量分析方法。[12]度中心度(Degree Centrality)是在社會網絡分析中描述節點中心性的最直接度量指標,它表示一個關鍵詞與其他關鍵詞相聯系的程度,關鍵詞的中心度越高說明該關鍵詞在整個研究網絡中就越重要。[13]結合關鍵詞的中心度,可將社會網絡分析應用于分析某學科或某主題中關鍵詞之間的關系,發現當前研究熱點,推測未來研究趨勢。

將高頻詞共現矩陣導入社會網絡分析軟件UCINET中,再通過可視化軟件NetDraw選擇節點大小,依據中心度大小進行顯示,生成用于分析高頻關鍵詞中心度的網絡。圖5為國內數據素養研究的高頻關鍵詞中心度分析網絡,圖6為國外數據素養研究的高頻關鍵詞中心度分析網絡。在圖5和圖6中,一個節點代表一個關鍵詞,節點越大說明該關鍵詞的中心度越高,與其他關鍵詞聯系緊密,在該分析網絡中越重要。表9和表10分別為利用UCINET分析而得的國內外數據素養研究的高頻關鍵詞中心度排序。

由圖5可知,在國內數據素養研究中,圖書館和數據素養教育在整個關鍵詞網絡中占據著主導地位,并且數據素養教育和圖書館之間聯系也非常緊密。由此可以發現,我國數據素養領域當下的研究熱點集中于領域相關的教育以及圖書館在其中擔任的角色。通過分析邊緣節點發現,在大數據時代,無論是圖書館員還是高校師生(尤其高校教師),都要提升自身數據素養,圖書館員和教師還要擔當培養學生數據素養的重任。此外,大規模開放在線課程MOOC的出現和興起正好順應了互聯網+時代的用戶需求,可推測其研究熱度會不斷上升。[14]

由圖6可知,在國外數據素養研究中,與教育和各級圖書館相關的關鍵詞也占據整個網絡的主要位置。此外,體現數據素養相關行為的關鍵詞也在網絡中占據一定位置,如信息檢索、循證實踐、信息搜尋、在線學習等。可見,與國內相比,國外數據素養領域的研究熱點更廣,不僅包括學校教育及圖書館職能,更強調了在學習或科研過程中數據素養行為的具體表現,在線學習的普及率更高。通過研究關鍵詞網絡邊緣節點還發現,關鍵詞“評估”(Assessment)的中心度在所有關鍵詞中位于中等偏上的位置,可推測國外數據素養的教育中更注重反饋。[15]

圖5 國內數據素養研究的高頻關鍵詞中心度分析網絡

圖6 國外數據素養研究的高頻關鍵詞中心度分析網絡

表9 國內數據素養研究的高頻關鍵詞中心度

表10 國外數據素養研究的高頻關鍵詞中心度

4 結論

(1)從文獻數量及年代分布來看,我國的數據素養研究領域現處于早期的增長階段,發展速度較快,可以推測未來國內學者對此的研究熱度會呈上升趨勢;而國外學者對數據素養領域的研究已進入相對穩定的階段,呈現出約每五年為一個周期的階段性增長。

(2)從文獻來源期刊分布來看,國內外數據素養領域都已形成較為穩定的核心期刊群。與國內相比,國外數據素養領域期刊的刊均發文量更高,文獻更明顯地集中在少數核心期刊群中,體現出國外數據素養領域的發展較為成熟。

(3)從作者發文情況來看,無論是國內還是國外,數據素養研究領域中發文量1篇的作者占絕大多數。目前主要發文作者所屬機構主要是高校,但國內外都暫未形成穩定的核心作者群。此外,國外論文合著情況較國內更顯著。

(4)從關鍵詞來看,通過因子分析、系統聚類分析和社會網絡分析,發現國內外數據素養研究領域的以下特點。① 共同點。無論是國內還是國外,圖書館對培養用戶數據素養的重要性都得到了肯定,同時學校教育也在培養學生數據素養的過程中擔任重要角色。此外,數據素養的重要性不僅僅體現在教育科研中,其他領域也對相應工作者提出了數據素養要求,如國內的新聞工作領域、國外的醫療健康領域。② 不同點。第一,國內數據素養領域的研究更多集中在高校教育和科研層面;而國外相關研究的涉及面更廣泛,具體包括了各級學校的數據素養教育、各類圖書館的職能和角色、用戶具體的數據行為、醫療健康領域與數據的關系等。第二,國內更多強調的是高校學生的數據素養培養;而國外對學生數據素養的培養從更早的階段開始(高頻詞中多次出現高中)。此外,國內對具體數據素養相關行為的探討較少;而國外在數據素養領域研究中更重視具體行為,對數據行為的研究更細化,如高頻詞中出現的循證實踐、在線學習、信息檢索等。

(5)從總體上看,國內外數據素養領域的研究仍在不斷發展中。相對而言,國外的數據素養研究更成熟、數據素養實踐更多樣。因此,構建和完善數據素養教育體系、豐富數據素養具體行為是我國數據素養研究未來的重要發展方向,也是不斷提高用戶信息素養、適應大數據時代發展的重要舉措。

猜你喜歡
圖書館素養研究
FMS與YBT相關性的實證研究
遼代千人邑研究述論
必修上素養測評 第四測
必修上素養測評 第三測
必修上素養測評 第八測
必修上素養測評 第七測
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
主站蜘蛛池模板: 国产一级在线播放| 中文字幕 欧美日韩| 毛片视频网址| 久久人搡人人玩人妻精品一| 日韩a级毛片| 亚洲天堂久久久| 又黄又湿又爽的视频| 啪啪国产视频| 国产免费好大好硬视频| 久久人妻系列无码一区| 国产一区在线视频观看| 91精品国产91久久久久久三级| 在线观看欧美国产| 欧美在线三级| 精品国产亚洲人成在线| 欧美啪啪一区| 五月天综合婷婷| 亚洲精品国产精品乱码不卞| 五月婷婷欧美| 亚洲精品午夜无码电影网| 人妻丰满熟妇αv无码| 中文字幕 91| 伊人色综合久久天天| 乱人伦99久久| 国产一级在线观看www色| 波多野结衣无码视频在线观看| 久久精品91麻豆| 欧美19综合中文字幕| 久久精品午夜视频| jizz国产视频| 色综合婷婷| 欧美日韩国产高清一区二区三区| 欧美日韩中文字幕二区三区| 毛片三级在线观看| 1024你懂的国产精品| 欧美日韩国产综合视频在线观看| 毛片视频网址| 91精品综合| 午夜一区二区三区| 国产精品13页| 国产不卡一级毛片视频| 欧美精品高清| 广东一级毛片| 亚洲无码高清免费视频亚洲| 99精品一区二区免费视频| 青青操国产| 丝袜高跟美脚国产1区| 无码专区国产精品一区| 国产精品网曝门免费视频| 999国内精品久久免费视频| 久久国产高清视频| 亚洲欧美另类中文字幕| 欧美午夜视频在线| 国产专区综合另类日韩一区| 国产免费看久久久| 999在线免费视频| 日本午夜三级| 啪啪啪亚洲无码| 人妻夜夜爽天天爽| 蝴蝶伊人久久中文娱乐网| 一本色道久久88综合日韩精品| 色久综合在线| 国产香蕉国产精品偷在线观看| 亚洲网综合| 日韩精品一区二区三区大桥未久| 91毛片网| 综合天天色| 手机在线免费不卡一区二| 男女男免费视频网站国产| 亚洲欧美日韩精品专区| 久久这里只有精品2| 日韩高清一区 | 欧美性天天| 久久亚洲精少妇毛片午夜无码| 久久网欧美| 欧美日一级片| 性视频一区| 露脸一二三区国语对白| 日韩欧美国产精品| 一区二区影院| 国产亚洲精品自在线| 欧美精品高清|