999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CiteSpace5.5R2的時空大數據挖掘
——以中國知網地理信息系統學科文獻為例

2022-04-29 10:17:24張澳兵雷盼榮
測繪工程 2022年3期
關鍵詞:分析研究

田 靜,李 剛,張澳兵,譚 粵,雷盼榮

(1.黑龍江工程學院 測繪工程學院,哈爾濱 150050;2.長安大學 地質工程與測繪學院, 西安 710054)

隨著我國北斗衛星導航定位技術、天空地一體化、互聯網+和通信網絡等技術的不斷發展,地球表面上的特征、人和物都成為了可表征的地理時空大數據。隨著“大數據時代”的到來,從數量龐大的科研文獻中精簡知識體系、挖掘學科研究熱點、總結發展研究規律、追蹤學科研究動態,是研究地理信息系統發展趨勢的重要任務。在當今大數據的時代背景下,不同于以往的基于人工設計或傳統方法獲取,文中以時空大數據挖掘技術對地理信息系統文獻“量化”(數據化)并進行深入推理,采用文獻計量學、計算機可視化分析、定性和定量相結合的主要研究方法,并結合中國知網10 a間收錄的文獻數據,為地理信息系統的研究脈絡及前沿熱點的預測與分析奠定了良好的數據基礎[1]。

1 時空大數據挖掘技術

1.1 時空大數據技術概述

時空大數據的挖掘與分析是一個復雜的過程,根據現有的地理信息系統文獻數據類型,文中采用基于圖論鏈接關系的自動聚類算法,通過網絡收集與下載、編程爬取、預處理篩選重分類等時空大數據挖掘方法來獲得相應的樣本文獻數據[2]。最后,通過對文獻年度發表數量變化趨勢進行統計分析,利用關鍵詞、發文機構、核心作者人物關系等指標進行科研合作網絡分析,并對上述分析結果進行統計和整合[3]。同時,利用引文空間軟件的結構性和時間性等特殊指標,將原來的聚類生成時態視圖并加以分析,多方面展現不同聚類發展演變的時間脈絡和研究進程。

1.2 分析表達與解釋

將2010—2020年10 a間中國知網收錄的以“地理信息系統”為主題的文獻作為樣本,提取出這些文獻的標識符詳細信息(包含題名、作者、單位、文獻來源等相關數據)。使用Excel,Python等工具對樣本文獻進行分類、去重等數據預處理工作,將處理后的數據存入數據庫。隨后,運用CiteSpace5.5R2、ArcGIS10.6軟件對文獻進行聚類分析、共被引分析、科研合作網絡分析等操作,將分析結果使用時間線圖譜、地理信息空間地圖等可視化方式呈現并解讀。

CiteSpace5.5R2軟件(引文空間)是一款應用于科學文獻中分析和可視化科學發展新動態及新趨勢的Java程序[4]。結合中國知網收錄的數據,借助于科學知識圖譜相關的研究方法對其進行文獻計量化分析。首先,確定研究領域并收集該領域內的關鍵詞及專業知識、術語、常識等相關數據;其次,通過該軟件提取樣本數據中有關研究領域的前沿術語、熱點關鍵詞等,建立合理的圖譜分析解讀機制[5];最后,利用計算機算法對樣本數據進行時區分割、科研合作網絡分析,選擇恰當的閾值,進行數據的可視化表達,具體軟件使用流程如圖1所示。

圖1 CiteSpace5.5R2軟件使用流程

2 數據獲取

文中所述的文獻數據是由中國知網(CNKI)提供的。首頁勾選“學術期刊”,通過“高級檢索”功能,將搜索需要用到的主題限定為“地理信息系統”,將發表時間限定在 2010—2020年,精確匹配檢索,最后在其檢索數據中篩選出“中文核心期刊和 CSSCI 來源期刊”,以便對這10 a間地理信息系統領域研究發展情況進行更好的統計分析,得到2 914條結果。使用Excel和Python篩選出恰當的數據,最終得到2 821篇與文中有關的學術論著。

2.1 研究對象界定

文中地理信息系統文獻數據研究用于分析該學科在單一主題的不同發展階段的演變趨勢。在時空大數據挖掘的基礎上,通過定性、定量或定性定量相結合的方法來架構不同關鍵詞之間的關聯,在此基礎上對地理信息系統的發展趨勢進行探討[6]。

2.2 數據建庫

為了能夠快捷、高效并安全地處理、管理大量的文獻數據,使用MySQL數據庫存儲處理后的文獻數據。最后將所有文獻數據導入CNKI數據表中,完成數據的前期準備。CiteSpace5.5R2軟件將可視化圖譜中的節點和連線存儲為.net文件,從而可以利用Pajek或UCINET進行知識網絡圖譜的繪制[7]。

3 數據挖掘與分析

為了滿足研究需要,在進行數據分析前,需要對存在缺失值和重復值的數據進行剔除。最后將所有數據按照發布時間進行重排序,并添加新的列索引,按照行號建立唯一值索引。

3.1 論文發表時間趨勢分析

關于地理信息系統領域文獻發表時間與發文量之間的關系,如圖2所示。由圖可知,自 2011 年以來,地理信息系統領域的發文量總體呈緩慢下降趨勢,論文整體的發表數量不斷減少。另外,從整體刊載數量上看,最能反映地理信息系統前沿的核心文獻研發數量與全部文獻相比非常的不樂觀,表明我國對于地理信息系統的學術研究較少,重視程度不夠。這與該領域內的研究人群相對分散、人員數量匱乏是直接相關聯的,期望能有更多的研究人員以新的研究理論、研究視角進一步對地理信息系統學科做出高標準、高水平、高質量的研究成果。

圖2 發文量年度變化趨勢圖(2010—2020年)

3.2 合作作者網絡分析

運行 CiteSpace5.5R2軟件,時間切片是1 a,結點類型選擇作者,TOP N=50,其他參數為默認設置。以 2010—2020年的時間跨度分析,排序方法主要是按照類團當中組織成員的人數,結點越大表明該作者科研成果的信息控制和輸出能力越強,如圖3所示。

圖3 樣本文獻作者關系網絡圖譜

在作者合作網絡分析的基礎上,過濾篩選前9個大小的網絡合作類團,調圖繪制得到圖4作者間研究關鍵詞聚類分類。

圖4 作者間研究關鍵詞聚類分類

以上大數據表明,通過與多位學者合作,尤其是通過各大高校之間的強強聯合,能夠產生極其龐大的影響力,也能創造出非凡的學術成果。因此,我國地理信息系統研究學者需要加強對地理信息系統領域多學科、多中心、跨領域的合作研究與開發,逐漸建立起以核心作者為學術共同體或中堅力量的共現網絡,科研能力較強的學術機構要加強對相對弱的機構的合作指導并帶動其發展。

3.3 研究機構共現分析

研究機構是針對某研究領域不斷發展的重要載體,對促進學術交流、成果共享、資源互補等起著重要的導向作用。運用CiteSpace5.5R2軟件的LLR算法篩選過濾,可以直觀地了解到機構對地理信息系統研究領域的重視程度和影響力的分布情況,繪圖調整得到圖 5 機構網絡共現圖譜[8]。

由圖5可知,節點最大的3個機構分別是中國科學院大學(包括地理科學與資源研究所、研究生院)、武漢大學測繪遙感信息工程國家重點實驗室和南京師范大學虛擬地理環境教育部重點實驗室[4]。整理了發文量位于第一位的機構與其他機構的合作群落及其發文量年度趨勢圖,如圖6、圖7所示。

圖5 機構網絡共現圖譜

圖6 機構合作網絡圖譜(以2010—2020年間中國科學院大學為例)

圖7 發文量年度趨勢圖(以2010—2020年間中國科學院大學為例)

3.4 關鍵詞共現分析

關鍵詞共現是提取該文獻所能表達其核心內容的關鍵詞或主題詞詞頻的多少分布,用于研究該領域的研究熱點,判斷其發展動向[9]。利用CiteSpace5.5R2軟件,通過結果輸出可以看到包含節點479個和連線數302條,過濾器篩選引文數量最多的前20個,可視化至明顯的結構后生成圖譜并進行網絡剪裁,調整圖譜得到圖8。

圖8 關鍵詞共現網絡圖譜

3.5 關鍵詞聚類分析

在關鍵詞共現圖譜的基礎上,根據CiteSpace5.5R2軟件中默認的算法自動聚類,選取 LLR 算法,其他參數設置與機構參數保持一致,調整圖譜[10]。文中通過合并整理展示前7位關鍵詞,間接反映了我國地理信息系統領域內的研究前沿的熱點,如表1所示。

表1 關鍵詞聚類與合并(前7位)

3.6 突顯率與時態演進分析

突發性探測是指1個變量的值在短時間內激增,突然變成熱點,被學術界所關注,可以理解為“百度指數”[11]。文中選擇前24個的項目,并按照“開始年份”“爆發強度”因素降序排列,通過調整默認的伽馬值取值范圍,得到表2。由于突顯率具有延續性,因此如果該點在 2020 年也是紅色的,該點有能力在未來幾年繼續成為前沿的研究熱點,也是廣大學者值得關注的一個技術分支,例如建筑信息模型(BIM)、地理環境、時空分布、空間自相關等。

表2 關鍵詞突顯率(前24位)

利用Timeline View功能進行時態分析,合理調整坐標軸的行間距,展示前10個聚類,調整圖幅得到圖9,即TOP10關鍵詞研究熱點時間線圖譜,使其更加清晰地展現出地理信息系統領域研究熱點的發展歷程。如圖9所示,交叉線最多的是地理信息系統和遙感,說明這兩個結點經常與其他研究方向有交流合作的研究。

圖9 TOP10關鍵詞研究熱點時間線圖譜

3.7 熱力分析

文中用ArcGIS10.6軟件中的熱力分析工具統計的數據密度來直觀表現并驗證文獻研究的空間熱力分布[12]。首先,在數據庫中找到符合實驗主題的點數據,從其屬性表中設置符合成圖風格的屬性,之后將基于該屬性進行熱力分析。檢核分析結果,如圖10所示是樣本數據熱力分析的結果,疏密有致,符合預期。

圖10 熱力分析

4 結束語

利用CiteSpace5.5R2和ArcGIS10.6軟件,對中國知網中2010—2020年以地理信息系統為主題的樣本文獻作上述分析,得出如下結論與建議:

1)采用的基于圖論鏈接關系的自動聚類算法,彌補了傳統的聚類算法,如K均值算法、EM算法等都是建立在凸球形的樣本空間上,在樣本空間不為凸時,算法會出現局部最優這一缺陷[13]。

2)地理信息系統與新興技術的結合始終是一個熱點話題,我國地理信息系統已經應用到不同的領域解決相關的問題,其內涵和外延正在不斷變化[14]。這10 a間的應用研究表明地理信息系統領域在社會發展建設中依然有著很好的前瞻性和借鑒性。但近幾年來特別是在地理信息系統領域,研究有走向衰弱的趨勢。

3)地理信息技術呈現一些新的發展趨勢:一是多類型公開產品的在線服務。二是從數據服務到知識服務。隨著大數據、數據庫、人工智能等軟件技術的成熟運用,以及相應的硬件技術的發展,我國已逐漸認識到深度挖掘時空大數據、提取地理空間知識的重要性,相繼推出了面向空間數據整合與分析的服務平臺。需要不斷溫故知新、創新思路,要充分關注以學科為核心的信息技術變化與更新。在當前大數據時代背景下,旨在通過時空數據建立起將地理信息、測繪和通信服務融合為一體的共享系統,實現立足于數據驅動的技術科學發現和決策支撐平臺。

4)近5 a內,“研究所、技術研究中心、重點實驗室”等機構在我國高校的地理信息系統領域內具有較強的科學研究和輸出能力。通過人才引進等渠道,有針對性地選擇和進行人才引入,將自己所在高校的人員,進行有目標性的培養和派遣到其相應的知名學者或機構下,實現交流和學習的整體性融合推進,以此來進一步促使我國大學生對地理信息系統領域研究的整體性推進。

5)文中研究主要針對10 a間中國知網收錄的地理信息系統相關文獻進行發展趨勢的分析和預測,拘于樣本數據的有限性,缺少除中文核心外其他文獻數據的支撐,未能建立起全面的發展脈絡分析和預測模型。由此發現,文中結論適用于近10 a來的發展情況,但不適用于橫向對比,因此有待于進一步的深入研究。

猜你喜歡
分析研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
新版C-NCAP側面碰撞假人損傷研究
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 91精品国产自产在线老师啪l| 91色在线观看| 伊人AV天堂| 亚洲妓女综合网995久久| 亚洲中文无码av永久伊人| 亚洲精品va| 久久国产精品嫖妓| 国产成人高清在线精品| 国产无遮挡裸体免费视频| 囯产av无码片毛片一级| 国产在线专区| 婷婷亚洲视频| 日本爱爱精品一区二区| 91香蕉国产亚洲一二三区 | 亚洲欧美精品日韩欧美| 中文字幕第1页在线播| 欧美在线精品怡红院| 成人精品视频一区二区在线| 无码内射中文字幕岛国片| 国产精品原创不卡在线| 亚洲色图欧美一区| 亚洲一欧洲中文字幕在线| 亚洲第一黄色网址| 久久久久亚洲精品无码网站| 亚洲青涩在线| 中文字幕亚洲综久久2021| 好紧太爽了视频免费无码| 亚洲AV色香蕉一区二区| 亚洲日本一本dvd高清| 99国产精品国产| 免费A级毛片无码免费视频| 国产精品免费电影| 亚洲欧洲日产国码无码av喷潮| 第九色区aⅴ天堂久久香| 欧美高清国产| 日本欧美在线观看| 婷婷色婷婷| 国产黑丝一区| 亚洲欧美日韩成人高清在线一区| 五月婷婷精品| 成人另类稀缺在线观看| 天堂久久久久久中文字幕| 色男人的天堂久久综合| 婷婷亚洲视频| 日本爱爱精品一区二区| 免费一级毛片在线观看| 精品国产网| 国产精品冒白浆免费视频| 国产成人91精品| 亚洲人精品亚洲人成在线| 国产欧美日韩视频一区二区三区| 日韩欧美国产成人| 玩两个丰满老熟女久久网| 国产精品女主播| 中文字幕亚洲精品2页| 亚洲,国产,日韩,综合一区| 大乳丰满人妻中文字幕日本| 99精品视频九九精品| 免费激情网址| 无码啪啪精品天堂浪潮av| 伊人天堂网| 99伊人精品| 亚洲成人黄色网址| 无遮挡国产高潮视频免费观看| 精品国产成人av免费| 99福利视频导航| 欧美一区精品| 国产日韩欧美黄色片免费观看| 99视频国产精品| 国产乱子伦精品视频| 青青青视频免费一区二区| 制服无码网站| a级高清毛片| 欧美一区二区三区国产精品| 亚洲日韩精品伊甸| 全免费a级毛片免费看不卡| 国产激情在线视频| 国产精品亚洲一区二区三区z| 免费Aⅴ片在线观看蜜芽Tⅴ| 亚洲欧美另类视频| 91久久大香线蕉| 国产精品久久自在自2021|