999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基礎研究領域知識圖譜研究前沿的可視化分析

2021-10-15 09:28:48陳雅丹杜元朱爽趙欣然孫娜李心怡胡燁胤李新龍
海南醫學 2021年19期
關鍵詞:可視化研究

陳雅丹,杜元,朱爽,趙欣然,孫娜,李心怡,胡燁胤,李新龍

1.北京中醫藥大學,北京 100029;

2.北京中醫藥大學東方醫院,北京 100078;

3.北京中醫藥大學東直門醫院,北京 100700

知識圖譜(Knowledge Graph)一詞在1972 年即已經被提出[1],隨著2012年谷歌知識圖譜的發布,特定領域的知識圖譜構建成為研究熱點問題,并逐漸滲透到金融、工業和醫學領域[2]。知識圖譜的本質是連接實體間關系的圖,即揭示實體之間關系的語義網絡[3],在實現知識可視化的同時,也可以挖掘知識單元或知識群之間隱含的復雜關系[4]。知識圖譜技術作為新一代人工智能的關鍵通用技術[5],在推動人工智能從感知智能向認知智能的跨越中扮演著重要角色。國家自然科學基金(national natural science foundation of China,NSFC)作為我國資助基礎研究的主體之一,其所資助的項目在一定程度上代表了國內基礎研究領域的熱點和方向。本文通過對NSFC在知識圖譜研究資助項目的分布情況、研究熱點及前沿的計量分析,系統梳理了基礎研究領域知識圖譜技術的研究進展。

1 資料與方法

1.1 數據來源在NSFC 官網[6]立項項目中,以“知識圖譜”、“知識地圖”為關鍵詞檢索相關研究,檢索時間1997至2019年。

1.2 數據預處理(1)數據庫建立:將檢索結果分批導入到Excel 軟件,提取立項項目標題、所屬學部、項目類型、項目編號、項目金額、負責人、單位、批準年份等信息。(2)項目初篩及預處理:首先根據項目標題剔除與知識圖譜無關的項目。對項目單位信息進行預處理,將同一大學或科研院所附屬研究所統一合并為該大學或科研院所,如“中國科學院北京基因組研究所、中國科學院沈陽自動化研究所、中國科學院大連化學物理研究所”統一為“中國科學院”。(3)主題詞提取及預處理:對納入項目的標題進行分詞處理,在分詞處理時遵循以下原則:①拆分,最小完整意義拆分,保留具有實際意義的最小完整詞匯,如“異質信息網絡的多粒度表示與知識獲取方法研究”拆分為“異質信息網絡、多粒度、知識表示、知識獲取”;②剔除,剔除標題中部分通用表述或無特定含義的詞匯,如知識圖譜、機制、研究、關系、作用;③統一,對同一含義的主題詞統一為多數研究采用的表述,英文縮略詞統一為相應的中文表述,如“DEA”統一為“數據包絡分析”;④合并,將同一研究領域內的具體分子物質、通用技術等合并為其上級概念,如“知識抽取”、“知識發現”等相同概念統一為“知識獲取”。

1.3 主題詞共現分析及可視化(1)數據格式轉換:將完成預處理的項目信息表(.xlsx) 整理為“CNKI-EndNote 格式”,另存為“制表符分隔的文本(.txt)”文件后將制表符替換為空格,將每條題錄最后增加兩空行,將項目信息表轉換成可視化軟件VOSViewer (Version 1.6.15)[7]可讀取的文章題錄信息形式:%0 Journal Article;%A 辜麗川;%+安徽農業大學;%T 基于知識圖譜的農業大數據碎片化知識發現方法研究;%D 2017;%K 農業;大數據;碎片化知識;知識發現;%W CNKI。(2)主題可視化網絡構建及聚類:將“.txt”題錄文件導入VOSViewer 軟件,構建主題詞可視化網絡,采用軟件網絡聚類算法進行聚類分析。VOSViewer網絡聚類算法類似于Modularity方法(公式1),能夠實現聚類內部各元素間較高的相似性,不同簇間存在較高的相異性。

公式中,Wij=2m/cicj,ci為元素i 所屬的聚類,δ (ci,cj)表示的方程值為1 (若ci=cj)或0;γ為聚類的分辨率,γ越大則得到的聚類越多,分類就越細。(3)主題詞時間疊加網絡:在上述主題詞網絡的基礎上,以主題詞出現的平均年度為依據,構建主題詞時間疊加網絡。將主題詞可視化網絡及時間疊加網絡導出為“.png”格式。

2 結果

2.1 一般情況描述自1997—2019 年,共檢索到立項項目2 069項,剔除無關項目后共納入141個項目,總資助金額8 916.5 萬元,共涉及9 種項目類型(表1),其中面上項目、聯合基金項目、青年科學基金項目是主要立項類型,共計123項(88%),資助總額6 860萬元(76.93%),見圖1和圖2。

圖1 各年度項目立項項目數分布

圖2 各年度項目立項總金額分布

表1 立項項目類型及金額分布

納入項目主要分布在7 個學部,立項項目數目及資助金額前3 位的學部為信息科學部、地球科學部和管理科學部(表2),其中信息科學部立項項目94 項(66.67%),資助金額6 698萬元(75.12%)。17個知識圖譜研究涉及生命醫學內容,在學科領域分布上,中醫學領域7 項,藏醫學1 項,現代醫學6 個,生命科學3項;分布在醫學科學部8 項、生命科學部4 項、信息科學部4項,管理科學部1項。

表2 各學部立項項目及金額分布

納入項目分布在81家單位,資助金額前3位的單位為中國科學院,浙江大學和中國人民大學(表3),三家單位共立項項目16 項(11.40%),資助金額2 065 萬元(23.16%)。

表3 各單位立項項目及金額分布(前10位)

2.2 主題詞分析納入項目共包含274 個主題詞,共出現頻次486 次,出現頻次前10 位的主題詞包括:圖譜構建(36,7.4%)、大規模(12,2.5%)、模型(11,2.3%)、大數據(11,2.3%)、關系推理(10,2.1%)、圖譜查詢(8,1.6%)、文本(8,1.6%)、中醫學(7,1.4%)、語義網絡(7,1.4%)、個性化(7,1.4%)。構建主題詞的可視化網絡(圖3),對其進行聚類分析并構建時間疊加網絡(圖4)。主題詞可視化網絡(圖3)中,節點代表主題詞,主題詞頻次越高,節點直徑越大;節點間的連線表示兩主題詞在同一項目標題中出現,共同出現頻次越高,連線越粗(下同)。節點的顏色用于表示不同聚類,顏色相同的節點屬于同一聚類,納入主題詞共分為5個亞類,聚類一(紅色)圍繞知識圖譜技術模型,主要涉及“模型、大規模、關系推理、圖譜查詢、圖譜分析、圖譜補全、分布式”等主題詞;聚類二(綠色)以圍繞醫學領域知識圖譜應用,主要涉及“中醫學、醫學、可視化、深度學習、知識發現”等主題詞;聚類三(藍色)圍繞圖譜構建,主要涉及“文本、語義網絡、動態、時空”等主題詞;聚類四(黃色)圍繞人工智能,主要涉及“個性化、推薦、自動化、智能化、機器人、在線”等主題詞;聚類五(紫色)圍繞數據應用,主要涉及“大數據、社交媒體、社交優化”等主題詞。主題詞時間疊加網絡(圖4)中,節點顏色表示該主題詞出現的時間,每個主題詞的出現時間為其所在項目立項年度的平均值(下同),從圖中可以看出,“模型、主題模型、知識發現、圖譜分析、時空、人工知識”等主題詞為早期研究熱點,“云制造、深度學習、強化學習、神經網絡、體制、嵌入式、多源數據、多目標協同”等主題詞為目前研究前沿熱點。對納入研究的17 個生命醫學相關項目主題詞進行亞組分析,構建主題詞可視化網絡(圖5),共計62 個主題詞,出現87 次,其中“中醫學(7,8%)、醫學(6,6.9%)、圖譜構建(4,4.6%)、古籍(3,3.4%)、知識發現(3,3.4%)”為出現頻次前5 位的主題詞。上述主題詞可分為5個亞類,其中聚類一(紅色)圍繞現代醫學,主要涉及“生物、知識庫”等主題詞;聚類二(綠色)圍繞中醫學,主要涉及“古籍、知識發現、可視化、本體”等主題詞;聚類三(藍色)圍繞圖譜技術,主要涉及“圖譜構建、非完整數據、個性化”等主題詞;聚類四(黃色)圍繞體質研究,涉及“體質、動態”等主題詞;聚類五(紫色)圍繞針灸研究,涉及“針灸知識、古代、框架”等主題詞。

圖3 納入項目主題詞可視化網絡

圖4 納入項目主題詞時間疊加網絡

圖5 生命醫學領域項目主題詞可視化網絡

主題詞時間疊加網絡(圖6)提示“醫學、決策模型、群智能、關系推理、圖神經網絡、知識補全、健康社區、體質、動態”等主題詞為目前研究前沿熱點。

圖6 生命醫學領域項目主題詞時間疊加網絡

3 討論

從NSFC 在知識圖譜研究資助課資助力度來看,自2003 年起不同類型項目的立項數量及總資助金額呈現波動中增長的趨勢,其中青年科學基金項目在立項數量方面總體增長態勢較為明顯,但資助金額整體水平并不高,平均資助金額有限;面上項目在項目數量及資助總額呈現穩步增長趨勢,是NSFC 在知識圖譜資助的主要類型。根據NSFC“十三五”發展規劃[8],將科學基金資助格局調整為探索、人才、工具、融合四大系列,在知識圖譜領域立項項目主要分布在探索系列和人才系列,近幾年主要資助融合系列及探索系列項目,工具系列的研究一直偏少。從立項項目學部分布情況來看,信息科學部為知識圖譜的熱點學部,相交于其他學部NSFC 立項項目和金額數占據絕對優勢。在生命科學和醫學科學部,也可看到知識圖譜相關研究立項,但目前資助力度還處于較低水平,個別生命醫學領域知識圖譜研究立項在其他學部。從立項項目單位分布情況來看,知識圖譜領域NSFC 的26.95%支持在前10位的單位,其中中國科學院的立項項目數目及基金總量均位于首位,其次為浙江大學與中國人民大學,一定程度上反映出NSFC 項目對研究基礎的要求相對較高。

在研究關鍵詞分析方面,限于項目公示信息的限制,本研究根據立項項目標題進行了主題詞的拆分和預處理,雖然一定程度上引入了新的偏倚風險,但考慮研究標題對一個NSFC 項目的重要性,以其作為研究主題分析數據源,還是能夠最大程度上保留研究的原意。從研究主題詞分布來看,“知識獲取、創新、企業”等主題詞頻率遠遠高于其他主題詞,這也反映出NSFC資助基礎研究的戰略定位。對知識圖譜領域高頻主題詞的聚類分析提示,目前NSFC 在知識圖譜領域資助的項目主要圍繞圖譜技術模型、醫學應用、圖譜構建、人工智能、數據應用等形成了五大熱點研究領域,根據主題詞的時間疊加網絡圖(圖4),可以清晰的看出,主題詞平均出現時間主要集中在2014—2019年,這與本時段NSFC 立項項目數量整體較高有關,“云制造、深度學習、強化學習、神經網絡、體制、嵌入式、多源數據、多目標協同”等成為我國基礎研究領域知識圖譜研究前沿。在生命醫學領域內,圍繞現代醫學、中醫學、針灸、體質、圖譜技術形成五個研究熱點領域,其中“醫學、決策模型、群智能、關系推理、圖神經網絡、知識補全、健康社區、體質、動態”為當前研究前沿。

從目前NSFC在知識圖譜研究資助項目分布情況來看,資助項目數量波動式上升,資助金額總量變化較大,研究主題豐富度逐漸增加,主要分布在探索系列和人才系列研究,融合系列有明顯提升,工具系列研究依舊薄弱,學科交叉型及成果轉化型研究有待進一步提高。知識圖譜研究已經滲透到金融、工業和醫學領域,對知識圖譜的定量和定性特征的科學理解已經成為大數據、智能化時代科學研究中一個基礎性研究方向。在醫學特別是中醫學領域有著廣闊的應用前景,目前已在中醫百科系統、中醫智能問答、臨床輔助決策、數據挖掘分析領域進行了很多有益的嘗試[2],但目前我國基礎研究領域知識圖譜研究仍偏于技術應用層面,知識圖譜關鍵基礎技術研究有待進一步加強深化。

猜你喜歡
可視化研究
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
FMS與YBT相關性的實證研究
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
2020年國內翻譯研究述評
遼代千人邑研究述論
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
主站蜘蛛池模板: 欧美日韩另类在线| 一级一级一片免费| 久久国产高清视频| 在线看国产精品| 国产精品不卡永久免费| 蜜臀AV在线播放| 国产在线观看99| 污网站在线观看视频| 午夜a视频| 国产区成人精品视频| 亚洲精品无码在线播放网站| a天堂视频| AV老司机AV天堂| 四虎精品国产永久在线观看| 9cao视频精品| 丰满少妇αⅴ无码区| 色有码无码视频| 18禁黄无遮挡免费动漫网站| h网站在线播放| 国模沟沟一区二区三区| 美女被操黄色视频网站| 九九线精品视频在线观看| 国产电话自拍伊人| 精品撒尿视频一区二区三区| 欧美激情第一欧美在线| 精品少妇人妻无码久久| 亚洲综合中文字幕国产精品欧美| 国产午夜福利亚洲第一| 国产成人无码综合亚洲日韩不卡| 乱人伦中文视频在线观看免费| 欧美日韩v| 亚洲精品成人福利在线电影| 亚洲黄网在线| 亚洲日韩AV无码精品| 亚洲人网站| 免费A级毛片无码无遮挡| 国产va欧美va在线观看| 色男人的天堂久久综合| 国产高清国内精品福利| 强乱中文字幕在线播放不卡| 天天色天天综合| 国产综合色在线视频播放线视| 国产综合在线观看视频| 很黄的网站在线观看| 亚洲侵犯无码网址在线观看| 99热这里都是国产精品| 亚洲综合色吧| 久久久黄色片| 亚洲狠狠婷婷综合久久久久| 欧美69视频在线| 久久精品国产亚洲麻豆| 国产又爽又黄无遮挡免费观看| av在线手机播放| 女人毛片a级大学毛片免费| 99热亚洲精品6码| 精品国产女同疯狂摩擦2| 在线精品欧美日韩| 在线看免费无码av天堂的| 亚洲无码不卡网| 少妇精品久久久一区二区三区| 在线精品亚洲国产| 亚洲综合狠狠| 日本欧美成人免费| 国产精品开放后亚洲| 2024av在线无码中文最新| 婷婷成人综合| 无码一区二区三区视频在线播放| 视频一区亚洲| 亚洲人成网站观看在线观看| 亚洲AⅤ无码国产精品| 天天操天天噜| 日韩无码黄色网站| 九九九久久国产精品| 在线a视频免费观看| 91伊人国产| 91人妻日韩人妻无码专区精品| 免费人成黄页在线观看国产| 国产精品久久国产精麻豆99网站| 蜜桃臀无码内射一区二区三区 | 毛片在线播放网址| 亚洲欧洲AV一区二区三区| 亚洲愉拍一区二区精品|