999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文獻(xiàn)機(jī)構(gòu)作者數(shù)據(jù)的交互式可視化模型

2019-04-08 00:46:38申航
現(xiàn)代計(jì)算機(jī) 2019年6期
關(guān)鍵詞:可視化方法研究

申航

(四川大學(xué)計(jì)算機(jī)學(xué)院,成都610065)

0 引言

隨著學(xué)術(shù)界的日益發(fā)展,人們的受教育水平日益提高,越來(lái)越多的人開始進(jìn)入研究領(lǐng)域。而當(dāng)一個(gè)初學(xué)者開始在其領(lǐng)域內(nèi)進(jìn)行探索時(shí),往往是盲目的,他需要能夠直接地了解到本領(lǐng)域內(nèi)頂尖地機(jī)構(gòu)和學(xué)者,基于文獻(xiàn)機(jī)構(gòu)作者數(shù)據(jù)的交互式可視化面臨新的挑戰(zhàn)和機(jī)遇。

在獲取頂尖機(jī)構(gòu)和作者方面,人們對(duì)科研機(jī)構(gòu)在科學(xué)領(lǐng)域的產(chǎn)出和影響力方面的比較越來(lái)越感興趣,這一趨勢(shì)的一個(gè)跡象是不斷出版的大學(xué)排名,因此我們需要根據(jù)發(fā)文數(shù)量、被引量等數(shù)據(jù)對(duì)機(jī)構(gòu)作者進(jìn)行評(píng)估排序,以獲取領(lǐng)域內(nèi)頂尖的機(jī)構(gòu)作者,以便用戶進(jìn)行學(xué)習(xí)跟蹤。

在機(jī)構(gòu)作者合作方面,在現(xiàn)代科學(xué)中,科學(xué)家已經(jīng)成為共同點(diǎn):“有大量的證據(jù)表明研究合作已經(jīng)成為科學(xué)和技術(shù)研究各個(gè)領(lǐng)域的常態(tài)?!睂?duì)機(jī)構(gòu)作者的合作網(wǎng)絡(luò)進(jìn)行研究能夠讓用戶找到相似的領(lǐng)域機(jī)構(gòu)作者,并能讓用戶對(duì)某一作者的合作演化進(jìn)行跟蹤,從中發(fā)現(xiàn)一些有趣的聯(lián)系。

目前主流的文獻(xiàn)可視化工具有Cite Space、Google Scholar Metrics、Keshif等。通過(guò)調(diào)研,我們發(fā)現(xiàn)存在以下問(wèn)題:

(1)功能不夠完備,只具有展示作者信息或者領(lǐng)域研究信息等某一方面的功能;

(2)信息利用不充分,在對(duì)機(jī)構(gòu)或作者進(jìn)行分析時(shí)沒(méi)有考慮到所有屬性;

(3)視圖過(guò)于混亂,對(duì)于用戶來(lái)說(shuō)認(rèn)知負(fù)擔(dān)大,且體驗(yàn)較差。

針對(duì)上述情況,本文從兩個(gè)方面提出了文獻(xiàn)機(jī)構(gòu)作者數(shù)據(jù)的可視化方法設(shè)計(jì),包括合著網(wǎng)絡(luò)可視化方法、關(guān)鍵詞文本可視化方法。然后本文從數(shù)據(jù)特點(diǎn)、可視化映射考慮,完成了對(duì)兩種可視化方法的實(shí)現(xiàn)。

1 可視化模型構(gòu)建

1.1 數(shù)據(jù)描述

本文實(shí)驗(yàn)采用的數(shù)據(jù)集為1991-2016年IEEE VIS上發(fā)表的論文數(shù)據(jù)。數(shù)據(jù)來(lái)源于http://www.vispubdata.org/site/vispubdata/,數(shù)據(jù)預(yù)先包含的字段為conference、year、paper_title、paper_doi、link、author_name、author_affiliation、author_keywords。數(shù)據(jù)集總共包含約2000篇論文,從Vispubdata網(wǎng)站上下載csv格式的文件后導(dǎo)入到MySQL數(shù)據(jù)庫(kù)中。

表1 論文數(shù)據(jù)集描述

1.2 可視化任務(wù)描述

T1.作者合著網(wǎng)絡(luò)分析。單個(gè)作者無(wú)法獨(dú)自完成一篇論文的撰寫。在各個(gè)學(xué)者于他人合作的過(guò)程中,漸漸地形成了一張合作網(wǎng)。分析合著網(wǎng)絡(luò)能夠發(fā)現(xiàn)許多有趣的合作模式。該任務(wù)可分解為如下問(wèn)題:

Q3.如何發(fā)現(xiàn)學(xué)術(shù)水平較高地學(xué)者?如,分析者希望找到學(xué)術(shù)水平較高的學(xué)者進(jìn)行論文學(xué)習(xí)。

Q4.如何發(fā)現(xiàn)合著網(wǎng)絡(luò)中的學(xué)術(shù)團(tuán)體?如,分析者希望通過(guò)單個(gè)高水平作者發(fā)現(xiàn)其處于的學(xué)術(shù)團(tuán)體,對(duì)團(tuán)體中的其他個(gè)體進(jìn)行跟蹤學(xué)習(xí),從而拓寬學(xué)習(xí)視野。

Q5.如何對(duì)作者的合作關(guān)系的演化過(guò)程進(jìn)行分析?如,通過(guò)對(duì)作者歷年來(lái)的合作作者進(jìn)行分析,能夠找到一些可能的師生關(guān)系。

T2.關(guān)鍵詞文本分析。關(guān)鍵詞文本中包含了許多有價(jià)值的信息。通過(guò)對(duì)關(guān)鍵詞文本進(jìn)行分析能夠發(fā)現(xiàn)諸如領(lǐng)域研究熱點(diǎn)、作者研究興趣等模式。該任務(wù)可分解為如下問(wèn)題:

Q6.如何獲知學(xué)者的主要研究方向?如,分析者希望知道某位學(xué)者的主要關(guān)鍵詞,再根據(jù)關(guān)鍵詞閱讀論文。

Q7.如何獲知一位學(xué)者研究領(lǐng)域的演化情況?如,分析者對(duì)某位學(xué)者感興趣,希望得知他近幾年的研究領(lǐng)域。

1.3 作者合著網(wǎng)絡(luò)可視化方法的設(shè)計(jì)

對(duì)作者合著網(wǎng)絡(luò)進(jìn)行可視分析能夠發(fā)現(xiàn)許多有趣的模式,例如學(xué)術(shù)團(tuán)體、個(gè)人中心網(wǎng)絡(luò)的變化等等。為更好地對(duì)作者合著網(wǎng)絡(luò)進(jìn)行分析,合著網(wǎng)絡(luò)分析分為合著網(wǎng)絡(luò)可視化方法與個(gè)人中心網(wǎng)絡(luò)可視化方法。

(1)合著網(wǎng)絡(luò)可視化方法的設(shè)計(jì)

合著網(wǎng)絡(luò)能夠直接反映作者間的學(xué)術(shù)合作關(guān)系。合著網(wǎng)絡(luò)需要能夠反映單個(gè)作者學(xué)術(shù)水平的高低、作者間的合作親密關(guān)系與學(xué)術(shù)團(tuán)體。本文設(shè)計(jì)了合著網(wǎng)絡(luò)可視化方法,能夠解決可視化任務(wù)中的Q2-Q4。

合著網(wǎng)絡(luò)可由一張無(wú)向圖表示,節(jié)點(diǎn)代表作者,節(jié)點(diǎn)間路徑代表作者間存在合作關(guān)系。合著網(wǎng)絡(luò)可視化示意圖如圖1所示。

該可視化方法由兩部分組成,無(wú)向圖與力引導(dǎo)布局:

①無(wú)向圖

節(jié)點(diǎn)面積:節(jié)點(diǎn)面積對(duì)應(yīng)發(fā)文數(shù)量。作者發(fā)文數(shù)量越多,節(jié)點(diǎn)越大。

節(jié)點(diǎn)顏色:節(jié)點(diǎn)的顏色代表作者所屬的學(xué)術(shù)團(tuán)體。不同的顏色代表不同的學(xué)術(shù)團(tuán)體,同一顏色的節(jié)點(diǎn)屬于同一學(xué)術(shù)團(tuán)體。

邊:邊代表連接的兩個(gè)作者間存在合作關(guān)系。

②力引導(dǎo)布局

力引導(dǎo)布局能夠使視圖中的連線長(zhǎng)度保持一致,并減少連線的交叉。力引導(dǎo)布局引入的庫(kù)侖斥力能將節(jié)點(diǎn)彈開,而彈簧引力能夠?qū)㈥P(guān)系緊密的節(jié)點(diǎn)拉近。由于關(guān)系緊密的節(jié)點(diǎn)間吸引拉近,關(guān)系較弱的節(jié)點(diǎn)間排斥遠(yuǎn)離,所以從形成的網(wǎng)絡(luò)布局中能夠看到一定的團(tuán)體分布。通過(guò)對(duì)節(jié)點(diǎn)進(jìn)行著色能夠更好地對(duì)團(tuán)體進(jìn)行區(qū)分。

圖1 合著網(wǎng)絡(luò)可視化方法示意圖

(2)個(gè)人中心網(wǎng)絡(luò)可視化方法的設(shè)計(jì)

除了需要對(duì)網(wǎng)絡(luò)的整體情況進(jìn)行展示外,還需要對(duì)個(gè)體的情況進(jìn)行展示。對(duì)個(gè)人中心網(wǎng)絡(luò)進(jìn)行探索除了能夠發(fā)現(xiàn)該個(gè)體的主要合作者,還能夠發(fā)現(xiàn)合作網(wǎng)絡(luò)隨時(shí)間的演化情況。本文設(shè)計(jì)了個(gè)體中心網(wǎng)絡(luò)的可視化方法,能夠解決可視化任務(wù)中的Q5。

個(gè)人中心網(wǎng)絡(luò)的可視化由兩部分組成,如圖2和圖3所示。個(gè)人中心網(wǎng)絡(luò)可視化能夠?qū)x定作者與其主要合作者進(jìn)行展示,對(duì)作者的主要合作作者進(jìn)行分析能夠知道該作者主要的學(xué)術(shù)合作關(guān)系。

個(gè)人合作關(guān)系演化可視化能夠從時(shí)間屬性上對(duì)作者的合作關(guān)系進(jìn)行分析。首先對(duì)選定作者所有發(fā)表的論文按年份排列進(jìn)行展示,再對(duì)發(fā)表論文中的合作作者按年份進(jìn)行展示,就能夠清晰直觀地看到該作者與其合作作者在時(shí)間上變化情況。通過(guò)對(duì)個(gè)人合作關(guān)系演化情況進(jìn)行分析能夠發(fā)現(xiàn)諸如師生關(guān)系等潛在的模式。

圖2 個(gè)人中心網(wǎng)絡(luò)可視化示意圖

圖3 個(gè)人合作關(guān)系演化可視化示意圖

該方法的可視化編碼主要包括節(jié)點(diǎn)、連線、氣泡,下面對(duì)方法的可視化編碼進(jìn)行描述:

①個(gè)人中心網(wǎng)絡(luò)可視化

節(jié)點(diǎn):每個(gè)節(jié)點(diǎn)代表一個(gè)作者。

邊:邊表示相連的節(jié)點(diǎn)與中心節(jié)點(diǎn)間存在合作關(guān)系。

②個(gè)人合作關(guān)系演化可視化

橫軸:橫軸代表選定作者發(fā)表過(guò)論文的年份。

縱軸:縱軸代表作者,第一項(xiàng)為選定作者,后續(xù)項(xiàng)為選定作者的合作作者,按合作論文篇數(shù)排序。

氣泡尺寸:氣泡尺寸代表發(fā)文數(shù)量,氣泡越大,發(fā)文數(shù)量越多。第一行為選定作者按年份排列的發(fā)文數(shù)量,后續(xù)行為該作者與選定作者按年份排列的合作論文數(shù)量。

1.4 關(guān)鍵詞文本可視化方法的設(shè)計(jì)

關(guān)鍵詞是分析作者研究領(lǐng)域的重要屬性。一方面,分析者希望直觀地得到作者主要的研究方向;另一方面,分析者希望觀察出作者研究領(lǐng)域的變化情況。

針對(duì)以上需求,本文設(shè)計(jì)了關(guān)鍵詞文本可視化方法,由兩部分組成,關(guān)鍵詞詞云可視化與主題流圖可視化。

(1)關(guān)鍵詞詞云可視化方法的設(shè)計(jì)

關(guān)鍵詞詞云能夠直觀地反映出作者的主要研究方向。本文設(shè)計(jì)了關(guān)鍵詞詞云的可視化方法,能夠解決可視化任務(wù)中的Q6。對(duì)作者發(fā)表的所有論文的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),由詞頻決定關(guān)鍵詞大小,排列在視圖上。通過(guò)對(duì)關(guān)鍵詞進(jìn)行跟蹤,能夠找到相應(yīng)的論文。關(guān)鍵詞詞云可視化方法示意圖如圖4所示。

圖4 關(guān)鍵詞詞云可視化方法示意圖

該方法的可視化編碼主要包括:

內(nèi)容:關(guān)鍵詞內(nèi)容為作者論文集中出現(xiàn)頻次較高的關(guān)鍵詞。

大?。宏P(guān)鍵詞的大小代表該關(guān)鍵詞出現(xiàn)的頻次,頻次越大,關(guān)鍵詞越大。

(2)主題流圖可視化方法的設(shè)計(jì)

主題流圖能夠反映作者研究領(lǐng)域隨時(shí)間的變化情況,包括:作者近年來(lái)最主要的研究領(lǐng)域,作者何時(shí)停止研究一個(gè)舊領(lǐng)域,作者何時(shí)開始研究一個(gè)新領(lǐng)域等等。本文設(shè)計(jì)了主題流圖的可視化方法,能夠解決可視化任務(wù)中的Q7。將作者的研究主題映射為在時(shí)間上不斷變化的河流,即可看到主題的發(fā)展變化。主題流圖可視化方法示意圖如圖5所示。

圖5 主題流圖可視化方法示意圖

該方法中河流的可視化編碼主要包括:

顏色:不同的顏色代表不同的河流,同一顏色的河流為一個(gè)主題。

寬度:河流的寬度代表當(dāng)年該主題的論文數(shù),作者在該主題上有關(guān)的論文越多,河流越寬。因此,面積較大的河流代表作者的主要研究領(lǐng)域。

2 實(shí)驗(yàn)評(píng)估

2.1 作者合著網(wǎng)絡(luò)分析

如圖6所示,展示了IEEE VIS論文數(shù)據(jù)集上的合著網(wǎng)絡(luò)情況。從合著網(wǎng)絡(luò)可視化結(jié)果中可以看出,可視化領(lǐng)域內(nèi)的頂尖作者主要有Eduard Groller、Kwan-Liu Ma、Arie E.Kaufman、Huamin Qu 等。合著網(wǎng)絡(luò)根據(jù)作者合作關(guān)系有被劃分成一個(gè)個(gè)學(xué)術(shù)團(tuán)體,而學(xué)術(shù)團(tuán)體又圍繞上述頂尖作者產(chǎn)生。由此可以判斷出,學(xué)術(shù)團(tuán)體的產(chǎn)生主要受兩方面影響:頂尖作者與其學(xué)生間的合作關(guān)系,頂尖作者間的長(zhǎng)期合作關(guān)系。

對(duì)合著網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行點(diǎn)擊能夠查看作者的詳細(xì)信息。圖7展示了Huamin Qu的個(gè)人中心網(wǎng)絡(luò)可視化結(jié)果。從圖中可以看出Huamin Qu的主要合作者為Yingcai Wu與Weiwei Cui。而根據(jù)搜索引擎的結(jié)果,Huamin Qu與后兩位作者是師生關(guān)系,證明了實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。從個(gè)人合作關(guān)系演化中可以看出,Huamin Qu與后兩位作者保持了長(zhǎng)期的合作關(guān)系。

通過(guò)對(duì)網(wǎng)絡(luò)圖中的節(jié)點(diǎn)進(jìn)行點(diǎn)擊能夠查看合作作者的詳細(xì)信息,對(duì)氣泡圖中的氣泡進(jìn)行點(diǎn)擊能夠查看相應(yīng)的文章。

如圖8所示,展示了Huamin Qu的研究領(lǐng)域可視化結(jié)果。從右邊的詞云可以看出,Huamin Qu的主要研究方向?yàn)関isual analytics與graph visualization。而從左邊的主題流圖可以看出Huamin Qu研究領(lǐng)域的變化情況。根據(jù)河流寬窄的變化情況,可以看出Huamin Qu早期的研究領(lǐng)域?yàn)閞ending與image processing,而近期的研究領(lǐng)域主要為visual analytics與graph data and techniques。

圖7 Huamin Qu的個(gè)人中心網(wǎng)絡(luò)可視化結(jié)果

2.2 作者研究領(lǐng)域分析

圖8 Huamin Qu的研究領(lǐng)域可視化結(jié)果

對(duì)關(guān)鍵詞進(jìn)行點(diǎn)擊能夠查看作者在該方向上的文章。如圖9所示,展示了Huamin Qu在visual analytics方向上的文章列表。通過(guò)下拉滑動(dòng)條能夠查看所有的文章,通過(guò)對(duì)link進(jìn)行點(diǎn)擊能夠訪問(wèn)原文鏈接。

圖9 Huamin Qu在visual analytics方向上的文章列表

3 結(jié)語(yǔ)

隨著科技的進(jìn)步與高等教育的蓬勃發(fā)展,一方面科研工作者數(shù)量急劇上升;另一方面,科學(xué)研究領(lǐng)域的重要成果之一——科研文獻(xiàn)的數(shù)量也在急劇增長(zhǎng)。如何有效地對(duì)科研文獻(xiàn)進(jìn)行分析,快速獲取目標(biāo)信息,成為文獻(xiàn)分析領(lǐng)域的研究熱點(diǎn)。

鑒于上述背景,本文對(duì)文獻(xiàn)機(jī)構(gòu)作者數(shù)據(jù)的可視分析展開研究?;跁?huì)議論文數(shù)據(jù),結(jié)合地理信息可視化、網(wǎng)絡(luò)數(shù)據(jù)可視化、文本內(nèi)容可視化等信息可視化技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了完成了對(duì)合著網(wǎng)絡(luò)、關(guān)鍵詞文本等數(shù)據(jù)的分析。同時(shí),本文以1991-2016年IEEE VIS論文數(shù)據(jù)為例,通過(guò)對(duì)論文數(shù)據(jù)進(jìn)行分析,驗(yàn)證了系統(tǒng)的可靠性。

猜你喜歡
可視化方法研究
基于CiteSpace的足三里穴研究可視化分析
FMS與YBT相關(guān)性的實(shí)證研究
基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
遼代千人邑研究述論
基于CGAL和OpenGL的海底地形三維可視化
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
“融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
EMA伺服控制系統(tǒng)研究
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 亚洲第一页在线观看| 69精品在线观看| 免费一级全黄少妇性色生活片| 综合天天色| a在线观看免费| 午夜福利视频一区| 国产情侣一区二区三区| 毛片久久久| 国产亚洲精品91| 婷五月综合| 成人午夜亚洲影视在线观看| 久久青草热| 久久青草精品一区二区三区 | 九月婷婷亚洲综合在线| 欧美成人日韩| 久久国产成人精品国产成人亚洲| 中文字幕 日韩 欧美| 麻豆精品在线| 2021最新国产精品网站| 91久久精品国产| 亚洲av综合网| 欧美国产在线看| 另类重口100页在线播放| 嫩草国产在线| 日韩欧美亚洲国产成人综合| 亚洲欧洲AV一区二区三区| 亚洲第一成网站| 老司机aⅴ在线精品导航| 亚洲av无码专区久久蜜芽| 亚洲欧美成人综合| 97青草最新免费精品视频| 午夜一区二区三区| 国产凹凸视频在线观看| 精品国产女同疯狂摩擦2| 国产高清毛片| 国产丝袜无码一区二区视频| 人妻丰满熟妇AV无码区| 98精品全国免费观看视频| 亚洲性一区| 午夜综合网| 99国产精品一区二区| m男亚洲一区中文字幕| 色哟哟色院91精品网站| 日本精品影院| 一区二区三区毛片无码| 国产欧美日韩精品第二区| 国产91熟女高潮一区二区| 亚洲欧美另类日本| 啪啪啪亚洲无码| 成人一级黄色毛片| av免费在线观看美女叉开腿| 中文字幕乱码中文乱码51精品| 亚洲愉拍一区二区精品| 67194在线午夜亚洲 | 国产美女精品在线| 99re经典视频在线| 免费激情网站| 二级特黄绝大片免费视频大片| 欧美日韩中文国产| 在线永久免费观看的毛片| 欧美日韩中文国产| 在线播放91| 久久美女精品国产精品亚洲| AV不卡无码免费一区二区三区| 欧美亚洲一二三区| 亚洲Av激情网五月天| 欧美成人午夜影院| 日韩高清中文字幕| 日韩国产另类| 亚洲一区二区在线无码 | 久久大香香蕉国产免费网站| 免费国产黄线在线观看| 国产精品视频观看裸模| 成人在线欧美| 呦系列视频一区二区三区| 97精品久久久大香线焦| 日韩精品免费一线在线观看| 老司国产精品视频91| 99热这里只有精品久久免费| 精品国产欧美精品v| 久久天天躁狠狠躁夜夜2020一| 黄色一级视频欧美|