999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

領(lǐng)域性科研機(jī)構(gòu)的研究熱度評(píng)價(jià)方法

2015-09-27 08:22:58劉金花
現(xiàn)代計(jì)算機(jī) 2015年29期
關(guān)鍵詞:評(píng)價(jià)研究

劉金花

(山西醫(yī)科大學(xué)汾陽學(xué)院衛(wèi)生信息管理系,汾陽 032200)

領(lǐng)域性科研機(jī)構(gòu)的研究熱度評(píng)價(jià)方法

劉金花

(山西醫(yī)科大學(xué)汾陽學(xué)院衛(wèi)生信息管理系,汾陽032200)

0 引言

科學(xué)技術(shù)的高速發(fā)展促使科技文獻(xiàn)知識(shí)的研究也日益專門化,作為創(chuàng)新主體的科研工作者他們對(duì)快速獲取有用的信息和知識(shí)變的更為迫切,在現(xiàn)實(shí)情況中,通過查找關(guān)鍵詞在電子檢索系統(tǒng)檢索到的相關(guān)文獻(xiàn)成千上萬篇。很多準(zhǔn)備從事科研工作的人員,希望能夠?qū)δ骋豢蒲蓄I(lǐng)域的主要研究機(jī)構(gòu)有一個(gè)完整的、具體的認(rèn)識(shí);然后決定奔赴哪個(gè)科研機(jī)構(gòu)學(xué)習(xí)或者是增加與哪個(gè)科研機(jī)構(gòu)的學(xué)術(shù)交流等。

本文提出了科技文獻(xiàn)科研機(jī)構(gòu)的熱度挖掘方法,文中綜合考慮了某領(lǐng)域研究機(jī)構(gòu)中研究人員的數(shù)量、發(fā)表文章的數(shù)量和學(xué)術(shù)水平三方面的因素,對(duì)科研機(jī)構(gòu)在給定領(lǐng)域的研究熱度進(jìn)行打分。然后用同樣的評(píng)價(jià)方法獲得每個(gè)機(jī)構(gòu)在各個(gè)時(shí)間段的研究熱度值,我們就可以清晰的看出各個(gè)研究機(jī)構(gòu)在給定領(lǐng)域的研究熱度趨勢,以便預(yù)測將來的發(fā)展趨勢。

1 實(shí)驗(yàn)數(shù)據(jù)結(jié)構(gòu)

1.1數(shù)據(jù)來源

本文研究的數(shù)據(jù)來源于1999-2010年的中國學(xué)術(shù)期刊網(wǎng)站,以“機(jī)器翻譯”作為搜索的關(guān)鍵詞搜索文獻(xiàn)。選取其中被引用頻次超過一次(包含一次)的文獻(xiàn),抽取了文獻(xiàn)數(shù)據(jù)中的論文標(biāo)題、作者、摘要、標(biāo)題、研究機(jī)構(gòu)、發(fā)表時(shí)間、被引用頻次、被下載頻次、分類編號(hào)等10個(gè)字段,導(dǎo)入到MySQL數(shù)據(jù)庫中。舍棄被引頻次小于1的文獻(xiàn),是因?yàn)闆]有引用頻次的文章我們可以認(rèn)為這些文獻(xiàn)的學(xué)術(shù)價(jià)值是比較低的,并且沒有引用頻次的文獻(xiàn)大都不是來自主流的期刊和會(huì)議。

1.2文獻(xiàn)機(jī)構(gòu)信息統(tǒng)計(jì)

對(duì)于每篇文章所隸屬的研究機(jī)構(gòu)進(jìn)行統(tǒng)計(jì),因?yàn)檎撐牡难芯繖C(jī)構(gòu)署名在不同的階段單位名稱會(huì)有稍微的差別,但是其實(shí)都屬于一個(gè)研究單位,例如:“中國科學(xué)院自動(dòng)化研究所”,有時(shí)候也簡稱為“中科院自動(dòng)化研究所”。所以本文在統(tǒng)計(jì)機(jī)構(gòu)信息時(shí),對(duì)這些機(jī)構(gòu)單位進(jìn)行了統(tǒng)一處理,將同一所大學(xué)的整理為同一個(gè)研究機(jī)構(gòu)。我們對(duì)本文的實(shí)驗(yàn)數(shù)據(jù)的機(jī)構(gòu)信息及其所在1999-2010這12年間發(fā)表的文章數(shù)量做了統(tǒng)計(jì),在“機(jī)器翻譯”領(lǐng)域發(fā)表的文章中,署名的機(jī)構(gòu)數(shù)總共有688個(gè),大部分是高等院校,還有一些研究所等。表1中只列出了發(fā)文數(shù)量超過20(包括20)篇的研究機(jī)構(gòu)。

2 研究機(jī)構(gòu)的研究熱度分析

由于絕大多數(shù)的人都關(guān)心的是某一領(lǐng)域中的核心研究機(jī)構(gòu),因?yàn)檫@些機(jī)構(gòu)的研究人員和發(fā)文數(shù)量都是非常高的,故我們在對(duì)研究機(jī)構(gòu)進(jìn)行熱度評(píng)價(jià)之前,可以進(jìn)行一些過濾操作以確定主要的研究機(jī)構(gòu),然后再對(duì)這些主要的研究機(jī)構(gòu)進(jìn)行研究熱度值評(píng)價(jià)。另外,各個(gè)研究機(jī)構(gòu)對(duì)該領(lǐng)域研究熱度可以通過該機(jī)構(gòu)發(fā)表的論文數(shù)量、研究人員數(shù)量等信息來反映出來,但是一般反映一個(gè)研究機(jī)構(gòu)的學(xué)術(shù)研究水平及研究的深度,僅僅通過數(shù)量是不夠的,還應(yīng)該考慮到該機(jī)構(gòu)發(fā)表論文的質(zhì)量。因此研究機(jī)構(gòu)的熱度分析可以按照以下流程進(jìn)行,如圖1所示。

圖1 研究機(jī)構(gòu)熱度分析流程圖

表1文獻(xiàn)的機(jī)構(gòu)信息及發(fā)文數(shù)量統(tǒng)計(jì)

2.1主要研究機(jī)構(gòu)的確定

一般情況下,一個(gè)研究機(jī)構(gòu)發(fā)表的論文數(shù)量越多,說明該機(jī)構(gòu)對(duì)該領(lǐng)域的研究越深入,但是不能忽略掉一個(gè)因素——研究人員的數(shù)量。如果一個(gè)研究機(jī)構(gòu)A在某一領(lǐng)域總共發(fā)表了論文數(shù)為100篇,但是A機(jī)構(gòu)中的研究人員數(shù)為20;而另外一個(gè)研究機(jī)構(gòu)B在該領(lǐng)域發(fā)表的論文數(shù)為20篇,但是B機(jī)構(gòu)的研究人員為1人次。A機(jī)構(gòu)與B機(jī)構(gòu)的人均發(fā)文量是一樣的,我們該認(rèn)為哪個(gè)機(jī)構(gòu)更有影響力?通常我們會(huì)認(rèn)為機(jī)構(gòu)A比B更有影響力。為了避免這種情況的大量發(fā)生,本文采取了對(duì)研究機(jī)構(gòu)進(jìn)行初步篩選的過程,過濾掉那些機(jī)構(gòu)中研究人員特別少的或者是發(fā)表的論文數(shù)量特別少。制定的研究機(jī)構(gòu)過濾準(zhǔn)則如下:

(1)如果一個(gè)機(jī)構(gòu)的研究人員的數(shù)量少于12,則去掉該機(jī)構(gòu)。

(2)如果一個(gè)機(jī)構(gòu)的發(fā)文數(shù)量少于12(包含12),則去掉該機(jī)構(gòu)。

為了保證在12年間年均研究人員數(shù)是1人,年均發(fā)文量是1。述兩條過濾準(zhǔn)則的中提到的閾值都設(shè)為12。在上文已經(jīng)對(duì)文獻(xiàn)機(jī)構(gòu)信息進(jìn)行了統(tǒng)計(jì)共有688個(gè)機(jī)構(gòu),按照上述研究機(jī)構(gòu)的過濾準(zhǔn)則進(jìn)行初步的過濾之后,剩下了31個(gè)研究機(jī)構(gòu)。

另外,一個(gè)研究機(jī)構(gòu)在某領(lǐng)域的研究水平,僅僅通過論文數(shù)量和人員數(shù)量是不行的,如果一個(gè)研究機(jī)構(gòu)研究人員壯大,但是發(fā)表了一堆沒有什么含金量的文章,那么我們也不能認(rèn)為該機(jī)構(gòu)是非常有影響力的機(jī)構(gòu)。一般來說被引用頻次是評(píng)價(jià)學(xué)術(shù)論文學(xué)術(shù)質(zhì)量的重要指標(biāo),如果一個(gè)機(jī)構(gòu)發(fā)表的論文的引用頻次越高越能體現(xiàn)出該機(jī)構(gòu)的學(xué)術(shù)研究質(zhì)量,在一定程度上發(fā)表的論文的被引用頻次、篇均被引頻次能說明該機(jī)構(gòu)的研究水平。下面對(duì)各個(gè)研究機(jī)構(gòu)的人員分布和被引用情況的統(tǒng)計(jì),表中列出了去掉了篇均被引率小于14的機(jī)構(gòu)。

表2機(jī)器翻譯領(lǐng)域主要的研究機(jī)構(gòu)

2.2機(jī)構(gòu)的研究熱度評(píng)價(jià)方法

當(dāng)我們確定了該研究領(lǐng)域的核心研究機(jī)構(gòu)之后,接下來制定評(píng)價(jià)一個(gè)研究機(jī)構(gòu)對(duì)某一領(lǐng)域的研究熱度值,不光要考慮該機(jī)構(gòu)投入的研究人員數(shù)量,還應(yīng)該考慮該機(jī)構(gòu)的產(chǎn)出量和學(xué)術(shù)水平,故本文綜合了這三個(gè)因素來評(píng)價(jià)某一研究機(jī)構(gòu)對(duì)特定領(lǐng)域的研究熱度,如公式(1):

其中Hot(Oi)表示機(jī)構(gòu)Oi的研究熱度值,persons(Oi)表示機(jī)構(gòu)Oi的研究人員總數(shù),papers(Oi)表示機(jī)構(gòu)Oi發(fā)表的論文總數(shù),cited(Oi)表示機(jī)構(gòu)Oi的文獻(xiàn)被引用的總次數(shù),m是已確定的核心研究機(jī)構(gòu)的個(gè)數(shù)。因?yàn)楣剑?)中三部分都是一個(gè)比例關(guān)系,這種比例值有時(shí)候會(huì)出現(xiàn)非常小甚至趨向于零的情況,因此為了計(jì)算的準(zhǔn)確性本文在計(jì)算的過程中對(duì)最終的熱度值Hot (Oi)進(jìn)行了取對(duì)數(shù)操作。

表3 1999-2010年各個(gè)研究機(jī)構(gòu)機(jī)器翻譯領(lǐng)域的研究熱度值

表3是本文根據(jù)上述的熱度計(jì)算公式計(jì)算的在1999-2010這12年機(jī)器翻譯領(lǐng)域各個(gè)研究機(jī)構(gòu)的熱度值。從表中來看,排在前幾位的研究機(jī)構(gòu)確實(shí)是在人員投入、發(fā)文的數(shù)量和質(zhì)量方面都是比較高的,因此,用本文提出的對(duì)研究機(jī)構(gòu)的熱度值打分的方法一定程度上是有效的,但是對(duì)于排名靠后的機(jī)構(gòu)的次序就不確定是否準(zhǔn)確。

2.3研究機(jī)構(gòu)研究熱度趨勢變化

類似的我們可以計(jì)算某一研究機(jī)構(gòu)在不同年度的研究熱度值,這樣就可以描繪出該研究機(jī)構(gòu)在該領(lǐng)域的研究熱度曲線圖。通過這個(gè)熱度變化趨勢可以進(jìn)一步預(yù)測在接下來的時(shí)間內(nèi),該機(jī)構(gòu)在該領(lǐng)域的研究趨勢是處于較高狀態(tài)還是較低的狀態(tài)。如圖2所示,是我們選取的五個(gè)主要的研究機(jī)構(gòu)在“機(jī)器翻譯”領(lǐng)域的研究熱度曲線圖。從圖中趨勢就可以預(yù)測在未來的幾年之內(nèi)中科院在機(jī)器翻譯領(lǐng)域的研究會(huì)一直處于比較高的狀態(tài)。

圖2  1999-2010年五個(gè)研究機(jī)構(gòu)在機(jī)器翻譯領(lǐng)域的研究熱度曲線

3 結(jié)語

本文對(duì)某一領(lǐng)域文獻(xiàn)知識(shí)進(jìn)行了研究機(jī)構(gòu)的熱挖掘工作。并且以“機(jī)器翻譯”領(lǐng)域來舉例,從實(shí)驗(yàn)數(shù)據(jù)的設(shè)置到研究點(diǎn)的熱度分析步驟,研究機(jī)構(gòu)的熱度分析步驟都做了詳細(xì)的講解,并且對(duì)實(shí)驗(yàn)的結(jié)果進(jìn)行了分析,證實(shí)了此種方法在一定程度上還是可行有效的,而且用了可視化的方法展示給用戶,符合了本文研究的初衷。另外,本文的熱度挖掘方法不僅是針對(duì)機(jī)器翻譯這一領(lǐng)域的,還可以運(yùn)用到其他的領(lǐng)域,只要保證數(shù)據(jù)是文獻(xiàn)數(shù)據(jù),并且能夠達(dá)到一定的規(guī)模,用本文提出的方法對(duì)某一領(lǐng)域的研究機(jī)構(gòu)進(jìn)行熱度分析,都是可行的。另外,本文的針對(duì)科技文獻(xiàn)的挖掘工作都是針對(duì)下載到本地的文獻(xiàn)數(shù)據(jù)做的挖掘工作,但是現(xiàn)實(shí)生活中網(wǎng)絡(luò)的發(fā)達(dá),導(dǎo)致文獻(xiàn)數(shù)據(jù)的更新很快,如果我們能夠針對(duì)在線的數(shù)據(jù)進(jìn)行挖掘工作,并且能夠提供出可視化的熱度分析趨勢圖,那將會(huì)造福很多的科研工作者。因此,基于實(shí)時(shí)性的在線文獻(xiàn)挖掘工作也是將來工作的一個(gè)重點(diǎn)。

[1]HAN Jia-wei,Micheline Kamber,PEI Jian.數(shù)據(jù)挖掘概念與技術(shù)(原書第3版)[M].北京:機(jī)械工業(yè)出版社,2012.

[2]宗成慶.統(tǒng)計(jì)自然語言處理(第2版)[M].清華大學(xué)出版社.北京:清華大學(xué)出版社,2013.

[3]柯健,李超.我國社會(huì)科學(xué)領(lǐng)域數(shù)據(jù)挖掘研究的文獻(xiàn)計(jì)量分析.現(xiàn)代情報(bào),2010,31(6):102-106.

[4]黃永煤.讀者需求分析中的數(shù)據(jù)挖掘技術(shù)[J].大學(xué)圖書情報(bào)學(xué)刊,2006,24(4):48-50.

[5]邱均平,繆雯婷.文獻(xiàn)計(jì)量學(xué)在人才評(píng)價(jià)中應(yīng)用的新探索[J].評(píng)價(jià)與管理,2007,2(6):1-5

Literature Mining;Research Institutions;Evaluation of Research Hot

Research Hot Degree of the Evaluation Method of Research Institutions in a Certain Field

LIU Jin-hua
(Fenyang College Shanxi Medical University,F(xiàn)enyang 032200)

1007-1423(2015)29-0045-04

10.3969/j.issn.1007-1423.2015.29.012

劉金花(1987-),女,山西汾陽人,碩士,助教,研究方向?yàn)樽匀徽Z言處理、數(shù)據(jù)挖掘

2015-09-24

2015-10-07

從大量文獻(xiàn)中快速獲得某一領(lǐng)域的核心科研機(jī)構(gòu),對(duì)準(zhǔn)備開展科研工作的科研人員具有極大的導(dǎo)向作用。爬取網(wǎng)上某一領(lǐng)域文獻(xiàn)數(shù)據(jù),綜合考慮機(jī)構(gòu)的研究人員數(shù)、發(fā)文量和被引文量,提出針對(duì)研究機(jī)構(gòu)的研究熱度的評(píng)價(jià)方法,并且對(duì)每一個(gè)研究機(jī)構(gòu)在各個(gè)時(shí)間段進(jìn)行熱度評(píng)價(jià),然后繪制出熱度趨勢圖。

文獻(xiàn)挖掘;研究機(jī)構(gòu);研究熱度評(píng)價(jià)

It has a great role in guiding for research staff whom preparing to carry out research work,if we can obtain the core research institutions for a given field from a large number of scientific literature rapidly.Crawls a certain field literature data from Internet,and proposes an evaluation method of research hot value for each institute considering the number of researchers,the volume of published articles and the amount of the citation comprehensively,uses a visual way to display distribution graph of the field in a certain period.

猜你喜歡
評(píng)價(jià)研究
FMS與YBT相關(guān)性的實(shí)證研究
SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
石油瀝青(2021年4期)2021-10-14 08:50:44
2020年國內(nèi)翻譯研究述評(píng)
遼代千人邑研究述論
中藥治療室性早搏系統(tǒng)評(píng)價(jià)再評(píng)價(jià)
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
基于Moodle的學(xué)習(xí)評(píng)價(jià)
關(guān)于項(xiàng)目后評(píng)價(jià)中“專項(xiàng)”后評(píng)價(jià)的探討
主站蜘蛛池模板: 精品在线免费播放| 高清视频一区| 国产精品无码影视久久久久久久| 日韩av在线直播| 老司机午夜精品网站在线观看 | 中文字幕在线不卡视频| 少妇人妻无码首页| 在线视频亚洲欧美| 97色婷婷成人综合在线观看| 国产无码精品在线| 亚洲无码精品在线播放| 嫩草在线视频| 亚洲第一在线播放| 国产欧美日韩精品综合在线| 欧美精品二区| 久久久久亚洲AV成人人电影软件| 一本色道久久88亚洲综合| 伊人久久综在合线亚洲2019| 免费av一区二区三区在线| 亚洲一级毛片| 日本人又色又爽的视频| 国产a在视频线精品视频下载| 国产高清在线精品一区二区三区 | 国产大片喷水在线在线视频| 欧美日韩另类国产| 99视频在线精品免费观看6| 素人激情视频福利| 亚洲免费毛片| 欧美高清国产| 久久人妻xunleige无码| 无码精品国产VA在线观看DVD| 国产理论一区| 2024av在线无码中文最新| 中文字幕有乳无码| 欧美色丁香| 精品亚洲欧美中文字幕在线看| 国产精品yjizz视频网一二区| 人妻丝袜无码视频| 成人国产精品一级毛片天堂| 精品视频第一页| 人妻91无码色偷偷色噜噜噜| 欧美日韩精品综合在线一区| 五月激情综合网| 亚洲丝袜中文字幕| 久久狠狠色噜噜狠狠狠狠97视色| 日本人妻一区二区三区不卡影院| 久久这里只精品国产99热8| 欧美国产中文| 无码免费的亚洲视频| 亚洲成年网站在线观看| 国产亚洲欧美另类一区二区| 亚洲成人www| 少妇精品在线| 中日无码在线观看| 97在线国产视频| 国产精品免费电影| 伊人久综合| 女人18毛片一级毛片在线 | 91福利在线观看视频| 中文字幕无码电影| 999精品免费视频| 国产永久无码观看在线| 97超爽成人免费视频在线播放| 欧美成一级| 久久香蕉欧美精品| 国产男女免费视频| 国产一区在线观看无码| 国产91熟女高潮一区二区| 天天色天天综合| 91日本在线观看亚洲精品| 国内精品久久人妻无码大片高| 亚洲性影院| 国产一级视频久久| 国产在线观看成人91| 伊人久久大线影院首页| 九九热精品视频在线| 91毛片网| 中文字幕第4页| 国产91在线免费视频| 国国产a国产片免费麻豆| 日本人妻丰满熟妇区| 成年人视频一区二区|