陳立雪 郭思月 滕廣青 庹銳
(東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院 長(zhǎng)春 130117)
科研人員的研究主題分析一直受到圖書情報(bào)學(xué)領(lǐng)域的高度重視。科學(xué)論文作為科研人員學(xué)術(shù)成果的重要載體,凝聚了科研人員的智慧,其中包含的大量隱含信息是對(duì)科研人員研究主題進(jìn)行識(shí)別的重要依據(jù)。近年來(lái),科學(xué)知識(shí)的更新速度不斷加快,各學(xué)科間的交叉融合趨勢(shì)愈加明顯。一方面,學(xué)科領(lǐng)域內(nèi)的研究主題不斷推陳出新,一些原有的熱點(diǎn)主題不斷強(qiáng)化,而另一些新的知識(shí)逐漸成為流行主題,學(xué)科知識(shí)體系更呈現(xiàn)復(fù)雜性。另一方面,一些科研人員在自己的主要研究方向上堅(jiān)持始終,也有一些科研人員逐漸呈現(xiàn)研究方向的多樣化,甚至還有科研人員熱衷于追逐學(xué)科領(lǐng)域內(nèi)新的流行主題。面對(duì)這些問(wèn)題,高發(fā)文、高被引等不同類型的科研人員會(huì)有怎樣的表現(xiàn),是一個(gè)值得深入研究的問(wèn)題。
本研究采用隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型,計(jì)算提取不同類型科研人員的研究主題。通過(guò)主題強(qiáng)度等指標(biāo)分析,探測(cè)不同類型科研人員的研究偏好,分析其在主要研究方向上的精專程度與主題遷移,為科學(xué)發(fā)展提供決策支持與參照依據(jù)。
圖書情報(bào)學(xué)領(lǐng)域,關(guān)于特定學(xué)科研究主題的計(jì)量與分析由來(lái)已久。早期的相關(guān)研究主要基于科學(xué)論文的關(guān)鍵詞等形式特征進(jìn)行分析[1],關(guān)注的重點(diǎn)包括領(lǐng)域熱點(diǎn)識(shí)別[2]、主題聚類[3]等多個(gè)方面。隨著研究工作的開展,研究者不再局限于對(duì)研究主題整體進(jìn)行研究,而是基于研究主題與科研人員之間的關(guān)聯(lián)關(guān)系,探索不同科研人員(群)研究主題的模式與特征。……