陳文娟
(河南財經政法大學圖書館,河南 鄭州 450002)
基于CiteSpace的人工智能研究可視化分析
陳文娟
(河南財經政法大學圖書館,河南 鄭州 450002)
本報告借助于CiteSpace引文分析軟件對“人工智能”這一主題的相關文章從共引文獻、共引著者、共引期刊等多個角度進行可視化分析,根據圖譜分析人工智能相關的研究現狀及前沿。
人工智能;CiteSpace;引文分析;可視化
人工智能也稱機器智能,它是計算機科學、控制論、信息論、神經生理學、心理學、語言學等多種學科互相滲透而發展起來的一門綜合性學科。從計算機應用系統角度來看,人工智能是研究如何制造出智能機器或智能系統,實現模擬人類智能活動的能力,以延伸人們智能的科學[1]。
近年來,隨著互聯網和通訊技術的迅猛發展,人工智能逐漸滲透到了社會生活的各個方面,極大地改變這社會面貌,也給人們的思想和行為帶來了深刻的變革[2]。本文對近十年來有關人工智能的文獻進行可視化分析,清晰地揭示人工智能研究的發展演變態勢。
相比傳統的統計分析方法,引文分析法對于揭示某一學科研究領域的動態結構和發展規律,衡量著者、成果的影響力具有更大的價值。本文以Web of Knowledge為來源數據庫,借助于CiteSpace專業引文分析軟件,截取2003-2013年10年內有關人工智能的文獻進行計量分析。具體檢索策略是在Web of Knowledge中輸入檢索式“Artificial Intelligence”,時間限度限定在2000-2013,并選擇文獻類型“ARTICLE”,得到的檢索結果為3 144條。
在CiteSpace中導入數據,限定時間為2003至2013,時間跨度為1,選取節點類型為共引文獻(Cited Reference),運行后進行可視化,得到共引文獻聚類的混合網絡,如圖1所示。圖示中的網絡共有170個節點,836條鏈接。
從圖1可以看出,此聚類圖的發展途徑呈現出從左上角到右下角的演化,出現三個明顯的聚類:最先出現了左上角的藍色聚類,主要聚焦于蛋白質組學(proteomy);隨后出現了以湖藍色聚類,在這之后分為了兩個不同的研究領域,研究內容分別為大神經網絡(large neural network)與特殊謂語(special predicate);最后出現的是以橙色和黃色的聚類,內容涵蓋遺傳算法(genetic al?gorithms)、機器學習(machine learning)、基礎神經網絡(funda?mentals neural)、遺傳編程(genetic programming)、計算機智能(IEEE Cevol computer)等新領域。黃色和橙色部分聚類連線較多,聯系緊密,是目前人工智能領域研究的核心區域。

圖 1 基于DCA的人工智能引文聚類圖譜
中間中心性和被引次數均排在前列的文章是Goldberg DE于1989發表的有關遺傳算法的文章,共被引32次,中心度為0.18,是該群體最具影響力的作者。這一文章可以說是人工智能領域的奠基之作,且仍處于目前研究的核心領域。從綠色到黃色、橙色的過渡并沒有明顯的節點。藍色和湖藍色的部分都相對孤立的,但左下方的湖藍色部分文章節點都是紅色,這表明這一領域的文章還是處于研究前沿。綠色節點較為分散,表明這一領域的研究出現時間較短或者研究尚淺,或是研究中遇到了難題,因此分布比較分散。自2008年之后的黃色與橙色的聚類網絡相對緊密,這說明這些領域是目前研究的熱點,且取得了較多的創新和成果,相互間聯系比較緊密,分布比較集中。
在CiteSpace中,選取節點類型為共引著者(Cited Author)進行分析,進入可視化界面,得到文章共引著者的聚類混合網絡,如圖2所示。

圖 2 基于ACA的人工智能引文聚類圖譜
由圖可知,共引作者與共引文獻的走向大致相同,藍色與湖藍色(2004至2005年)與其他文獻之間聯系不緊密,共引現象不多。在2005年之后共引開始增多,多個研究領域相互交叉,共引率較高。但同時也可以看出,2005年之后出現的研究相對比較分散,形成了多個分叉研究領域,且每個領域尚沒有形成一個系統,雖然彼此間聯系緊密,但從人工智能整個研究領域來說,目前所做的研究尚淺,研究的整體性不強,還有許多內容需要探索。
CiteSpace也給出了基于ACA人工智能的共引記錄,其中共引率最高的是Haykin S,被引次數為64次。被引次數排名第二的為前面提到的Goldberg DE,中心度為0.18,可以說是人工智能研究領域內最具有影響力的權威專家。其他具有影響力的專家還有Zadeh LA,Newell A、Holland JH、Rumelhart DE、Kennnedy J、Mccarthy J等。
根據統計得知,人工智能研究領域共有126種共引期刊。在CiteSpace中,選取節點類型為共引期刊Cited Journal進行可視化,可以直觀地看出該領域最重要的期刊有ARTIF INTELL、SCIENCE,以及LNCS、LECT NOTESARTIF INT等。同時視圖也展示出了人工智能隨著時間共引情況的發展變化情況:人工智能的研究起始于五六十年代,事實上,“人工智能”一詞最初是在1956年Dartmouth學會上提出的[3]。從那以后,研究者們發展了眾多理論和原理,人工智能的概念也隨之擴展。自80年代以來,人工智能取得了較大的進展,人工智能的研究不斷向多個方向和領域延伸,并取得了很大的成就,許多文獻見諸一些世界級權威期刊。
通過人工智能共引記錄的共引次數與中心度的排序可以更明確地看出人工智能的共引期刊分布情況,繼而定義該領域的十大核心期刊。排名第一的期刊是ARTIF INTELL,被引次數(183次)最高,中心度(0.63)最大,是該領域最具有影響力的核心期刊。緊隨其后的是SCIENCE,也是很有該領域內最有影響力的核心期刊之一;NATURE、LNCS、LECTNOTESARTIF INT、LECTNOTESCOMPUT SC這四種期刊次于前兩種期刊,影響力處于第二核心等級;COMPUT IND、IEEE TNEURAL NETWOR、EUR JOPER RES、DATA KNOWL ENG這四種期刊影響力弱于其前的四種期刊。
本文利用web of science數據庫的檢索數據對人工智能(2004-2010年)進行基于CiteSpace的科學知識圖譜分析,根據圖譜我們分析得知,人工智能的研究已經持續多年,在近些年來更是取得了非凡的進展,研究熱點主要集中在遺傳算法、機器學習、神經網絡等方面。但總體來看,人工智能領域的研究尚不成熟,研究主題分布較為分散,主題之間聯系不緊密。此外,本文通過定量分析,得出這一研究領域內具有較大影響力的核心文獻、著者和期刊,有助于從宏觀上把握人工智能的發展過程和現狀,指導人工智能領域研究的進一步發展。
[1]胡國華,袁樹杰.人工智能研究現狀與展望[J].淮南師范學院學報,2006,8(37):22-24.
[2]劉樹安.人工智能研究領域及其社會影響[J].合作經濟與科技,2012(19):126-128.
[3]丁世飛.人工智能[M].北京:清華大學出版社,2011.
TP18
A
1671-0037(2014)06-88-1.5
2014年度河南省社科聯、河南省經團聯調研課題《基于關聯數據的網絡信息資源融和利用機制研究》,項目編號為:SKL-2014-765。
陳文娟(1988.3-),女,碩士,助理館員,研究方向:信息資源管理與服務。