肖文芳,黃稚霆,歐俊宏,劉浩鵬,黃詩琪
(廣東醫科大學 生物醫學工程學院,廣東 湛江 524023)
人工智能技術發展起源于1956年的夏季[1],最初對人工智能的構想只是使用設備模擬人類思維并處理問題。后續的研究使人工智能從單一的設備研發發展成一門涉獵廣泛的交叉學科。時至今日,人工智能的重要性已經引起了全世界的重視。在事物識別與判斷,機器自動化與智能化等領域都成為人工智能發展的重要領域。計算機視覺技術是在計算機上利用適當的算法對采集的圖像等進行分析的技術,重點在于軟件,關注點是閱讀后如何使用科學方法進行分析[2]。計算機視覺研究已經在學術領域研究多年,發展出很多深刻的原理與技術,近年的重點主要放在工業化進程上,如利用GPU和視覺計算加速器處理數據。但計算機視覺技術走出實驗室,走進市場,還需進一步探索。
本文以CNKI為檢索平臺,以“人工智能”與“計算機視覺”為檢索主題,時間區間為1979—2021年,經過檢索與篩選,得到文獻6 028篇。借助CiteSpace[3]、VOSviewer[4]、SPSS[5]等可視化分析軟件,運用詞頻分析法及聚類分析法等對檢出文獻的作者、機構及關鍵詞進行可視化分析與研究,以期把握基于人工智能的計算機視覺研究領域的內容及特征,并對未來的研究趨勢進行探討。
將CNKI收錄基于人工智能的計算機視覺技術的文獻數據導入VOSviewer軟件中,確定作者為其網絡節點,經過VOSviewer軟件進行可視化后得到101個作者(圖1)。在LabelView視圖中節點與字體的大小取決于該節點的權重。由圖1可見,李偉、袁保宗、藤光輝、阮秋琦等的發文量較多,其中發文最多的李偉為23篇。

圖1 基于VOSviewer的作者頻次圖
作者的多維尺度分析實質是依據作者之間的“距離”即關系的緊密程度對研究問題進行聚類,能全面反映研究的主要角度與熱點。
利用SPSS進行多維尺度分析,得到可視化結果,如圖2所示。然而仍需對結果進行有效性和可靠性判斷,其中包括變量的二維分布圖。對輸出結果還要判斷其可靠性和有效性,主要通過應力系數(stress)和擬合優度的平方(RSQ)進行判斷[6]。RSQ越大越好,一般大于0.6認為是可接受的,而stress的標準一般0是完美,2.5是優,3是良,到20則代表擬合效果很差。畫圖后我們得到RSQ=0.988 81,Stress=0.060 81,因此可以認為此結果是有效且可靠的。

圖2 基于SPSS的作者多維尺度分析圖
通過多維尺度分析的結果可以將基于人工智能技術的計算機視覺研究者分為以下4類。每一個類當中的作者所研究的領域都具有一定的相似性。從圖中可以看出李偉、袁保宗、李德華等距離中心最近,屬于該領域較為有影響力的研究者。
節點大小代表相對詞頻,節點間連線代表共現關系,連線顏色深淺代表關聯度,節點發出的連線數量代表節點的中心度及在基于人工智能的計算機視覺領域的重要程度(圖3)。
由圖3可知,我國基于人工智能的計算機視覺研究領域中,除“人工智能”與“計算機視覺”2個上位關鍵詞外,“機器視覺”與“圖像處理”在余下的關鍵詞中占主要地位,大部分研究方向都與其有聯系。可以認為,迄今為止在整個研究領域中,大部分研究都以機器視覺或圖像處理為出發點進行研究。無論基于何種出發點,大部分的小型聚類(圖3中未顯示文字的節點構成的聚類)都與這2個出發點存在聯系,小型聚類間的相互聯系也相當緊密,但小型聚類間并沒有產生出新的具有共同高頻詞(新研究重心)的大型聚類(新研究方向),這反映了基于人工智能的計算機視覺這一領域空有聯系,但缺少新的研究重心與方向,只能從過去的研究成果中尋求突破。使用SPSS對關鍵詞進行多維尺度分析得到圖4。

圖3 關鍵詞共現圖譜顯示出現頻次15次以上的節點
結合圖4的可視化結果得出,基于人工智能的計算機視覺領域從1996—2018年的研究重熱點大致分為3個類別:以人工智能和計算機視覺為主為一派,以圖像處理和物體與模式識別為一派及以人機交互、機器學習為重點一派。同時也明顯看出人工智能與計算機視覺圖像處理這一類要明顯比另外2類離中心較近,屬于核心大類,是目前研究的重中之重。圖4呈現出小型聚類(小型研究方向)間的聯系是脆弱的,不可靠的,甚至在本質上是不甚相關的。

圖4 基于SPSS的關鍵詞聚類分析圖
研究前沿的識別與追蹤能夠為研究者提供學科研究的最新演化動態,預測研究領域的發展,識別需要進一步探索的問題。在研究中,前沿往往采用代表該研究相同的詞匯或短語出現次數的變化進行分析。相對于傳統的高頻主題詞分析,突現主題術語更適合探測學科發展的新興趨勢和突然變化。在分析凸顯主題術語時,可利用突現詞探測技術和算法,通過考察關鍵詞詞頻時間分布,從中探測出頻次變化率高的主題詞。
基于人工智能的計算機視覺研究前沿劃分為3個階段(圖5)。

圖5 基于CitesPace的1996—2018年突現率排名前25的關鍵詞
第一階段:在1996年,基于人工智能的計算機視覺研究處于研究初期,產生大量具有突現度和中心度的突現詞,表明人工智能為基礎的計算機視覺理論在提出的初期便成為學術研究的熱點,形成多樣化的研究中心。“小波變換”“主動視覺”“圖像識別”“圖像處理”從出現便呈現出較高的突現度。可見,本領域初期研究是以圖像的識別和轉換處理為研究熱點,隨著研究不斷深化,本領域也逐步界定了具有自身特色的概念和理念,并進行推廣。
第二階段:從1997年到2006年,在過去提出的理論被繼續豐富的基礎上,大量的新研究熱點被提出并進行研究。“計算機制圖學”“計算機圖形學”等詞呈現出20以上的驚人突現度,毫無疑問這是當時最火熱的研究熱點。這表明針對已識別的圖像處理與表現成為當下的研究熱點。同時,其他的數據轉換及處理技術也在飛速發展。
第三階段:從2006年至今,未見有新研究熱點的提出,原有的研究熱點也逐漸冷卻,2012年后,以往提出的研究熱點都趨于平靜。這表明在經歷1996—2005年的理論推廣期和活躍期后,基于人工智能的計算機視覺研究進入醞釀階段。
突現詞分析結果表明,人工智能與計算機視覺主研究點在歷年來拓展出了諸多研究方向,但各個方向都未形成明顯的研究派系。各研究方向正在完善自身的理論基礎,期待厚積薄發,成為新的研究熱點。
自1996年以來,基于人工智能的計算機視覺研究成果收獲頗豐。這足以表明基于人工智能的計算機視覺研究整體呈現活躍態勢。研究類別包含基本概念、基礎技術應用、具體技術應用、新發展方向等多方面從理論性到應用性的研究。研究方式趨于多樣化。發文量也呈現隨時間發展而上升的趨勢。整體看來本領域正欣欣向榮。
但基于人工智能的計算機視覺研究領域依然存在許多不足。如研究重點的關聯不足,作者以及機構間的合作較少,新概念的提出并未引起相關研究的爆發性增長等問題。在未來的研究中,第一,應當加強作者及機構間的聯系,強強聯手,以期做出更好的成果;第二,應當在保證基礎理論研究的情況下加大對新生技術以及概念的研究力度,當新概念或技術成為熱點時,才能更快地暴露其優勢或劣勢,從而決定未來的研究方向;第三,加強領域間的聯系,多向其他領域借鑒學習,他山之石可以攻玉,以期獲得新的研究目標或者成果。