沈陽工業大學信息科學與工程學院 張勝男 麻曉翠
專利引證分析的集成可視化方法
沈陽工業大學信息科學與工程學院 張勝男 麻曉翠
引證分析是專利分析的一項重要內容。針對大型層次數據在有限顯示區域內的可視化問題,提出了一種基于改進Hyperbolic tree的專利引證分析的集成可視化方法。將傳統的 Hyperbolic tree 和魚眼技術相結合,提高了空間的利用率,同時輔以一系列的交互手段有效地解決了可視化區域節點遮擋,細節信息展示能力有限等問題。
專利引證分析;可視化;Hyperbolic tree
專利引證分析是指對專利的引用和被引用情況進行分析,是專利分析中的一項重要內容。通過研究專利之間的引證關系,可以發現特定領域中的核心專利、技術趨勢,以及潛在的競爭對手[1]。由于專利信息數據量巨大,專利分析必須借助專業化的可視化分析工具。
現有的專利引證分析工具通常采用層次樹或Hyperbolic tree進行分析結果的呈現[2]。然而,隨著專利數據的不斷增長,專利引證分析可視化技術變得越來越具有挑戰性。傳統的Hyperbolic tree可視化方法在引證分析方面存在多級專利信息揭示能力有限、節點密集區域存在遮擋、相關的專利細節信息的展示能力有限幾方面的問題,因此本文設計了一個集成可視化模型,將Hyperbolic tree 和魚眼技術,以及其他可視化技術相結合。集成后的可視化模型既可以揭示引證信息的整體布局,又可以顯示局部節點的細節信息。
Hyperbolic tree基于雙曲平面顯示層次結構信息,不僅可以揭示整個樹的層次結構,還可以把當前用戶關注的部分用更多的空間來展示。Hyperbolic tree 技術主要由布局、映射和動態轉移這三部分構成。其中,布局指依據遞歸運算將樹形圖的根結點設在雙曲空間的中心,然后將根結點周圍的扇形區域按照前述遞歸方法平均分給其子結點,以此類推可以保證每個結點的不重疊。映射是指用龐萊卡投影將雙曲平面映射到歐幾里得平面。動態轉移的是指平滑的實現人機交互,提供信息導航功能。Hyperbolic tree 技術實現示意圖如圖1所示。

圖1 Hyperbolic tree技術實現示意圖
2.1 可視化布局
該模型的布局是將傳統的Hyperbolic tree和魚眼技術進行結合。魚眼技術是基于人類視覺觀察特性來設計的,可以將聚焦節點進行放大的同時縮小周邊節點,這樣既可以突出重點信息,也能夠揭示信息的上下文關系。
將根節點置于整個顯示區間的中央位置,而其他層次節點通過計算其相對于根節點位置的重要度來進行顯示,從而讓不同層次節點所占的空間沿著徑向逐漸縮小。采用這種布局首先使得層次眾多、容量巨大的樹形結構置入有限區域瀏覽成為可能。其次,根節點放置在視圖中央,分支依次呈放射狀展開,并按照樹的層級逐次減少分支的細節表達程度,用戶可以轉動整個樹調整被顯示的區域。處在區域中心的部分顯示較多細節,處在邊緣的部分細節被省略。這樣不但可以解決多級專利信息揭示能力有限問題,而且還能將聚集節點放大的同時縮小周邊節點,將更多的空間用來顯示當前被關注的區域,很大程度得提高了空間的利用率。
2.2 可視化交互
專利引證可視化模型的另一核心要素是用戶交互。交互式是用戶通過與系統間的對話和互動來操縱與理解數據的過程。本文根據需求,在改進的Hyperbolic tree中加入了6可視化交互方式。
(1)焦點轉移:使用者可以通過點擊Hyperbolic tree中任一層次的節點將所關注節點移動到圓形顯示區域的中心,處于中心的節點將被分配最大的區域,隨著引證級別的加深,被分配的區域越來越小。
(2)視圖切換:用戶可以調整樹的層次結構,將原始樹變為簡單的樹形結構,從而有效地隱藏節點的詳細信息。
(3)視點控制:以互不遮擋為原則,節點可在縮略顯示和全名顯示之間進行切換顯示。
(4)細節顯示:在縱覽整體信息的情況下,交互式地選擇一部分數據來對其進行特殊顯示,便于用戶確定感興趣專利的引證脈絡。
(5)Brushing:通過鼠標停留顯示該節點信息的具體細節。
(6)投影參數設置:用戶根據自己的需要定向的改變不同層次節點之間的距離,為不同的層次分配不同的顯示區間,從而達到重點突出,周邊兼顧的視覺效果。
2.3 多視圖表達
傳統的Hyperbolic tree中信息分析層次一般只能達到2級。為進一步展示節點的細節信息,本模型中同時使用overview和detail兩種窗口,前者可以為用戶提供整體的專利引證數據,便于用戶對全局信息的大體判斷,后者支持深挖細節,為此在detail窗口中添加了柱狀圖、折線圖、餅狀圖。多視圖中不同的可視化表達,方便了用戶觀察數據的不同屬性。

圖2 Hyperbolic tree交互式表達
以美國專利為背景,以新能源汽車為研究對象,檢索出2004年至2014年的專利及其引文數據。部分Hyperbolic tree交互式表達如圖2所示。
通過上述集成可視化方式,可以分析新能源汽車領域的專利布局,例如,查看專利被引情況、發現競爭對手、查看公司的專利布局、發現核心專利等。
專利引證分析的集成可視化模型結合了Hyperbolic tree和其他可視化技術,不僅解決了傳統層次數據可視化中存在的多級專利信息揭示能力有限、節點密集區域存在遮擋、相關的專利細節信息的展示能力有限問題,而且使檢索結果表達得更加清晰和豐富。本文方法可以應用在其他大型層次結構數據的可視化中。
[1]張兆鋒,桂婕,喬曉東,等.專利引證分析工具的設計與實現[J].數字圖書館論壇,2010(9):20-25.
[2]劉玉琴,彭茂祥.美國專利引證可視化系統的設計與實現[J].計算機工程與應用,2012,48(22):34-40.
[3]李志龍,陳誼,趙建宇,等.基于雙曲樹的農產品分類信息可視化方法[J].計算機仿真,2015,32(2):436-440.
遼寧省教育廳科學技術研究項目(L2014049)。