0 引言
鏈接挖掘是一種涵蓋鏈接分析、Web結構挖掘、圖挖掘以及歸納邏輯編程等學科的交叉研究技術。Getoor等人將鏈接挖掘任務歸納為三類,即鏈接對象相關任務、鏈接相關任務以及圖相關任務。其中鏈接對象相關任務中基于鏈接的對象排序技術(LBR)可以有效地從互連的網頁或互引的文本中識別出權威性或影響力高的信息,從而確定權威的信息源或定位有影響力的文獻,該技術已成為當前搜索引擎的基礎。超文本鏈接的網絡結構以及文獻之間相互引用的互引模式為挖掘鏈接和互引的文本本身提供了額外的補充信息。這些鏈接往往體現了相互關聯元素的特征信息,如重要性、排名以及類別等。