摘要:在大規模高維數據挖掘研究中,數據存儲與索引方法的有效性是決定算法時空效率的重要因素。將數據空間網格劃分策略與高效率的樹型索引結構結合起來,可以充分發揮兩者在數據組織上的綜合優勢,將復雜問題轉換為結構化的簡單重復問題。在統一的框架下給出了各種數據空間網格劃分的定義,討論了兩種適用于實現網格化數據索引的R-樹和PK-樹索引結構。試驗結果表明,PK-樹在數據存儲和索引上具有更高的效率,與網格化數據組織方法結合起來,對于降低大規模高維數據分析問題的時空復雜度具有重要意義。
關鍵詞:網格劃分; PK-樹; 索引
中圖法分類號:TP391
文獻標識碼:A
文章編號:1001-3695(2005)12-0033-03