管恩政 常曉宇 王 喆 周春光
摘要:為解決從數據庫中挖掘長模式可能遇到較高的計算復雜度問題,提出一種新的算法FFSPAN。傳統上,要判斷一個序列是否頻繁,需要在原數據庫中判斷整個序列是否頻繁;而算法FFSPAN是通過在序列數據庫中尋找一個頻繁項或一個頻繁項集來代替尋找一個完整的頻繁序列,而且FFSPAN算法每次掃描的數據庫都是迅速減小的,這使得算法在挖掘的序列模式越長時越有效.在標準測試數據集上的實驗結果表明,FFSPAN算法非常有效。
關鍵詞:序列模式;長模式;深度優先;數據挖掘
中圖分類號:TP31
文獻標識碼:A
文章編號:1671-5489(2005)06-0768-05