摘要:當(dāng)前許多工程領(lǐng)域產(chǎn)生大量高速實(shí)時(shí)的流式數(shù)據(jù),基于流式數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘應(yīng)用廣泛,與傳統(tǒng)的靜態(tài)數(shù)據(jù)相比,流式數(shù)據(jù)上關(guān)聯(lián)分析面臨極大的資源挑戰(zhàn)。提出了流式數(shù)據(jù)上關(guān)聯(lián)規(guī)則的形式化定義和基本挖掘算法,系統(tǒng)地回顧了近年來(lái)流式數(shù)據(jù)上關(guān)聯(lián)規(guī)則挖掘的研究進(jìn)展,詳細(xì)分析了目前挖掘算法研究中存在的主要問(wèn)題和解決途徑,闡述了未來(lái)的研究方向。
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)流;關(guān)聯(lián)規(guī)則;頻繁項(xiàng)集;頻繁模式;知識(shí)發(fā)現(xiàn)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2010)09-3201-05