摘要:對關(guān)聯(lián)規(guī)則挖掘技術(shù)進(jìn)行了研究,描述了關(guān)聯(lián)規(guī)則的基本概念,介紹了關(guān)聯(lián)規(guī)則的分類;闡述了挖掘關(guān)聯(lián)規(guī)則的步驟,并展望了關(guān)聯(lián)規(guī)則進(jìn)一步的研究方向。關(guān)聯(lián)規(guī)則挖掘作為數(shù)據(jù)挖掘領(lǐng)域的一個重要研究內(nèi)容,它揭示了項(xiàng)集之間有趣的相關(guān)關(guān)系,可廣泛應(yīng)用于購物籃分析、數(shù)據(jù)分析、分類、網(wǎng)絡(luò)個性化服務(wù)、企業(yè)電子商務(wù)中客戶數(shù)據(jù)挖掘等廣泛領(lǐng)域。
關(guān)鍵詞:數(shù)據(jù)挖掘; 關(guān)聯(lián)規(guī)則; 關(guān)聯(lián)規(guī)則挖掘
中圖分類號:TP311.13 文獻(xiàn)標(biāo)志碼:A文章編號:1673-291X(2010)11-0198-02
數(shù)據(jù)挖掘是一個飛速發(fā)展的領(lǐng)域,不斷有新的技術(shù)和系統(tǒng)出現(xiàn)。而如何將這一技術(shù)應(yīng)用于實(shí)際工作中,還需要作更深一步的開發(fā)與研究,作為一個年輕的和很有希望的領(lǐng)域,數(shù)據(jù)挖掘依然面臨著很大挑戰(zhàn)和許多等待解決的問題。
在數(shù)據(jù)挖掘的知識模式中,關(guān)聯(lián)規(guī)則模式是比較重要的一種,也是最活躍的一個分支。
一、關(guān)聯(lián)規(guī)則的基本概念
關(guān)聯(lián)規(guī)則表示數(shù)據(jù)庫中一組對象之間某種關(guān)聯(lián)關(guān)系的規(guī)則。例如,關(guān)聯(lián)規(guī)則可以表示為“購買了項(xiàng)目A和B的顧客中有95%的人又買了C和D”。從這些規(guī)則可找出顧客購買行為模式,可以應(yīng)用于商品貨架設(shè)計(jì)、生產(chǎn)安排、針對性的市場營銷等。
采用關(guān)聯(lián)模型比較典型的例子是“啤酒和尿布”的故事。關(guān)聯(lián)規(guī)則問題由Agrawa1等人于1993年首先提出,隨即引起了廣泛的關(guān)注。許多研究者(包括R.Agrawal本人)對關(guān)聯(lián)規(guī)則挖掘問題進(jìn)行深入的研究,對最初的關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了改進(jìn)和擴(kuò)展。……