


摘 ?要:本文針對(duì)某餐飲商家提供的客戶數(shù)據(jù)和菜品數(shù)據(jù),進(jìn)行了數(shù)據(jù)預(yù)處理,并對(duì)處理后的數(shù)據(jù)進(jìn)行建模分析。對(duì)客戶信息進(jìn)行K-means(K均值)聚類,識(shí)別出高低價(jià)值的客戶群,為商家維系與客戶之間的關(guān)系提供參考。對(duì)菜品數(shù)據(jù)利用Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘,找出菜品之間的關(guān)聯(lián)關(guān)系,為菜品的促銷和推薦提供依據(jù)。
關(guān)鍵詞:聚類算法;關(guān)聯(lián)規(guī)則;餐飲服務(wù);數(shù)據(jù)挖掘
中圖分類號(hào):TP311.13 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)16-0010-04
Abstract:This paper conducts data preprocessing for customer data and dish data provided by a catering business,and models and analyzes the processed data. K-means clustering of customer information,identify high-low value customer groups,and provide reference for the relationship between merchants and customers. Use the Apriori algorithm to mine the association rules for the food data,find out the relationship between the dishes,and provide the basis for the promotion and recommendation of the dishes.
Keywords:clustering algorithm;association rules;catering;data mining
0 ?引 ?言
在數(shù)據(jù)暴增的當(dāng)今時(shí)代,數(shù)據(jù)中含有大量有價(jià)值的信息,如何利用相關(guān)技術(shù)發(fā)現(xiàn)這些信息,并為商家和客戶帶來便利,是數(shù)據(jù)挖掘研究的熱點(diǎn)內(nèi)容。數(shù)據(jù)挖掘技術(shù)越來越廣泛地應(yīng)用在各個(gè)行業(yè):徐毅佳[1]利用關(guān)聯(lián)規(guī)則挖掘輔助壽險(xiǎn)公司的經(jīng)營(yíng)策略,利用聚類算法和可視化技術(shù)分析理賠案件并發(fā)現(xiàn)欺詐案件。孫小川等人[2]將聚類算法應(yīng)用在犯罪數(shù)據(jù)分析上,通過對(duì)數(shù)據(jù)進(jìn)行加權(quán)優(yōu)化和機(jī)器學(xué)習(xí)方法,預(yù)測(cè)犯罪案由。駱赟韻等人[3]利用關(guān)聯(lián)規(guī)則技術(shù)發(fā)現(xiàn)當(dāng)代中醫(yī)婦科名家痛經(jīng)用藥規(guī)律。楊柏丞等人[4]以事故類型為K-中心點(diǎn)算法的聚類中心,與關(guān)聯(lián)規(guī)則Apriori[5]算法進(jìn)行融合,實(shí)現(xiàn)對(duì)海事事故數(shù)據(jù)的致因分析。郭振玉[6]提出一種改進(jìn)的聚類分析與關(guān)聯(lián)規(guī)則方法,建立用戶行為模式庫,用于監(jiān)測(cè)用戶的異常行為分析。王斯鋒等人[7]在協(xié)同過濾推薦系統(tǒng)中,采用關(guān)聯(lián)規(guī)則挖掘用戶與項(xiàng)目之間的隱式交互記錄,利用聚類進(jìn)行數(shù)據(jù)降維,減少數(shù)據(jù)的大小和項(xiàng)目空間的維度。餐飲行業(yè)的商家有著大量的客戶數(shù)據(jù)和菜品數(shù)據(jù),很多商家對(duì)于這些數(shù)據(jù)非常不敏感,白白浪費(fèi)了很多有意義的隱含信息。周宇等人[8]提供了一種新型的電子餐飲服務(wù)解決方法,主要是利用網(wǎng)上訂餐平臺(tái),來規(guī)范餐飲服務(wù)模式。韓建軍等人[9]基于餐飲服務(wù)的痛點(diǎn),詳細(xì)探討了影響客戶滿意度的要素。
對(duì)于餐飲行業(yè)來說,商家要獲取長(zhǎng)期的利潤(rùn),必須具有穩(wěn)定的、高質(zhì)量的客戶。保持客戶對(duì)于企業(yè)是至關(guān)重要的,不僅因?yàn)闋?zhēng)取一個(gè)新客戶的成本遠(yuǎn)遠(yuǎn)高于維持老客戶的成本,更重要的是客戶流失會(huì)造成企業(yè)收益的直接損失。因此商家應(yīng)努力維系客戶關(guān)系,將在生命周期內(nèi)與客戶的互動(dòng)價(jià)值最大化,并盡可能地保持這樣的高水平。
1 ?基于聚類的客戶價(jià)值分析
1.1 ?數(shù)據(jù)預(yù)處理
某餐廳提供的近三個(gè)月的部分客戶數(shù)據(jù)信息和菜品信息,其中包含客戶姓名、性別、消費(fèi)次數(shù)、消費(fèi)金額、最后一次消費(fèi)時(shí)間、菜品名稱、被點(diǎn)次數(shù)等數(shù)據(jù)信息。數(shù)據(jù)集中有部分缺失值和異常值,如圖1所示,需要對(duì)這些值進(jìn)行處理。
由關(guān)聯(lián)規(guī)則結(jié)果可得,當(dāng)客戶點(diǎn)了e這道菜,我們會(huì)推薦a和c這兩道菜給客戶,或者捆綁a、e和a、c進(jìn)行出售。同理,客戶點(diǎn)了c這道菜,我們會(huì)推薦a和b這兩道菜給客戶,或者捆綁c、b和a、c進(jìn)行出售。用Apriori進(jìn)行關(guān)聯(lián)規(guī)則挖掘,挖掘出來的結(jié)果可給商家提供推薦菜品和捆綁銷售的依據(jù)。
2 ?結(jié) ?論
利用商家提供的客戶數(shù)據(jù)和菜品數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理之后再建模。對(duì)于客戶數(shù)據(jù),用K-means聚類模型,將客戶分為不同價(jià)值的群體。對(duì)于菜品數(shù)據(jù),利用Apriori進(jìn)行關(guān)聯(lián)規(guī)則挖掘,輸出菜品之間的關(guān)聯(lián)性。商家可針對(duì)客戶的不同價(jià)值進(jìn)行客戶管理。比如給高價(jià)值客戶群提供關(guān)聯(lián)菜品推薦,并給出相應(yīng)的折扣,保持這些客戶的忠誠(chéng)度。對(duì)于“挽留”性質(zhì)的客戶,提醒近期的優(yōu)惠活動(dòng),優(yōu)惠活動(dòng)依據(jù)關(guān)聯(lián)菜品的捆綁銷售等等。由此在提高客戶滿意度的同時(shí),也能夠增加商家的利益。本文在菜品推薦部分利用關(guān)聯(lián)規(guī)則算法,該算法產(chǎn)生關(guān)聯(lián)規(guī)則的過程比較難,可以結(jié)合協(xié)同過濾及其改進(jìn)的方法進(jìn)行推薦,先構(gòu)建用戶畫像,找出用戶的特征向量,并結(jié)合菜品的特征向量,進(jìn)行準(zhǔn)確率較高的推薦,這也是后續(xù)即將展開的研究。
參考文獻(xiàn):
[1] 徐毅佳.商業(yè)智能數(shù)據(jù)挖掘技術(shù)提升客戶服務(wù)能力研究 [D].杭州:浙江工業(yè)大學(xué),2019.
[2] 孫小川,蘆天亮.基于聚類的數(shù)據(jù)加權(quán)優(yōu)化在犯罪預(yù)測(cè)中的應(yīng)用 [J].計(jì)算機(jī)與現(xiàn)代化,2019(6):55-59.
[3] 駱赟韻,李佳陽,黎小斌.基于關(guān)聯(lián)規(guī)則的當(dāng)代中醫(yī)婦科名家痛經(jīng)用藥規(guī)律數(shù)據(jù)挖掘 [J].世界中醫(yī)藥,2019,14(5):1188-1191+1197.
[4] 楊柏丞,馬建斌,王哲凱,等.海事事故的聚類與關(guān)聯(lián)規(guī)則 [J].中國(guó)航海,2018,41(3):63-67.
[5] Agrawal R,Srikant R.Fast Algorithms for Mining Association Rules in Large Databases [C]//Proceedings of the 20th International Conference on Very Large Data Bases. IEEE,1994:487-499.
[6] 郭振玉.基于聚類分析和關(guān)聯(lián)規(guī)則的數(shù)據(jù)庫用戶行為模式分析的研究 [D].武漢:武漢理工大學(xué),2016.
[7] 王斯鋒,朱玉佳,祝永志.使用隱式數(shù)據(jù)中的聚類和關(guān)聯(lián)規(guī)則挖掘提高協(xié)同過濾建議的準(zhǔn)確性 [J].通信技術(shù),2019,52(5):1108-1113.
[8] 周宇,張振軍,胡啟超,等.專注校園餐飲電子商務(wù)服務(wù)解決方案 [J].現(xiàn)代營(yíng)銷(信息版),2019(6):76.
[9] 韓建軍,黃佩,俞華.餐飲行業(yè)服務(wù)對(duì)象分析 [J].質(zhì)量與認(rèn)證,2019(5):54-56.
[10] Han J,Pei J,Yin Y.Mining Frequent Patterns Without Candidate Generation [A].Proceedings of 2000 ACM SIGMOD International Conference on the Management of Data [C].New York,USA:ACM Press,2000:1-12.
作者簡(jiǎn)介:黎丹雨(1990-),女,漢族,湖北棗陽人,助教,碩士,研究方向:數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)。