摘要:聚類算法是數據挖掘中核心技術之一,而k-means算法在經典聚類算法中占有重要地位。根據市場調查中的顧客感知質量,感知價格,市場份額和品牌類別為測試數據,用k-means算法進行數據挖掘,充分利用數據挖掘結果,得出符合市場現狀的市場定位結論。
關鍵詞:市場定位;顧客感知;k-means 算法;聚類中心
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2008)26-1635-02
Clustering Analysis of Market Location of the Product Based on K-means Arithmetic
ZHAI Yin, LUO Ping
(Mathematics and Information School, Langfang Teachers College, Langfang 065000, China)
Abstract:Clustering is the one of core technology in data mining. K-Means algorithm is a very famous clustering algorithm technology in the classical clustering. The test data based on a market survey of the quality of customer awareness, perception prices, market share and brand categories. Using k-means algorithm of data mining, and making full use of the results obtained the market status of market positioning conclusions.
Key words: marketing positioning; customer perception; k-means algorithm; clustering center
1 引言
隨著數據挖掘技術的發展,作為數據挖掘主要方法之一的聚類算法,也越來越受到人們的關注。數據挖掘(Data Mining),就是從大量數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單的說,數據挖掘就是從大量數據中提取或“挖掘”知識。
數據挖掘技術中的聚類(Cluster),就是把大量的d維數據樣本聚集成K個類,使同一類中樣本的相似性最大,而不同類中樣本的相似性最小。K- means算法屬于聚類方法中一種基本的劃分方法,該算法可以有效快速的得出各個樣本的聚類結果,同時提供各個被抽樣企業的聚類結果,為各企業進行合理的市場定位提供重要依據,相對傳統定位方式而言,具有實用性。整個聚類過程都交給數據挖掘算法,方便執行。
數據挖掘所挖掘出來的知識可應用于信息管理、決策支持、過程控制和許多其它方面。在產品市場定位中,要根據競爭者現有產品在市場上所處的位置,針對消費者對該產品某種特征或屬性的重視程度,強有力地塑造出本企業產品與眾不同的、給人以鮮明印象的個性或形象,并把這種形象生動地傳遞給消費者,從而使該產品在市場上確定適當的位置。市場調研員可以將品牌分為高質高價、高質低價、低質高價和低質低價等類。但是在現實的市場中,往往很難嚴格區分這四種類別。顧客對價格和質量的實際感知會受到品牌形象、顧客消費行為等多種因素的影響,如果廠商根據自身的技術水平和品牌的絕對價格進行市場定位很可能導致錯誤的分析結果。該文將應用K-means聚類算法對產品市場的現有情況,從感知價格、感知質量、市場份額和品牌類別四個方面進行分類。
2 K-means算法基本思想和實現步驟
K- means算法是一個有效的統計聚類技術。其核心思想簡要描述如下:
輸入:聚類個數K以及包含n個數據對象的數據集。
輸出:滿足目標函數值最小的K個聚類。
算法流程:
1)從n個數據對象中任意選擇K個對象作為初始聚類中心;
2)循環下述流程(3)到(4),直到目標函數取值不再變化;
3)根據每個聚類對象的均值(中心對象)計算每個對象與這些中心對象的距離,并且根據最小距離重新對相應對象進行劃分;
4)重新計算每個聚類的均值。
在本算法中要用到以下幾個定義:
3 K-means算法在產品市場分析中的應用
3.1 實現算法描述
首先從樣本中任意選擇4個對象作為初始聚類中心,而對于所剩下的其它對象,則根據它們與這些聚類中心歐氏距離,分別將它們要配與其最相似的( 聚類中心所代表) 聚類。然后,計算新的聚類中心。每一次聚類完成后,計算一次新的聚類中心,直到收斂為止。
(1) publicvoid token(double a,double b,double c,double d,int i);//比較差值,確定所屬類。
(2) public void center()
{int num1,num2,num3,num4;
num1=num2=num3=num4=0;
for(int j=0;j<4;j++)
{center_1[j]=center_2[j]=center_3[j]=center_4[j]=0;}//每聚類一次,求一次新的中心點。
(3) if((a<0.01)(b<0.01)(c<0.01)(d<0.01));//判斷聚類運算是否結束。
(4) public void DuplicateCenter()
{for(int j=0;j<4;j++)
{center_A[j]=center_1[j];
center_B[j]=center_2[j];
center_C[j]=center_3[j];
center_D[j]=center_4[j];}} //用新的簇中心替換舊的簇中心。
3.2 測試數據及運行結果分析
K-means算法在本文中主要是對產品市場的現有價值和潛在價值進行聚類分析,從而對產品市場進行分類,采取歐式距離(Euclidean Distance) 進行聚類分析,類之間的距離計算采用組間平均聯結法(Between Groups Linkage) 便能夠充分利用樣本的信息,為聚類算法在市場定位中運用提供了可行性。最后根據產品市場的特定規律和方法分析聚類的結果,產生最終的分析報告。
算法所使用的測試數據以txt格式保存在記事本中,品牌類別中0表示非上市公司,1表示國外品牌,2表示上市公司,部分數據如圖1所示,表1為利用K-means聚類算法分析出來的結果。
結合表分析,聚類的個數k值為4,希望把產品市場劃分為四類,對產品市場分析的結果可見:
第一類產品采取價格競爭的策略,感知價格和感知質量較高,市場份額較高,而且感知價格和感知質量較高基本上趨于平衡,屬于非上市公司產品。
第二類產品采取差異化策略,感知質量較高,但是感知價格和市場份額偏低,而且感知價格和感知質量較高之間不平衡,因此其經營策略沒有得到很好實現,屬于仿國外品牌產品。
第三類產品感知價格比第二類稍高,但感知質量相比要低,這類產品沒有找到自己在市場中的定位,如果不采取提高顧客感知質量或感知價格的策略可能面臨淘汰的風險,屬于國外品牌產品。
第四類產品感知價格和感知質量最高,市場份額也最高,主要采取差異化的策略,同時也放棄高質高價的定位,并在經營過程中得到了很好的實現,使這類品牌的經營較為成功,長期而言發展的可能性較大,屬于上市公司產品。
4 結束語
作為數據挖掘技術中的一種重要的方法,聚類分析可以用于產品市場的細分。按不同特征將產品分群后,就可以為每一群開發獨立的預測模型,并根據每一群的不同特點進行分析,從而提供差異化產品市場。本文主要是利用了聚類算法中的k-means算法對產品市場進行分析,通過產品的感知價格和感知質量對客戶進行分類,實現對產品市場的區分,企業進而可以查詢自己的聚類結果,找準在市場中的定位,做出符合企業發展的決策,確定能夠為自己帶來高利潤的那部分產品,從而研究切實可行的營銷方案。
參考文獻:
[1] 左子葉,朱揚勇.基于數據挖掘聚類技術的信用評分評級[J].計算機應用與軟件,2004,21(4):1-3,101.
[2] 何彬彬,方濤,郭達志.基于不確定性的空間聚類[J].計算機科學,2004,31(11):196-198.
[3] 黃勁松,趙平.聚類分析在品牌市場定位研究中的應用[J].數理統計與管理,2005(1):21-26.
[4] 湯效琴,戴汝源.數據挖掘中聚類分析的技術方法[J].微計算機信息,2003.19(1):3-4.
[5] HAN Jia-wei.Kamber M,著,范明,孟小峰,譯.數據挖掘概念與技術[M].北京:機械工業出版社,2001.