999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多指標面板數據聚類方法及其應用

2012-07-24 09:34:42任娟
統計與決策 2012年4期
關鍵詞:方法

任娟

(南京航空航天大學 經濟與管理學院,南京 210016)

0 引言

面板數據結合了截面數據和時間序列數據的特征,具有優良的特性,在研究中日益受到重視。然而,國內外很少學者考慮面板數據的多元統計分析。Bonzo D.C.和Hermosilla A.Y.[1]開創性地將多元統計方法引入面板數據的分析中,并用概率連接函數和遺傳算法改進了聚類分析。Ren J.[2]基于Fisher有序聚類理論,通過Frobenius范數重建了Ward函數,提出了一種多指標面板數據有序聚類方法。該方法沒有考慮指標的動態性,如指標的增長速度等。朱建平和陳民墾[3]對單指標面板數據的聚類分析進行了研究,其聚類算法和聚類過程類似于截面數據的聚類分析。李因果和何曉群[4]綜合考慮了面板數據的“絕對指標”和“增量指標”,在重構面板數據相似性測度的基礎上,提出了面板數據聚類方法。這種方法的不足之處是它對指標的增長速度的局部變化不能進行區分。另外,以上方法都是假設時間序列是同步的,但是,在現實世界中,這一條件并不總能滿足,許多情況下它們是非同步的。因此,本文認為應綜合考慮面板數據水平指標、增量指標、增量變化率指標及其非同步時間序列問題,為解決多指標面板數據聚類問題,擬提出一種面板數據聚類方法。

1 面板數據的數據格式

1.1 單指標面板數據

單指標面板數據的數據格式可以用一個二維表來表示。單指標面板數據聚類分析有兩種處理方法:一種是轉換方法,將單指標面板數據的時間維度轉換為截面數據的指標維度表示,兩種數據的統計描述特征相似,在聚類分析中,二者關于樣品距離的算法、聚類過程都是相同的,因此,單指標面板數據的聚類分析可以借鑒截面數據的聚類分析,可以直接運行相關軟件進行計算。另一種是一維有序樣品聚類方法,將單指標面板數據的空間維度轉換為有序樣品的指標維度表示,但需要進行降維處理得到一維指標。目前有不少專業軟件可以完成一維樣品有序聚類計算,比如DPS等。

1.2 多指標面板數據

在實際中,由于現象的復雜性,研究對象往往表現為多指標面板數據X,它表示一個樣本。多指標面板數據的結構要復雜一些,嚴格上應該用三維表來表示,也可以將其表示為矩陣形式。設一個樣本X包括的q個樣品,每個樣品的特征用p個指標描述,時間序列長度為T,實際上多指標面板數據含有空間(樣品)、指標和時間三個維度。

樣本X在空間維度上可表示為一組“空間樣品”,也就是將三維表在空間上展開為二維表,即:樣本X的一個“空間樣品”Xi的矩陣表示為:

2 多指標面板數據的時間序列特征

依據已有文獻,按照聚類分析處理面板數據的方法有:(1)每年分別進行聚類,顯然會造成各年度分類結果的不一致。(2)采取退化方法,對指標取其年度平均值進行聚類,消去時間維度,顯然損失了指標的時間維度信息。(3)采取簡化方法,不考慮指標的時序性,認為各時點上的指標對歐氏距離的貢獻程度一樣,顯然,忽視了指標的時間維度信息。(4)僅采用指標的水平值或者增量進行聚類,這種聚類結果不是忽視了指標的動態性,就是抹殺了指標的水平狀態。(5)采取綜合方法,采用指標的水平值和增量進行聚類,雖然提取了增量時間序列信息,但沒有進一步提取增量變化率時間序列信息。

顯然,上述五種聚類思路都存在一定的缺陷,對多指標面板數據的聚類:一方面要考慮樣本指標間的距離,另一方面必須考慮其時間序列的動態發展特征。因此,構造相似性指標時,必須考慮面板數據的水平指標、增量指標和增量變化率指標的時間序列。其中,水平指標的時間序列是第i個樣品的單個水平指標構成的時間序列增量指標的時間序列是將時間序列進行一階差分得到的序列,其中,增量變化率指標的時間序列是將時間序列進行二階差分得到的序列,其中:

3 聚類方法及聚類步驟

聚類分析是對q個樣品進行分類或對p個指標進行分類,其中前者稱為Q型聚類,后者稱為R型聚類。聚類分析有兩個關鍵問題:一是衡量樣品(或變量)間鄰近或相似程度的度量,另一個是聚類方法。

聚類分析常用的距離有絕對距離、歐氏距離、明考斯基距離、切比雪夫距離妙、馬氏距離等。常用的相似系數有夾角余弦、相關系數等。雖然多指標面板數據與截面數據的歐式距離有差異,但只是形式上的差異,本質上是一致的。這里,考慮采用樣本各指標的水平值、增量、增量變化率時間系列提取面板數據時間維度信息,選擇歐式距離來描述樣品之間的鄰近程度,即第u樣品與第v樣品之間的歐式距離d(u,v)為:

其中:

共3T-3個變量用來描述第i個樣品的第j個指標的水平值、增量、增量變化率時間序列,記為并用表示第i個樣品Xi。

樣品歐式距離d(u,v)可以認為是樣品間水平值、增量、增量變化率時間序列的三種距離的加權求和。權重一般根據實際問題進行設定,本文認為它們是等權重的。

考慮不同樣品的不同時期的相似性測度問題,則第u個樣品滯后h期與第v個樣品的滯后k期的歐式距離d(u-h,v-k)為:

其中:

用來描述第i個樣品的第j個指標滯后k期的水平值、增量、增量變化率時間系列,記為表示第i個樣品滯后k期為計算歐式距離時,對應的時間序列長度必須是相同的。

用于計算歐式距離的指標需滿足以下條件:指標之間不相關;消除各指標量綱的影響。相應的解決方法:原始數據通過因子分析得到的公共因子是不相關的;數據標準化處理即可消除量綱的影響。

實際應用中可根據指標重要性進行加權修正,權重系數可以根據研究問題的實際情況主觀給定或客觀測定,如實踐中常用的專家調查法,AHP,模糊判別,方差貢獻,熵權系數等方法確定權重系數。

聚類方法有系統聚類法、分解聚類法、有序樣品聚類法、動態聚類法、模糊聚類法等多種,其中,系統聚類法是目前國內外使用得最多的一種聚類方法。系統聚類法按類間距離的不同定義又可分為最短距離法、最長距離法、平均距離法、重心距離法和離差平方和法等。這里僅討論離差平方和法。

在類Gu中的樣品的離差平方和為:

其中,i∈Gu表示樣品Xi是類Gu中的一個樣品表示類Gu的第j指標在t時間的均值是類Gu中樣品的個數。

Wald認為兩類合并時所增加的離差平方和可以定義為兩類的平方距離。類Gu和類Gv間的離差平方和距離D2(u,v)定義為:

其中,Su、Sv和Sl分別是在類Gu和Gv以及它們并成的新類Gl中樣品的離差平方和,s和t分別是類Gu和Gv中樣品的個數,分別是類Gu和Gv的重心,分別表示Xi是類Gu和Gv中的一個樣品。

離差平方和法的遞推公式:在類Gm和類Gq合并成新類Gr后,新類Gr與另一類Gk的距離D(k,r)可表示為:

其中nk、nm、nr和nq分別表示類Gk、Gm、Gr和Gq中樣品的個數。

系統聚類的計算步驟包括:定義樣品間距離,計算樣品兩兩間距離構成的距離矩陣;合并距離最近的兩類為一新類,計算新類與當前各類的距離;如此循環,直至并為一類為止;畫聚類圖。

4 實證分析

4.1 聚類結果及分析

本文采用平均價格指標及其增量、增量變化率衡量公司的差異化戰略,采用銷售量指標及其增量、增量變化率衡量公司的低成本戰略。基于2009年3月~2010年3月國內空調市場上24個品牌(總的市場占有率為98%)的營銷統計數據,對24個品牌進行了聚類分析。數據來源于中怡康公司中國城市家電市場零售監測報告。戰略變量的描述涉及平均價格和銷售量兩個關鍵指標。數據的處理采用SPSS16.0和Matlab7.4軟件。聚類結果如圖1所示。第一類為海信、松下、三星、LG、三菱電機、日立、三菱重工、夏普和大金共9個品牌,這類企業產品平均價格高,價格波動小,溢價能力強,市場占有率比較穩定,采用差異化戰略參與市場競爭。其中,日立、三菱電機、三菱重工、夏普、松下均為日本品牌,三星、大金、LG則為韓國品牌,僅有海信為本土品牌。顯示日韓企業在中國市場的競爭策略甚為接近,在廣大的中國市場上不追求市場占有率,采取穩扎穩打的策略,這是日韓企業近年來采用輕資產戰略(降低重資產、增加無形資產)的結果。海信作為變頻空調龍頭企業,注重技術創新和產品質量,競爭戰略與日韓企業相似。第二類為新科、揚子、奧克斯、志高、惠而浦、長虹、科龍、TCL、格蘭仕、新飛和春蘭共10個品牌。除了惠而浦為美國品牌,其余全為本土品牌。這類企業產品平均價格較低,價格波動大,市場占有率不穩定,傾向于價格戰來爭奪市場份額,溢價能力弱,創新能力不足,推出新產品較少,采用低成本戰略參與市場競爭。第三類為伊萊克斯。伊萊克斯為瑞典品牌,其產品平均價格較高,價格波動大,溢價能力一般,既追求市場份額,又塑造高檔形象;體現為在低端路線和高端路線的選擇上搖擺不定,這是因為伊萊克斯正處在由低端產品向高端產品戰略的轉型時期,陷入了“夾在中間”的困境。第四類為格力、美的和海爾。其產品平均價格較高,價格波動較大,市場占有率高,產品溢價能力強,創新能力強,新產品推出較多。采用低成本和差異化戰略參與市場競爭。

圖1 面板數據聚類分析譜系圖

4.2 面板數據聚類方法比較分析

為說明本文提出的聚類方法的優越性,下面采用上例的數據來進行驗證,并給出本文方法和文[4]的多指標面板數據聚類方法分類效果的比較。

文[4]采用水平指標和增量指標進行面板數據聚類,一定程度上刻畫了水平指標的發展變化情況,但是沒有進一步對增量變化程度的刻畫,所得分類結果不夠細致。本文方法采用水平指標、增量指標和增量變化率指標綜合測度面板數據的樣品相似性,提取信息比較充分,所得分類結果(圖1)比較細致。另外,實際應用中,根據研究問題的實際情況也可采用三種量的組合進行聚類。

表1 24個空調品牌的面板數據聚類結果

5 結論

本文聚類方法特別適用于針對具有多指標的面板數據的樣品分類問題,綜合考慮面板數據的水平指標、增量指標和增量變化率指標的時間序列特征及其非同步時間序列問題,重新構造了離差平方和函數,提出了一種多指標面板數據聚類方法。通過實證分析,表明新方法能夠解決多指標面板數據聚類的問題,分類效果較好。但是分類規模較大時,分類將呈現組合爆炸的趨勢,計算量隨著急劇增加,尋找最優解變得困難,對于采用遺傳算法等人工智能方法搜尋次優解有待于將來進一步的研究。

[1]Bonzo D C,Hermosilla A Y.Clustering Panel Data via Perturbed Adaptive Simulated Annealing and Genetic Algorithms[J].Advances in Complex Systems,2002,(4).

[2]朱建平,陳民墾.面板數據的聚類分析及其應用[J].統計研究,2007,(4).

[3]Ren J,Shi Sh L.Multivariable Panel Data Ordinal Clustering and Its Application in Competitive Strategy Identification of Appliance-wir?ing Listed Companies[C].International Conference on Management Science& Engineering(16th),Moscow,Russia,2009.

[4]李因果,何曉群.面板數據聚類方法及其應用[J].統計研究,2010,(9).

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 永久免费av网站可以直接看的| 国产欧美精品午夜在线播放| 91免费观看视频| 欧美一区二区人人喊爽| 国产三级毛片| 国产激情无码一区二区APP| 亚洲熟妇AV日韩熟妇在线| 99热这里只有精品久久免费| 日韩高清一区 | 国产成人综合亚洲网址| 亚洲另类国产欧美一区二区| 欧美三级不卡在线观看视频| 精品無碼一區在線觀看 | 亚欧成人无码AV在线播放| 国产99精品视频| 99久久精品国产自免费| 又粗又硬又大又爽免费视频播放| 国内丰满少妇猛烈精品播| 欧美不卡视频在线| 亚洲香蕉在线| 手机精品福利在线观看| 亚州AV秘 一区二区三区| 超碰aⅴ人人做人人爽欧美| 欧美日韩在线亚洲国产人| av天堂最新版在线| 国产乱人伦精品一区二区| 国产国产人在线成免费视频狼人色| 91久久偷偷做嫩草影院| 中国特黄美女一级视频| 爆操波多野结衣| 精品国产aⅴ一区二区三区| 日韩久草视频| 欧美激情综合| 亚洲福利片无码最新在线播放| 四虎永久免费在线| 欧美色亚洲| 亚洲综合色区在线播放2019| 99久久亚洲综合精品TS| 亚洲欧美国产视频| 久久国语对白| 亚洲人成色77777在线观看| 色135综合网| 久久国产乱子| 免费国产不卡午夜福在线观看| 精品撒尿视频一区二区三区| 91美女视频在线| 91啪在线| 奇米影视狠狠精品7777| 青青草国产一区二区三区| 色爽网免费视频| 亚洲另类第一页| 国产微拍一区二区三区四区| 国产永久在线观看| 日韩国产精品无码一区二区三区 | 欧美在线视频不卡| 91在线国内在线播放老师 | 亚洲性影院| 国产视频入口| 97se亚洲综合不卡 | 久久国产精品77777| 暴力调教一区二区三区| 制服丝袜在线视频香蕉| 久久一本精品久久久ー99| 天天综合网色中文字幕| 欧美国产菊爆免费观看| 91国内在线观看| 国产原创第一页在线观看| 久久人人妻人人爽人人卡片av| 亚洲国产亚综合在线区| 日韩欧美91| 99视频全部免费| 欧美精品高清| 动漫精品中文字幕无码| 国产一二三区在线| 国产激爽大片高清在线观看| 欧美成人A视频| 欧美日韩成人| 国产麻豆永久视频| 91热爆在线| 熟女日韩精品2区| 免费在线看黄网址| 国产日本欧美在线观看|