□文/王懷亮
R軟件在系統聚類分析中的應用
□文/王懷亮
多元統計聚類方法已被廣泛應用于自然科學和社會科學的各個領域,而在現實處理多元數據聚類分析中,離不開統計軟件的支持;R軟件由于其免費、開源、強大的統計分析及其完美的作圖功能已得到越來越多人的關注與應用;本文結合實例介紹了R軟件在多元統計系統分析中的應用。
R軟件;系統聚類分析;多元統計
多元統計分析是統計學的一個重要分支,也稱多變量統計分析;在現實生活中,受多種指標共同作用和影響的現象大量存在,多元統計分析就是研究多個隨機變量之間相互依賴關系及其內在統計規律的重要學科,其中最常用聚類分析方法,由于多元統計聚類分析方法一般涉及復雜的數學理論,一般無法用手工計算,必須有計算機和統計軟件的支持。
在統計軟件方面,常用的統計軟件有SPSS、SAS、STAT、R、S-PLUS,等等。R 軟件是一個自由、免費、開源的軟件,是一個具有強大統計分析功能和優秀統計制圖功能的統計軟件,現已是國內外眾多統計學者喜愛的數據分析工具。本文結合實例介紹R軟件在多元統計聚類分析中的應用。
聚類分析又稱群分析,它是研究(樣品或指標)分類問題的一種多元統計方法,所謂類,通俗地說,就是指相似元素的集合。在社會經濟領域中存在著大量分類問題,比如若對某些大城市的物價指數進行考察,而物價指數很多,有農用生產物價指數、服務項目價指數、食品消費物價指數、建材零售價格指數等等?!?br>