999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

R軟件在多元統計分析教學中的應用研究

2011-01-01 00:00:00閆朝暉
科技創新導報 2011年1期

摘 要:本文結合實例介紹了R軟件在多元統計分析中的應用,具體內容包括R軟件在聚類分析、主成分分析、典型相關分析等方面的應用。

關鍵詞:R軟件聚類分析主成分分析典型相關分析

中圖分類號:G43文獻標識碼:A文章編號:1674-098X(2011)01(a)-0157-02

在統計軟件方面,常用的統計軟件有SPSS、SAS、STAT、R、S-PLUS等。R軟件是一個自由、免費、開源的軟件,是一個具有強大統計分析功能和優秀統計制圖功能的統計軟件,現已是國內外眾多統計學者喜愛的數據分析工具。本文結合實例介紹了R軟件在多元統計分析中的應用,具體內容包括R軟件在聚類分析、主成分分析、對應分析等方面的應用。

1 在聚類分析教學中的應用

聚類分析又稱群分析,它是研究(樣品或指標)分類問題的一種多元統計方法,所謂類,通俗地說,就是指相似元素的集合。在社會經濟領域中存在著大量分類問題,比如若對某些大城市的物價指數進行考察,而物價指數很多,有農用生產物價指數、服務項目價指數、食品消費物價指數、建材零售價格指數等等。由于要考察的物價指數很多,通常先對這些物價指數進行分類。總之,需要分類的問題很多,因此聚類分析這個有用的工具越來越受到人們的重視,它在許多領域中都得到了廣泛的應用。

聚類分析內容非常豐富,有系統聚類法、有序樣品聚類法、動態聚類法、模糊聚類法、圖論聚類法、聚類預報法等。

R軟件及其相關包提供了各種聚類方法,主要是系統聚類方法、快速聚類方法、模糊聚類方法,常用的是系統聚類方法。

R軟件實現系統聚類的程序如下:

Hclust(d,method=“complete”)

其中d是由“dist”構成的距離結構,具體包括絕對值距離、歐氏距離、切比雪夫距離、馬氏距離、蘭氏距離等,默認為歐氏距離;method包括類平均法、重心法、中間距離法最長距離法最短距離法、離差平方和法等,默認是最長距離法。

例1:表1是廣東省2008年各市居民家庭平均每人全年消費性支出,利用所給數據對各市進行系統聚類。

R語言程序如下:

> X<-read.delim(\"clipboard\",header=T)

> row.names(X)<-c(“廣州”,“深圳”,“佛山”,“東莞”,“順德”,“中山”,“江門”,“茂名”,“湛江”,“珠海”,“汕頭”,“惠州”,“肇慶”,“揭陽”,“韶關”,“梅州”,“陽江”)

> d<-dist(scale(X))

> hc1<-hclust(d,\"single\")#最短距離法

> hc2<-hclust(d,\"complete\")#最長距離法

> hc3<-hclust(d,\"median\")#中間距離法

> hc4<-hclust(d,\"ward\")#Ward法

> opar<-par(mfrow=c(2,2))

> plot(hc1,hang=-1);plot(hc2,hang=-1)

> plot(hc3,hang=-1);plot(hc4,hang=-1)

2 在主成分分析教學中的應用

在實際經濟生活中,有時需要處理的是多變量(多指標)問題。由于變量較多,增加了分析問題的復雜性;但在實際問題中,變量之間可能存在一定的相關性,因此,多變量中可能存在信息的重疊。人們自然希望通過克服相關性、重疊性,用較少的變量來代替原來較多的變量,而這種代替可以反映原來多個變量的大部分信息,是一種“降維”的思想。

R軟件實現主成分分析的程序如下:

Princomp(x,cor=FALSE,scores=TRUE,…)

X為數據矩陣或數據框,cor為是否用相關陣,默認為協差陣,scores為是否輸出成分得分。

例2:對例1中的數據進行主成分分析。

R語言程序如下:

>X<-read.delim(\"clipboard\",header=T)

>cs.pr<-princomp(X,cor=TRUE)

>summary(cs.pr,loadings=TRUE)(表2、表3)

說明:

1)Standard deviation:表示主成分的標準差,即主成分的方差平方根,即相應特征值的開方;

2)Proportion of Variance:表示方差的貢獻率;

3)Cumulative Proportion:表示方差的累計貢獻率。

4)函數summary()中loadings=TRUE選項列出了主成分對應原始變量的系數。

由于前3個主成分的累計貢獻率已經達到82.4%,所以取前3個主成分來降維。

碎石圖是一種可以幫助我們確定主成分合適個數的有用的視覺工具,將特征值從大到小排列。

>biplot(cs.pr)(圖1)

>screeplot(cs.pr,type=c(\"barplot\"))

由圖2可以看出,取前3個主成分來降維是比較合理的。

3 在對應分析教學中的應用

對應分析(Correspondence analysis)也稱關聯分析、R-Q型因子分析,是近年新發展起來的一種多元相依變量統計分析技術,通過分析由定性變量構成的交互匯總表來揭示變量間的聯系。可以揭示同一變量的各個類別之間的差異,以及不同變量各個類別之間的對應關系。主要應用在市場細分、產品定位、地質研究以及計算機工程等領域中。原因在于,它是一種視覺化的數據分析方法,它能夠將幾組看不出任何聯系的數據,通過視覺上可以接受的定位圖展現出來。

本文結合實例,介紹了R軟件在多元統計分析教學中的具體應用,通過R軟件的具體操作來實現多元數據分析,一方面可以加深學生對多元統計方法的理解,更好的掌握多元統計理論方法,同時還可以使學生擺脫繁瑣的計算,使學生能處理實際的多元數據分析。

參考文獻

[1]王斌會.多元統計分析及R語言建模[M].廣州:暨南大學出版社,2010.

[2]湯銀才.R語言與統計分析[M].北京:高等教育出版社,2005.

主站蜘蛛池模板: 久久香蕉国产线看观看式| 怡红院美国分院一区二区| 特级精品毛片免费观看| 亚洲激情99| 青青草原国产一区二区| 国产精品久久久久鬼色| 久视频免费精品6| 亚洲色图综合在线| 美女毛片在线| 青青草原国产免费av观看| 视频在线观看一区二区| 日韩欧美国产中文| 免费人成在线观看成人片| 久久青草精品一区二区三区| 亚洲综合婷婷激情| 狠狠v日韩v欧美v| 日韩第一页在线| 中文字幕免费视频| 在线永久免费观看的毛片| 激情综合五月网| 国产不卡在线看| 福利视频一区| 91视频精品| 精品久久人人爽人人玩人人妻| 天天做天天爱夜夜爽毛片毛片| 任我操在线视频| 午夜精品久久久久久久无码软件| 国产国模一区二区三区四区| 久久99国产综合精品1| 亚洲成aⅴ人片在线影院八| 国产激情无码一区二区APP| 国产精品无码AⅤ在线观看播放| 国产高清免费午夜在线视频| 亚洲女人在线| 精品欧美一区二区三区久久久| 精品国产99久久| 国产成人精品一区二区三区| 极品尤物av美乳在线观看| 99视频精品全国免费品| 欧美精品v| 男女男精品视频| 毛片在线看网站| 黄色网站在线观看无码| 国国产a国产片免费麻豆| 免费看a毛片| 国产视频一区二区在线观看| 国产99精品视频| 国产一级妓女av网站| 精品一區二區久久久久久久網站| 欧美高清国产| 福利一区在线| 国产精品福利社| 女人毛片a级大学毛片免费| 一级毛片基地| 中美日韩在线网免费毛片视频| 国产手机在线ΑⅤ片无码观看| 久久超级碰| 高清久久精品亚洲日韩Av| 国产精品va免费视频| 国产剧情国内精品原创| 亚洲区第一页| 国产精品熟女亚洲AV麻豆| 亚洲无码高清视频在线观看| 日本亚洲成高清一区二区三区| 欧美色视频网站| 色综合天天娱乐综合网| 中国特黄美女一级视频| 9久久伊人精品综合| 91小视频在线| 国产在线专区| 亚洲天堂区| AV老司机AV天堂| 日韩精品毛片人妻AV不卡| 亚洲欧美另类日本| 538国产在线| 欧美区日韩区| 亚洲男人的天堂久久香蕉 | 天堂在线亚洲| 国产好痛疼轻点好爽的视频| 视频一本大道香蕉久在线播放 | 亚洲swag精品自拍一区| 日韩av高清无码一区二区三区|