唐靜榮
引言:現今統計軟件眾多,R軟件、SPSS、Stata和Weka等均擁有大量用戶。本文通過對比統計軟件中R和SPSS,細致分析他們各自的特點、功能、適用對象,為用戶對統計軟件的選擇提供幫助。
相對于SPSS,R軟件起步較晚。SPSS是最早出現的統計分析軟件,也是最早采用圖形菜單驅動界面的統計軟件;R軟件誕生于1980年左右,采用編程語言,擁有簡潔的命令窗口。SPSS操作容易,受到初學者的歡迎,通過交互界面,點擊菜單即可完成對數據的分析;
R軟件要求用戶使用R語言,通過輸入正確的命令來完成操作。相對于SPSS,R軟件具有很強的靈活性,自定義的輸入形式和開放的源代碼讓R軟件風靡全球。
Wilcoxon符號秩檢驗屬于兩樣本非參數檢驗的一種,SPSS和R軟件均可實現其操作。下面分析R軟件、SPSS用于Wilcoxon符號秩檢驗的不同。
案例:改制前后某廠八個車間競爭性的比較:
車間 1 2 3 4 5 6 7 8
改制前 37 72 57 44 43 64 55 65
改制后 40 73 59 43 51 67 61 74
問:改制前后競爭性有無顯著差異。
(一)SPSS操作步驟:
1、建立變量2、輸入數據3、分析-分參數檢驗-舊對話框-2個相關樣本4、選擇檢驗變量5、選擇Wilcoxon檢驗方法6、確定。結果如下:
秩
N 秩均值 秩和
改制后 - 改制前 負秩 1a 1.50 1.50
正秩 7b 4.93 34.50
結 0c
總數 8
a. 改制后 < 改制前
b. 改制后 > 改制前
c. 改制后 = 改制前
檢驗統計量b
改制后 - 改制前
Z -2.316a
漸近顯著性(雙側) .021
a. 基于負秩。
b. Wilcoxon 帶符號秩檢驗
改制后—改制前:負秩個數為1,正秩個數為7;負秩的平均值和秩和均為1.5,正秩的平均值和秩和分別為4.93、34.5。Z統計量為-2.316,雙側檢驗的P值為0.021。選擇5%的顯著性水平,α=0.05,0.021<0.05拒絕原假設,認為八個車間改制前后有顯著差異。
(二)R軟件操作步驟
R軟件可以選擇左邊、右邊、雙邊檢驗以配合不同的檢驗類型,本題為配合SPSS選擇了雙邊檢驗,雙邊檢驗在命令中可以省略。SPSS在舊對話框選項中選擇2個相關樣本檢驗,R軟件的命令形式為paierd=true。Wilcoxon符號秩檢驗在R軟件中可以用于檢驗兩獨立樣本的情況,選擇更具有多樣性。
SPSS擁有中英雙界面,輸出結果也有中英兩種格式,用戶可以自由選擇。SPSS操作簡便,用戶只要具備基本的統計知識即可用SPSS分析數據。便捷的菜單欄可以提供多種數據分析方式,用戶無需花費大量時間記憶繁多的命令和過程。SPSS能夠進行數據輸入、編輯、統計分析、圖形制作、報表等功能,提供了簡單的描述統計及復雜的多因素分析方法,比如主成分分析、因子分析、聚類分析、參數檢驗、非參數檢驗等;能夠讀取多種數據格式,比如*.dbf、*.xls等,可以輸出*.txt及html格式的文件。SPSS是制圖方面的強手,由于缺少穩健和調查的方法,處理前沿的統計過程是其弱項。
同樣是統計分析軟件的R軟件,有著區別于SPSS的獨特之處。它擁有極簡的界面,數據處理過程完全依賴R語言,只有輸入正確的命令,R軟件才能運算。所以R軟件更適合高級用戶,R軟件用戶需掌握大量的編程語言,否則無法運行R軟件更不能領會R軟件的魅力。R軟件功能強大,擁有連貫完整的統計分析工具,數組運算工具,數據存儲和處理系統,并可實現用戶的自定義功能。它有成千(3500+)的擴展包,涉及金融、聚類、預測、最優化、高性能計算、自然語言處理等供用戶使用。此外,R軟件是一款免費的自由軟件,它有WINDOWS、LINUX、MacOS和UNIX版本,都是可以免費下載和使用的。因此,R軟件使得部分用戶成為開發者,用戶可以自己編寫包進行使用和發布。
用戶對于SPSS和R軟件的使用,可以根據其需求及能力。當然,SPSS和R軟件的結合使用能將數據處理的更加完美。
參考文獻
[1]薛留根 《應用非參數統計》 科學出版社 2013.
[2]何曉群 《多元統計分析》 中國人民大學出版社 2012.