郭夢霞
(陜西職業技術學院管理系,陜西西安,710000)
SPSS 全稱為社會科學統計軟件包,英文全稱為statistical product and service solutions。SPSS 軟件操作簡單、方便快捷、界面美觀且具有準確完整的統計分析功能,因此SPSS 軟件得到了眾多用戶的好評。無論是在生物醫學還是社會科學上,都需要進行大規模的數據統計和數據分析工作,一般的數據處理軟件很難滿足這樣的需求,然而只要熟練的掌握了SPSS 軟件的使用,就可以輕松的利用SPSS 軟件對各個領域、行業的數據進行分析和處理統計。利用SPSS 軟件進行數據分析的首要工作就是建立SPSS 數據文件,然后利用SPSS 軟件有效的對數據進行組織,從而極大的方便分析和解決各個領域的定性數據統計分析問題。本文側重研究多變量的列聯表、多選項和單變量這三種形式的統計分析方法以及輸入方式。
通常數據按照取值來說可以分為四大類,有序定性數據、名義定性數據、計數數據和計量數據。有序定性數據:有序定性數據通常具有一定的順序或者序列,如文化程度,可以從高到低分為:博士、碩士、本科、???、高中、初中、小學等。名義定性數據:名義定性數據通??梢詤^分出來是否關系,按照邏輯上來說不是0 即為1。比如人的性別,不是男即為女。計數數據:計數數據具有一定的統計能力,也就是說能夠計算出來此類數據的數量。比如學生的人數、員工的數量等。計量數據:計量數據往往是某一個區間內的一個實數,比如人的體重、身高等。名義定性數據和有序定性數據往往我們稱之為定性數據,而計量數據和計數數據往往我們稱之為定距數據。
列聯表通常用來進行兩類以上的定性數據關聯性分析。本文以某汽車保險公司的保單為例,對無賠款記錄和有賠款記錄的保單按照被保險人年齡和車輛的類型進行分別統計分析。在統計分析表中,有無賠款記錄、年齡、車型屬于頻數分布表中的三個變量。有無賠款記錄、年齡、車型列聯表如表1 所示。

表1 聯列表
本文通過SPSS 軟件,利用此例對多變量數據列聯表進行研究。
1)建立賠款記錄、年齡和車型三個變量,有無賠款記錄的保單數用1、0 表示。年齡用1、2 表示。車型用1、2 表示。這樣設置以后,如果客戶屬于無賠款記錄包單數、25 歲以下、普通車型的話,就可以屬于0、2、1 表示。類似此例,將表1 聯列表中的數據輸入到SPSS 軟件中。
2)點擊SPSS 軟件中的Analyze、Descriptive、Crosstabs三個鍵,將變量賠款記錄保單數輸入到列框中,年齡輸入到行框中,車型輸入到Layer 框中。最后點擊OK 即可。
同樣,我們也可以利用加權的形式去組織數據。首先將數據輸入到SPSS 軟件中,將有無賠款記錄保單數、車型、年齡按照之前所述,建立新的變量。然后對數據進行列聯表分析。先加權:依次點擊Date、Weight Cases、Weight Cases by,將權重加入到Frequency Variable 中,然后點擊OK 鍵,進行列聯表分析。
在實際生活中,我們也會遇到多選項的問題,比如大學生的學習狀態。
1)逃課狀態有偶爾逃課、從不逃課、經常逃課
2)逃課理由有身邊同學影響、有重要事情沖突、可以自學、教師講的不好、厭倦此老師、厭倦此門課程等。
我們可以使用2 表示經常逃課、1 表示偶爾逃課、0 表示從不逃課。對于逃課理由因為是多選項變量,首先需要定義多選項變量集,將這些變量作為一個集合。下面我們通過大學生學習狀態這個例子進行多選項變量頻數統計的分析和研究。
1)首先對多選項問題進行分解,使用二分法,取0 和1 作為不被選擇和被選擇。
2)依次點擊SPSS 軟件中的Analyze、Multiple Response、Define Variable Sets 這些按鍵,然后輸入多項變量集的名稱。
3)再次點擊Analyze、Multiple Response、Crosstabs 將會得到頻數分析表。這樣就可以把多選項問題轉換成為多個變量的形式,然后就可以進一步的方便數據的統計分析工作。大學生逃課原因頻數分析表如表2 所示。

表2 逃課原因頻數分析表
通常SPSS 軟件所做的統計分析工作需要的數據必須是純數據文件,因此在進行定性數據分析之前,必須將定性資料分析轉換成為定性數據。比如:對消費者所喜歡的飲料情況進行調查,抽取50 名消費者作為樣本,可口可樂、蘋果汁、橘子汁、百事可樂、杏仁露作為飲料種類,分析50 名消費者對5 種飲料的喜歡程度,此時就需要將定性資料轉換為定性的數據。通常我們使用變量值標簽進行定性資料的定義,變量值標簽,如圖1 所示。

圖1 變量值標簽
利用變量值標簽,定義變量值,杏仁露=5,百事可樂=4,可口可樂=3,蘋果汁=2,橘子汁=1。然后將對50 名消費者的調查情況使用1、2、3、4、5 將調查數據輸入到SPSS 軟件中,最后點擊Analyze、Descriptive、Frequencies 即可完成單變量的頻數分析。最后點擊OK 鍵就可以得到最喜歡飲料的頻數分布表。最喜歡飲料的頻數分布表如表3 所示。

表3 最喜歡飲料的頻數分布表
本文首先對定性數據進行分析和解釋,然后通過對多變量數據列聯表分析、多選項變量的頻數統計和單變量的頻數統計等三種形式的定性數據統計分析和輸入方式的研究,來說明使用SPSS 軟件在定性數據分析中的優勢。熟練的掌握SPSS 軟件定性分析數據的技術,不僅可以快速的進行頻數統計,同時也可以進行列聯表等方面的統計工作,對各個領域、行業定性數據的分析具有很大的幫助。
[1] 蔡建瓊,于惠芳,朱志洪.SPSS 統計分析實例精選[M].北京:清華大學出版社.2006.
[2] 王靜龍,梁小筠.定性數據統計分析[M].北京:中國統計出版社,2008.
[3] 吳世軍.SPSS 在數據分析中的應用[J].統計與決策,2006,(5) :160- 161.
[4] 張文彤.SPSS11 統計分析教程[M].北京:北京希望電子出版社,2002.
[5] 郝黎仁,樊元,郝哲歐.SPSS 實用統計分析[M].北京:中國水利水電出版社,2003
[6] 姚友平,陶新,姚汝鋮.SPSS17.0 與衛生統計學應用指南[M].武漢:華中科技大學出版社,2010.