范嘉慧 閆清云

摘要:SPSS軟件是常用的社科類統(tǒng)計軟件,主要用在統(tǒng)計與數(shù)學金融上面,但是它在土木程中的應(yīng)用還不是很廣泛,特別是在公路隧道的風險預(yù)判上沒有涉及到該領(lǐng)域。這個軟件在實際中的應(yīng)用可以減輕工作量,并且預(yù)測的比較準確。文章應(yīng)用的是SPSSl9.0版本。通過相關(guān)性分析,判斷影響因素之間關(guān)系。
關(guān)鍵詞:SPSS;相關(guān)性;回歸分析
1.相關(guān)分析
在數(shù)據(jù)分析中,經(jīng)常會碰到相關(guān)性問題,其主要是指各種影響因素的相互關(guān)系,可以通過建立特定條件下的相關(guān)變量或者是模型來進行因素的相關(guān)性分析,也就是在現(xiàn)有的多種數(shù)據(jù)基礎(chǔ)上,建立一個或幾個要素之間的相關(guān)關(guān)系,來對未來的實際工程實施進行科學的估計,可以進行相關(guān)分析以及偏相關(guān)分析,用相關(guān)系數(shù)矩陣的結(jié)果形式非常清楚地加以描述,便于閱讀其分析結(jié)果。線性相關(guān):相關(guān)系數(shù)有三種:Pearson、Spearman和Kendall。Pearson相關(guān)系數(shù)用于正態(tài)分布變量。Spearman和Kendall相關(guān)系數(shù)用于非正態(tài)或分布不明時。
2.回歸分析
回歸分析包括多元和逐步兩類,當有較多的影響因素時候,一般用多元回歸,如果用普通的方法來計算就會很麻煩,用該軟件簡單直接的能看出來,通過函數(shù)來對數(shù)據(jù)進行優(yōu)化處理,是一種比較好的方法。
邏輯回歸函數(shù)是根據(jù)Malthus模型,假設(shè)環(huán)境對種群密度是線性制約的,當種群大小接近環(huán)境容納量時,增長率將趨近于O,從而推導(dǎo)出有限環(huán)境下種群增長的數(shù)學模型。1920年美國社會學家Pead研究美國人口時,得到了與Verhulst同樣的公式,他將Ver-hulst的論文介紹出來,此后,這個公式就被稱為Verhulst-Pearl的Logistic模型。
3.應(yīng)用
文章數(shù)據(jù)來源于文獻[5],對于300個隧道數(shù)據(jù)分類。
皮爾遜相關(guān)性
r>0代表兩變量正相關(guān),r<0代表兩變量負相關(guān)。
|r|大于等于0.8時,可以認為兩變量間高度相關(guān);
|r|大于等于0.5小于0.8時,可以認為兩變量中度相關(guān);
|r|大于等于0.3小于0.5時,可以認為兩變量低度相關(guān);
|r|小于0.3說明相關(guān)程度弱,基本不相關(guān)。
3.1工程地質(zhì)-勘察設(shè)計
將工程地質(zhì)原因與勘察設(shè)計原因選人變量,在選項中勾選均值和標準差,選擇Pearson檢驗,點擊確定,得到相關(guān)性圖表。從表中看出工程地質(zhì)與勘察設(shè)計是負相關(guān),相關(guān)系數(shù)為0.935,根據(jù)皮爾遜檢驗則認為二者是高度相關(guān),然后點擊“圖形”-“舊對話框”,選擇散點圖。
添加總擬合線,從散點圖中可看出二者是高度負相關(guān),結(jié)合散點圖與相關(guān)性分析,R2線性系數(shù)為0.875,認為二者是相關(guān)的。
3.2工程地質(zhì)-施工方法
同上一步操作方法,得到皮爾遜相關(guān)系數(shù)為0.716,認為工程地質(zhì)與施工方法是中度相關(guān),在進行散點圖檢驗。添加總擬合線,從散點圖中可以認為二者近似在一條直線上,R2線性系數(shù)為0.513,證明二者近似可以認為是正相關(guān)。
3.3工程地質(zhì)原因-其他
從表格中可以看出來,相關(guān)系數(shù)為0.268是不相關(guān)。R2=0.072,不相關(guān)。
3.4勘察設(shè)計原因-施工方法
相關(guān)系數(shù)-0.684,中度相關(guān)。添加總擬合線,從散點圖中得到二者是負相關(guān),R2線性系數(shù)為0.468,點與直線距離較遠,為中等相關(guān)。
3.5勘察設(shè)計原因-其他
相關(guān)系數(shù)-0.043,不相關(guān)。添加總擬合線,散點圖所示的點距離直線遠,R2線性系數(shù)為0.002,認為該兩種影響因素是不相關(guān)的。
p-p正態(tài)概率圖,p-p圖是根據(jù)變量的累積比例與指定分布的累積比例之間的關(guān)系所繪制的圖形。通過p-p圖可以檢驗數(shù)據(jù)是否符合指定的分布,當數(shù)據(jù)符合指定分布時,p-p圖中各點近似呈一條直線。Q-Q圖是一種散點圖,對應(yīng)于正態(tài)分布的Q-Q圖,就是由標準正態(tài)分布的分位數(shù)為橫坐標,樣本值為縱坐標的散點圖。要利用Q-Q圖鑒別樣本數(shù)據(jù)是否近似于正態(tài)分布,只需看Q-Q圖上的點是否近似地在一條直線附近,而且該直線的斜率為標準差,截距為均值。用Q-Q圖還可獲得樣本偏度和峰度的粗略信息。Q-Q圖同樣可以用于檢驗數(shù)據(jù)的分布,所不同的是,Q-Q圖是用變量數(shù)據(jù)分布的分位數(shù)與所指定分布的分位數(shù)之間的關(guān)系曲線來進行檢驗的。p-p圖和Q-Q圖的用途完全相同,只是檢驗方法存在差異。
文章采用SPSS軟件19.0版本,打開軟件將數(shù)據(jù)以Excel格式錄入數(shù)據(jù),選擇“分析”-“描述統(tǒng)計”-“Q-Q圖”,將工程地質(zhì)原因、勘察設(shè)計原因、施工方法、其他選人變量,檢驗分布一欄默認正態(tài),然后點擊確定。