楊青文



摘 要:文章列舉了若干使用SPSS軟件進行煤質指標分析的案例,通過對統計分析結果的。
關鍵詞:SPSS;控制圖;正態分布;線性回歸
1 引言
SPSS是IBM公司推出的一系列用于統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱,具有自動統計繪圖、數據的深入分析、使用方便、功能齊全的數理統計分析軟件。本文以版本IBM SPSS Statistics 19為例,就其在煤質指標分析中的應用進行一些探索。
2 控制圖
SPSS支持直接的Excel數據表導入功能,打開SPSS軟件,在文件一欄選擇打開數據,點開之后在文件類型中選擇Excel(*.xls, *xlsx, *xlsm)。
2.1數據前處理
先進入描述統計的頻率子菜單,選擇變量Mt,統計量選擇偏度和峰度,點擊確定。看偏度系數和峰度系數,如果均小于1,那么符合正態分布,可以進行下一步控制圖分析。
2.2選則過程度量和定義子組
過程度量為全水分,定義子組為批次編號。
2.3設定選項、控制規則
選項sigma的數目為3,最小子組大小為2.不顯示由缺失值定義的子組。X條形圖、R圖、s圖的控制規則,勾選所有選項,在實際應用中可根據分析需求確定所需要的控制規則。
2.4繪出控制圖
可以觀察出倒數兩個點以及倒數第四個點是違反規則的異常點,違反規則見下表X條形圖規則違反。
3 個點違反控制規則。
3 發熱量回歸分析與正態分布檢驗
3.1 數據操作
某礦煤質統計指標;選中描述統計-頻率-選擇變量Mt、Aar、Ad、Qgr,d、Qnet,ar,統計量選擇偏度和峰度,點擊確定。看偏度系數和峰度系數,如果均小于1,那么符合正態分布。
對于新礦點:累積6組以上用該模型,6組之前用相近的礦點公式進行診斷。
3.2 線性擬合
正態分布檢驗完畢,進行線性擬合,參數選擇如下:
(1)線性回歸統計量。回歸系數選擇“估計”,選擇“模擬擬合度”,殘差選擇“Durbin - Watson(U)”和個案診斷,離群值填“3”標準差。其他選項均不選。
(2)線性回歸繪制。Y(Y)選擇DEPENDENT,X2(X)選擇DRESID。
(3)線性回歸保存。預測值選擇“未標準化”,殘差選擇“未標準化”,預測區間選擇“均值”、“置信區間95%”,勾選“包含協方差矩陣”。系數統計、影響統計量、距離等參數不選。
(4)線性回歸選項。使用F的概率,進入0.05,刪除0.10;勾選“在等式中包含常量”和“按對排除個案”。
3.3 數據分析
Qgr,d與Ad,Qnet,ar與Mt、Aar的擬合結果為:
①Qgr,d = 34.241 - 0.388Ad;
②Qnet,ar = 33.762 - 0.390Mt - 0.390Aar;
以公式②為例:
(1)相關系數檢驗觀察調整R方值,為0.985,非常接近1,表示自變量對因變量的解釋很好,能達到98.5%。
a. 預測變量: (常量), 收到基灰分Aar, 全水分Mt。
b. 因變量: 收到基低位熱值Qnet,ar
(2)F檢驗。F檢驗是對擬合的回歸模型整體的方差檢驗值,觀察回歸曲線的F檢驗sig值,如果小于0.05說明整個回歸模型有顯著作用,F統計量值與Fα(1,n-2)進行比較(顯著性水平,一般取0.05),F>Fα(1,n-2),拒絕H0,表明回歸效果顯著,F≤Fα(1,n-2),接受H0,此時回歸效果不顯著。
(3)各個自變量的t檢驗sigma值,t統計量值的正負表示該自變量對因變量的影響是正還是負。|t|>tα(n-2),拒絕H0,回歸效果顯著;|t|≤tα(n-2),接受H0,回歸效果不顯著。
(4)計算出Qgr,d = 24.200MJ/kg,實際測量值為Qgr,d = 24.388MJ/kg,相差-188J/g。計算值Qnet,ar = 20.978MJ/kg,實際測量值為Qnet,ar = 21.147MJ/kg,相差-169J/g。
4 結語
煤質指標間其他指標也存在較強的聯系,如發熱量和水分、揮發分、灰分、硫分、氫值間的關系,碳值與氫值的關系,以及其他,本文只是冰山一角,拋磚引玉。借助SPSS這樣強大的數理統計軟件,可以以更具體量化的方式去衡量已知的物理關系,并啟發幫助我們尋找更多的未知的潛在聯系。