羅文海,張慶鳳
(1.濱州醫學院煙臺校區,山東 煙臺 264003;2.煙臺毓璜頂醫院,山東 煙臺 264003)
多重線性回歸是常用的統計分析方法,然而在多重線性回歸分析中有時會出現一些問題,如由于多重線性回歸的實踐技能不強,致使多重線性回歸分析的結論不夠準確和合理。因此,應當不斷增強多重線性回歸分析的實踐技能,以獲得更加準確和合理的統計分析結果。
許多人在進行多重線性回歸分析時,有習慣做法,以案例1進行說明。案例1:隨機抽取27名糖尿病病人的血清總膽固醇(mmol/L)、甘油三酯(mmol/L)、空腹胰島素(μU/ml)、糖化血紅蛋白(%)、空腹血糖(mmol/L)的測量值(見表1),試分析血糖的影響因素。
以血糖作為因變量y,血清總膽固醇、甘油三酯、空腹胰島素、糖化血紅蛋白作為自變量 X1、X2、X3、X4。逐步法是多重線性回歸分析的常用方法,采用軟件SPSS19.0進行統計,取檢驗水準的默認值α入=0.05、α出=0.10,逐步法的模型檢驗有統計學意義(P<0.001),其偏回歸系數及其檢驗結果見表2。
由表2可見,按α=0.05的水準,只有X4和X1被選入多重線性回歸方程,這是許多人習慣做法的結果。從專業知識上講,空腹胰島素是公認的能夠對血糖產生重要影響的因素,為何沒有被選入回歸方程?而在專業上認為對血糖沒有重要影響的血清總膽固醇卻為何被選入回歸方程?因此,該結果不夠合理,應該進一步探討其原因。

表1 27名糖尿病病人的血糖及有關變量測量結果

表2 逐步法偏回歸系數估計及其檢驗結果
使用多重線性回歸模型需要一定的前提條件,其前提條件包括多個自變量之間無多重共線性。……