劉力平
(常德市二中 湖南常德 415500)

回歸分析是高中數學必修3、選修1-2以及選修2-3的學習內容,數學必修3之后,學生已經學習了兩個變量之間的相關關系,包括畫散點圖、最小二乘法求回歸直線方程等內容。在人教A版選修1-2、2-3《回歸分析的基本思想及其初步應用》這一節中進一步介紹回歸分析的基本思想及其初步應用。這部分內容包括:線性回歸模型的數學表達式,隨機誤差項產生的原因,使學生能正確理解回歸方程的預報結果,并能從殘差分析角度討論回歸模型的擬合效果,從相關系數、相關指數角度探討回歸模型的擬合效果,以及建立回歸模型的基本步驟,介紹兩個變量非線性相關關系等。
回歸分析在經濟學、統計學、遺傳學及日常生活中應用得非常廣泛。例如,某種農作物的產量和溫度有密切的關系,但產量不僅與溫度有關,還和日照時間、濕度等有關。又如,人的身高和體重是相關的,但影響人的身高還有其他的因素。像這樣的兩個變量之間的關系我們稱為相關關系,顯然相關關系是一種不確定的關系,那么這種關系怎樣用函數關系去表示呢?表示出來后的擬合程度怎樣?這就是回歸分析的內容。其方法過程可分為以下幾個步驟:
1.畫出兩個相關變量的散點圖;
2.根據散點圖的大致形狀,選擇回歸模型,若是線性相關關系的,可利用最小二乘法
3.對求得的回歸方程的可信度進行檢驗,求出解釋變量對預報變量變化的貢獻率R2,畫出殘差圖,并進行殘差分析。
由于回歸分析的應用性和實踐性很強,因此計算量大,如果采用常規的分析和手工計算或者計算器計算,不僅教師難教,學生也感覺枯燥。針對這種情況,筆者在教學中有意加強了Excel軟件的應用,提高學生利用計算機進行數據分析處理的操作技能,不僅教學過程輕松,學生也取得了不錯的學習效果。
下面以教材選修2-3中例1為例,詳細介紹在教學中用Excel做回歸分析的方法與步驟。
例1.從某大學中隨機選取8名女大學生。其身高和體重數據如下表所示:

編 號 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170體重/kg 48 57 50 54 64 61 43 59
1.打開Excel軟件,在表格中輸入身高和體重的數據(圖1)

▲圖1
2.選定身高與體重的全部數據,在插入菜單中打開圖表(H)彈出如下對話框(圖2),在圖表類型中選擇XY散點圖,點擊2次下一步。

▲圖2
3.彈出圖表選項對話框(圖3),在標題選項中輸入圖表標題名稱:散點圖,在數值(x)軸、數值(y)軸中分別輸入x軸和y軸,再單擊下一步、完成,彈出散點圖(圖4)。

▲圖3

▲圖4
4.雙擊圖表(圖4) 的坐標區域,彈出圖表區格式對話框(圖5),可以對圖表繪圖區顏色、字體大小進行設置。雙擊擊圖表(圖4)的x、y軸,彈出x、y軸格式對話框(圖6),可以選取適當的刻度單位、最值等。如x軸格式對話框中最小值和最大值根據數據特點可以分別設為145和180,主要刻度單位可以選擇5;y軸格式對話框中的最小值可以選擇40,最大值選擇70。

▲圖5

▲圖6
5.完成圖表(圖7):

▲圖7
觀察散點圖,讓學生判斷散點分布是否具有線性趨勢。通過散點圖可以判斷,散點是呈條狀分布的,說明身高和體重有比較好的線性相關關系,因此選擇用回歸直線y=bx+a來近似刻畫它們之間的關系。
接下來,用Excel來求回歸方程,步驟如下:
1.選中散點,點擊鼠標右鍵,選擇添加趨勢線,彈出添加趨勢線對話框,在選項卡中選擇線性(圖8),點擊確定即可得到擬合直線(圖 9)。

▲圖8

▲圖9
2.雙擊直線,彈出趨勢線對話框,點擊選項,選擇顯示公式和顯示R平方值(圖10),點擊確定,即可得到回歸直線的方程以及R2=0.6376, (圖 11)。

▲圖10

▲圖11
這就是所求回歸直線的方程,b=0.8485是回歸方程斜率的估計值,說明身高每增加一個單位,體重y就會增加0.8485個單位,這說明體重和身高具有正的線性相關關系。R2=0.6376為擬合系數,表示解釋變量與預報變量的相關關系,R2越接近1,表示回歸的效果越好,R2越接近0,模型的擬合效果越差。圖中表明“女大學生的身高解釋了64%的體重變化”或者“女大學生的體重差異有64%是由身高引起的”。
1.將自變量X的數值由小到大的順序進行排列,將圖1中的數據重新進行排序,先選中編號、身高X、體重Y在內的所有數據。然后打開數據菜單,選擇排序(S),彈出排序對話框(圖12),在主要關鍵字中選擇“身高X”,(其余不用選),選中升序排列。最后點擊確定,得到身高從小到大排列好的數據(圖13)。

▲圖12

▲圖13
2.在工具菜單選項中選擇數據分析選項,出現數據分析對話框(圖14),在對話框中選擇回歸,點擊確定,彈出回歸對話框。

▲圖14
3.在輸入選項中,首先輸入Y值區域:$D$2:$D$9和X值區域:$C$2:$C$9,也可以用鼠標在工作表中直接選中,然后選擇置信度95%。在輸出選項中,選擇新工作表組,并命名。殘差選項中選擇殘差和殘差圖。如圖15所示:

▲圖15
4.點擊確定,在工作表中取得殘差分析結果,如圖16紅色標注部分。此時得到的殘差值和殘差圖是按自變量X的升序排列的。

▲圖16
5.將得到的殘差數據復制到工作表中,然后重新進行排序,再分別畫出以編號、殘差為變量散點圖(圖17)。

▲圖17
在回歸分析教學中,Excel是很好的教學工具軟件,利用這個工具軟件,我們可以有效地解決回歸分析教學中的難點問題,取得事半功倍的效果。同時,我們可以在教學過程中讓學生自己動手操作,培養學生的動手能力,提高學生的信息技術素養,激發學生的學習興趣。
[1]王黎明.應用回歸分析[M].復旦大學出版社,2008.
[2]董鳳鳴,周萍.excel在一元線性回歸分析中的應用[J].科技信息,2007 (12):144-145.
[3]張海燕.解一元線性回歸問題[J].天津農學院學報,2002(4) .