【摘要】針對選修23《獨立性檢驗》中有關χ2統計量計算結果解釋的若干問題進行了探討,給出一個在教學中較為恰當的解釋方式,有助于學生對于獨立性檢驗有較為全面的認識.
【關鍵詞】χ2統計量;獨立性檢驗;統計推斷
在人民教育出版社編寫的普通高中課程標準實驗教科書《數學》B版選修23中的《獨立性檢驗》一章中,對于統計檢驗結果的描述有若干需要商榷的地方.
1.在教科書中有如下描述(P78):
經過對χ2統計量分布的研究,已經得到了兩個臨界值:3.841與6.635.當根據具體的數據算出的χ2>3.841時,有95%的把握說A與B有關;當χ2>6.635時,有99%的把握說事件A與B有關.當χ2≤3.841時,認為事件A與B是無關的.
2.我們有95%(或99%)的把握說事件A與B有關,是指推斷犯錯誤的可能性為5%(或1%),這也常常說成是“以95%(或99%)的概率”,其含義是一樣的.
我們說,高中教科書中所介紹的獨立性檢驗的思想,相當于運用統計學的知識發現,在假設事件A與B獨立的前提下,所得樣本的χ2>3.841的概率為5%,χ2>6.635的概率為1%,即P(χ2>6.635)|P(AB)=P(A)P(B))=0.05,P(χ2>3.841)|P(AB)=P(A)P(B))=0.01. 從而我們現有的樣本χ2統計量大于臨界值,則說明一個小概率事件發生了,于是我們認為,很有可能是我們的假設有誤,即A,B很可能不獨立. 需要注意的是,這里的5%(1%)不是我們推斷犯錯誤的概率.
教科書提到的,所謂推斷犯錯誤的概率,應當是對于一個χ2>3.841的樣本,如果我們下一個推斷:A與B不獨立,那么,我們犯錯誤的概率(即A,B其實是獨立),即P(P(AB)=P(A)P(B)|χ2>3.841|). 顯然,從條件概率的角度,這與之前計算的5%或者1%是不同的.我們只能說,針對1%的情況,我們推斷犯錯誤的概率比5%的情況要小……