


一、兩個分類變量是否有關的粗略估計
1.三維柱形圖:如果列聯表1的三維柱形圖如下圖
由各小柱形表示的頻數可知,對角線上的頻數的積的差的絕對值[|ad-bc|]較大,說明兩分類變量[X]和[Y]是有關的,否則是無關的.
要點:一方面考查對角線頻數之差,更重要的一方面是提供了構造隨機變量進行獨立性檢驗的思想方法.
2.二維條形圖(相應于上面的三維柱形圖而畫)
由深、淺染色的高可知兩種情況下所占比例,由數據可知[aa+b]要比[cc+d]小得多,由于差距較大,說明兩分類變量[X]和[Y]有關系的可能性較大,兩個比值相差越大兩分類變量[X]和[Y]有關的可能性也越大的.否則是無關的.
要點:通過圖形以及所占比例直觀地、粗略地觀察是否有關,更重要的一方面是提供了構造隨機變量進行獨立性檢驗的思想方法.
3.等高條形圖(相應于上面的條形圖而畫)
由深、淺染色的高可知兩種情況下的百分比;另一方面,數據[aa+b]%要比[cc+d%]小得多,說明兩分類變量[X]和[Y]有關系的可能性較大,否則是無關的.
要點:直觀地看出在兩類分類變量頻數相等的情況下,各部分所占的比例情況,是在圖2的基礎上換一個角度來理解.
二、獨立性檢驗的基本思想
上面通過分析數據與圖形,得出這個估計是粗略的,因為我們說的“大得多”“小得多”,到底有多大的差距?也就是說得到的結論是直觀上的印象,其實與是否有關還是有較大的差距的.但是上面的分析給了我們一種重要的思想方法.
下面從理……