殷 英 林 革
相信很多同學接觸過統計知識,掌握了一些常用的統計方法,明白了統計在生活中的一些簡單應用.事實上,統計的實際功能和作用遠遠超過大家的想像.統計并不僅僅是個數學名詞,它還是門學科.學好統計,做好統計,你能“未卜先知”“一目了然”.
統計的基礎在于抽樣調查.抽取的樣本必須反映總體的性質,抽樣方法必須做到公平、客觀,否則,極可能產生較大偏差.下面就是統計史上出現極大偏差的一個典型事例:
1936年,美國著名的《文學摘要》雜志社為了預測總統候選人羅斯福與蘭登兩人誰能當選,他們以電話簿上的地址和俱樂部成員名單上的地址發出1 000萬封調查信,回收200萬封.在統計史上,這是少有的樣本容量.花費了大量的人力、物力,《文學摘要》深信自己的統計結果,即蘭登將以57%對43%的比例獲勝,并且進行了大張旗鼓的宣傳.但最后選舉的結果卻是羅斯福以62%對38%的巨大優勢獲勝!這次調查斷送了這家原本頗有名氣的雜志社的前程,不久只得關門??敲?,是什么原因造成了這次調查統計的失敗呢?
后來經過統計學家的分析,總結出預測失誤的原因有:(1)抽樣方法不公平,樣本不具有代表性.因為樣本不是從總體(全體美國公民)之中隨機抽取的.1936年,美國有私人電話和能參加俱樂部的家庭都是比較富裕的,只從富人家庭抽取樣本,嚴重偏離了總體,所抽取的樣本僅能代表小部分的情形.而事實上,1929~1933年的世界經濟危機使美國經濟遭到沉重打擊,時任總統的羅斯福實施的“羅斯福新政”,動用行政手段干預經濟,由自由資本主義轉為施行國家壟斷資本主義經濟政策,這難免損害了部分富人的利益,所以羅斯福在富人的選票中百分率較低就在情理之中.但廣大的美國人民從中得到了好處,因此羅斯福贏得了大多數選民的支持又是必然結果.(2)樣本容量相對太小,樣本過于集中,也是導致調查統計出現偏差的一個重要原因.因為樣本容量越大,估計才會越準確.我們不難發現,《文學摘要》雜志社當初發出去的信有1 000萬封,但相對于全體美國人民還是太少,同時只回收200萬封,這樣的回收率相對1 000萬封就更低了.當然從上面的分析可以知道,即便回收率較高,也會因為樣本過于集中而導致調查估計出現偏差.
同學們,經過上面這個典型事例的介紹,你是否對統計又有了新的認識呢?