張文譯
說起統(tǒng)計學(xué),沒接觸過統(tǒng)計學(xué)的人總會覺得“高大上”,認為那是和他們沒有關(guān)系的一個科目。實際上,統(tǒng)計學(xué)與每一個人,與我們的日常生活息息相關(guān)。我們關(guān)心的日常生活,其中很多就包含了統(tǒng)計知識。例如,在投資股票時,需要了解股票市場價格的信息;在外出旅游時,需要關(guān)心一段時間內(nèi)的詳細天氣預(yù)報;在觀察NBA籃球賽時,了解各支隊伍的技術(shù)統(tǒng)計;甚至,打麻將如何能取勝,其中都蘊含了統(tǒng)計學(xué)的知識。因此,理解并掌握一些統(tǒng)計學(xué)的知識對普通大眾是很有必要的。
在日常生活中,我們會聽到許多的數(shù)據(jù)以及與之對應(yīng)的結(jié)論。例如,吸煙是有害健康的;身材高的父親,他的子女身材也會較高;人每天至少要喝六杯水等等。這些結(jié)論是正確的嗎?我們可以相信這些結(jié)論嗎?這些結(jié)論是如何從數(shù)據(jù)中提煉歸納而來的?想要正確理解這些數(shù)據(jù),這就需要我們具備一些統(tǒng)計學(xué)的知識。
要了解統(tǒng)計學(xué),首先要知道什么是統(tǒng)計學(xué)。綜合的說,統(tǒng)計學(xué)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。統(tǒng)計學(xué)是關(guān)于數(shù)據(jù)的一套科學(xué)方法,研究的是來自各領(lǐng)域的數(shù)據(jù)。因此,統(tǒng)計學(xué)的應(yīng)用領(lǐng)域很廣,只要有數(shù)據(jù)處理的地方,就有統(tǒng)計學(xué)。例如,市場研究、財務(wù)分析、人力資源管理、氣象學(xué)、軍事科學(xué)等等,都與統(tǒng)計學(xué)息息相關(guān)。
統(tǒng)計學(xué)提供的是研究數(shù)據(jù)的方法,而作為統(tǒng)計學(xué)研究的根本——數(shù)據(jù),一定要真實、準(zhǔn)確且具有代表性,不然后果不堪設(shè)想。舉一個著名的事例,《文學(xué)文摘》預(yù)測羅斯福競選失敗。在美國1936年的總統(tǒng)選舉中,有兩位競爭者,他們分別是來自民主黨的羅斯福和來自共和黨的蘭登。一般民意測驗認為羅斯福將獲勝,但是美國著名雜志《文學(xué)文摘》(Literary Digest)宣布,根據(jù)他們對240萬人的調(diào)查,蘭登將獲得57%的選票。但最后的投票結(jié)果卻讓這本著名的雜志“啪啪打臉”,羅斯福贏得2770萬張選票,以絕對的優(yōu)勢勝出。讓人陷入深思的是,為什么《文學(xué)文摘》的樣本量如此之大,結(jié)果卻是錯誤的。
他們預(yù)測失敗的根本原因在于調(diào)查方案存在嚴重失誤,違背了統(tǒng)計學(xué)規(guī)律。他們使用電話訪談式調(diào)查,但當(dāng)時能擁有電話的基本都是富人,而富人圈基本都是支持蘭登。這說明,當(dāng)我們數(shù)據(jù)出現(xiàn)差錯時,通過統(tǒng)計學(xué)的分析結(jié)果也會和事實大相徑庭。因此,我們在收集數(shù)據(jù)的時候,要保證數(shù)據(jù)的來源準(zhǔn)確,數(shù)據(jù)真實可靠,那么之后所做的分析工作才是有意義的。
現(xiàn)在進入了大數(shù)據(jù)時代,似乎一切都可以轉(zhuǎn)化為數(shù)據(jù),而圍繞在我們身邊的也是無數(shù)“隱形”的數(shù)據(jù)。數(shù)據(jù)量足夠大了之后,我們會發(fā)現(xiàn)所有的社會現(xiàn)象到最后都有統(tǒng)計規(guī)律,它并不像物理學(xué)那樣可以準(zhǔn)確的說出因果關(guān)系,但它從本質(zhì)上來說就是一個統(tǒng)計的規(guī)律。因此,大數(shù)據(jù)時代給統(tǒng)計學(xué)帶來新的生命力,也給統(tǒng)計學(xué)者帶來了更多學(xué)習(xí)和挑戰(zhàn)的空間,同時也讓民眾更多的關(guān)注到統(tǒng)計學(xué)這個新興學(xué)科。