于笑月 青島實驗高級中學
概率論與數理統計是數學的一個重要分支。在生產生活中,人們經常需要應用概率論知識,分析隨機事件發生的可能性。在兩個人各擲一個骰子時,得到的點數相同的可能性是多少,Z12次列車到達終點站時晚點的可能性是多少,結腸癌患者術后復發的可能性是多少,都是可以用概率論知識解決的問題。數理統計在生活中也有著廣泛的應用。在分析某養殖場中肉雞的重量分布情況時,在確定某一新發現的生物標志物的醫學參考值范圍時,在為房屋或其他資產估價時,人們都需要應用與數理統計相關的知識。可以說,概率統計在科研、工業、醫療等領域有著廣泛的應用。
在企業經營的過程中,經營者常常需要對未來一段時間內某產品的銷量、運輸過程中發生的意外進行預測,此外,他們需要從一些歷史數據中總結特定事件發生的規律,從而制定合適的戰略。應用概率統計知識,這些經營者可以高效地建立相關模型,定量地描述特定的場景,總結事件的發生規律。可以說,分析企業經營的過程中,概率統計知識發揮著十分重要的作用。
由于人類很早就開始進行類似賭博的活動,似乎概率的概念應該與人類一樣古老。但是,古時候的人們并沒有系統地總結賭博中出現特定結果的規律。直到16世紀和17世紀,人們才意識到,可以在某種程度上預測這些不確定性事件的結果。這種思維方式可以幫助人們確定未來事件的可能性。賭徒們必須預測可能承擔的風險和潛在的收益,并實現兩者的平衡。此外,為了獲利,各行業的經商者也需要可靠的方法預期自己獲利。
帕斯卡和費馬是概率論的創始人,他們使概率論成為了一門獨立的學科。1654年,這兩位科學家在發表的著作中,討論了夏瓦利·德·梅爾(Chevalier de Mere)提出的賭博問題,奠定了概率論的基礎。他們探討了玩家投擲24顆骰子時,下“雙6”的賭注能夠獲勝的概率。此外,這兩位數學家還提出了期望的概念。
此外,著名的數學家伯努利在《猜想技巧》(《Ars Conjectandi》)中,對惠更斯提出的賭博概率問題進行了進一步證明,并提出了組合和排列的概念,他對賭博中的一系列問題進行了數學解釋。此外,他還提出了著名的伯努利定理,亦即大數定律[2]。
棣莫弗1718年出版的著作中探討了計算活動中事件的發生概率的一般方法,對獲得數學結論的過程進行了詳細解釋。拉普拉斯提出了加法原理和乘法原理,并探討了應用伯努利定理時的幾個問題。至此,概率論已經基本發展為一個非常成熟的學科,當時的人們可以應用概率論的知識,評估生產生活中隨機事件發生的可能性。
18世紀初,一些研究人員在進行天文學、大地測量學、實驗心理學、遺傳學和社會學研究時,發現他們經常需要處理大量數據,但是當時的人們缺乏有效的方法描述這些數據的特征。他們提出了許多重要的問題:科學家應如何整合在不同條件下得到的測量數據?如何應用概率論衡量結果的準確性?應用于天文學的原始統計方法是否可以被應用于社會科學研究中?最小二乘法和回歸分析分別適用于那些場景?在后來的研究中,人們逐漸摸索出一些初步的數理統計方法,應用這些方法,他們可以對實驗測量和科學觀察中的不確定性進行評估,盡可能降低不確定性,將社會科學中難以量化的問題轉化為數學模型。這些新的統計學概念、統計學方法在不同的學科中發揮著不同的作用。幾百年來,科學家不斷完善這些方法,使其應用更加廣泛。今天,人們已經可以熟練地應用數理統計方法,高效地分析農業、工業、科研、生活中的許多大樣本問題,得到可靠的結論[3]。
如果人們以數據的值為x,以變量取該值的概率為y,就可以繪制出變量的概率分布函數。隨機事件發生的概率就是概率分布函數與x軸之間的區域的面積。當隨機變量為連續變量時,人們需要用連續分布函數描述其分布情況。正態分布是最常用的連續分布函數,其在企業經營中有著廣泛的應用[4]。
正態分布能夠被用于描述幾乎所有自然變量的特征。身高、血壓、智商、測量誤差等變量,都服從正態分布。正態分布是一種對稱分布,其中,大多數觀測值都集中在均值附近,并且遠離均值的數值的出現概率在x軸正向和負向上均等地逐漸減小。同樣地,正態分布曲線兩端的極小值也不太可能出現。例如,14歲女孩的身高數據是服從正態分布的。大多數女孩的身高都接近平均水平。但是每個人的身高與均值之間存在一定的差異。此外,身高低于平均數的女孩數等于身高高于平均數的女孩數,極矮的女孩和極高的女孩很少出現。
正態分布參數主要包括均值μ和標準差σ。正態分布的參數會改變圖像的形狀和位置。平均值決定了正態分布曲線的峰值的位置。大多數數值是接近平均值。改變平均值將使整個曲線在x軸上向左或向右移動。標準差是關于變異性的參數。它決定正態分布曲線的形狀。標準差反映了數據在多大程度上是離散的,也就是數據“遠離”平均值的程度、數據的分散程度。正態分布的3σ原則是,與μ相差不超過一個σ的數據的出現概率為68.27%,與μ相差不超過一個σ的數據的出現概率為95.45%,與μ相差不超過一個σ的數據的出現概率為99.74%[5]。
接下來,筆者以養豬場對生豬的重量分布情況評估為例,說明正態分布在企業經營中的應用。秦叔叔經營著一家養豬場,其中有大約10000頭成年豬。由于近期豬肉的價格上漲,他打算賣掉一部分生豬。在賣掉生豬前,他需要先了解現有的成年生豬的重量分布情況。他隨機抽取了100頭成年豬,并測定了它們的重量。這些成年豬的重量的平均值是350kg,標準差為50kg。秦叔叔決定只賣掉重量為400kg以上的成年生豬,那么他可以賣掉多少頭豬?
在這個問題中,我們需要首先對自然條件下生豬的重量分布規律進行基本的估計,由于所有的生豬都處于完全相同的生長條件下,其重量服從正態分布。對被抽到的100頭成年豬的重量數據進行分析,可以得到正態分布的兩個十分關鍵的特征數據——成年豬的重量的平均值是350kg,標準差是50kg。如果用X表示成年豬的重量這一變量,則可以根據前述分析得到X服從平均值為350、標準差為50的正態分布,因此,我們可以根據正態分布的3σ原則,得到該養殖場中成年豬的重量分布情況:重量介于300~400kg之間的成年豬約占總數的68.27%,也就是約6827頭,重量介于250~450kg之間的成年豬約占總數的95.45%,也就是約9545頭,重量介于200~500kg之間的成年豬約占總數的99.74%,也就是約9974頭。由于這10000頭成年豬的重量關于其平均值對稱,我們可以推測,重量超過400kg的成年豬的數量約為(10000-6827)/2≈1587頭。由此可見,養豬場中的大多數豬沒有達到市場上的售賣要求,應當繼續養殖。此外,該養豬場可能需要改變當前的養殖策略,才能使大多數豬的重量超過400kg,提高養豬場的銷售收入。

應用概率論與數理統計知識,人們可以高效解決生產生活中的許多問題。概率知識可以幫助人們預測隨機事件發生的可能性,統計知識可以幫助人們根據樣本推斷總體的特征,或者根據歷史數據預測某些變量的未來變化趨勢。在經營企業的過程中,經營者應當運用概率統計知識建模,預測盈利事件或虧損事件的發生概率,判斷某些經濟變量的變化趨勢,從而更高效地決策。