宗 晨 佘文翀 徐 元
(河海大學,江蘇 南京210098)
對于要求一,我們建立了正態分布模型(模型一)和蒙特卡羅模擬模型(模型二)。對于模型一,用正態分布法進行分析;對于模型二,我們用蒙特卡羅法進行分析。
對于要求二,我們由正態分布的可加性知:Z=X1+X2~N(14.9726,194.1238),再用要求一的解法,求得下一個周期內的損失的數額超過10萬元的可能性為3.65%,以95%的置信度保證損失的數額的最大值為7.95萬元,以及要求在一個周期內的損失超過10萬元的可能性不大于5%,那么初始投資額最多應為1257.86萬元。
要求概率,首先我們需要先確定所給的樣本服從何種分布,于是先對數據進行可視化分析。作出頻數直方圖,然后對其進行擬合。由于大部分隨機變量都是服從正態分布的,故我們可以建立模型觀察它是否近似服從正態分布,再進行非參數檢驗即可,得到隨機變量的分布函數后,我們就可以用概率論的相關知識求解有關問題了。
(1)所給的數據具有隨機性,可以反映該公司在過去一年內的收益額總體情況;(2)假設每年影響收益額分環境因素是穩定的;(3)假設每個周期內的收益額獨立同分布;(4)假設收益率為定值,即投資額與收益額之間呈線性關系。
T:周期數;1-α:置信度;μi:i個周期時的樣本均值;σi:i個周期時的樣本標準差;K:最大損失額;M0:初始投資額。
2.3.1 模型一:正態分布法
由于大部分隨機變量都服從正態分布,故我們考慮這255個交易日的日收益額是否服從正態分布,我們首先畫出其頻率直方圖,發現它確實近似服從正態分布,再用皮爾遜χ2擬合檢驗法[1]驗證其是服從正態分布;接著求出分布函數和概率密度函數,最后利用概率論知識求解。
1)我們利用matlab軟件畫出了頻數直方圖,并對該圖進行擬合,得到擬合圖,發現其近似服從正態分布。
2)我們再利用matlab軟件[2]進行皮爾遜擬合檢驗

[h,p,stats]=chi2gof(x);運行后得到h=0,即接受原假設,也就是x服從正態分布;
3)由255個交易日的日收益額的統計數據,我們用Excel求得正態分布的參數μ=7.4863,σ=9.8520。
20世紀初分層教學之所以興起,是由于當時美國面臨大量移民兒童的涌入,學生背景各異,水平差距大,給統一教學帶來了困難。而在當今社會,人口流動與免試就近入學政策的實行使我們看到了當時美國教學困境的縮影。
第一問:(1)求下一個周期內的損失的數額超過10萬元的可能性,即求p{X-10},其中X~N(7.4863,9.8522),我們利用matlab軟件輸入命令[3]:normspec([-inf-10],7.4863,9.852),得 到 運 行 結 果ans=0.037957,即p{X-10}=0.037957≈3.80%;(2)求解以95%的置信度保證損失的數額的最大值。要求以95%的置信度保證損失的數額不會超過多少,設最大損失額為K,則即求P{X-K}=0.95時的X值。要使P{X-K}=0.95,即等價于使P{X-K}=1-0.95=0.05,由此可得 K=1.645*σ-μ=1.645*9.852-7.4863=8.72萬元。
第二問:設初始投資額為M0,由假設4得到,M0/1000=10/8.72,解得M0=1149.43萬元,故如果要求在一個周期內的損失超過10萬元的可能性不大于5%,那么初始投資額最多應為1146.79萬元。
2.3.2 模型二:蒙特卡羅法[4]
題中已經給了255個數據,我們可以利用蒙特卡羅法,先對這255個數據進行理論分析,得到了這些數據的均值為7.4863,標準差為9.852,再通過模擬,將255個數據按一定的法則擴展成100000個數據,最后進行相關問題的求解。
第一問:(1)求下一個周期內的損失的數額超過10萬元的可能性,即求p{X-10}
我們將根據均值和標準差,將255個數據擴展為100000個,再求這100000個隨機數據中數額超過10萬元的概率,我們用matlab軟件(程序見附錄1)得到p{X-10}=0.0391=3.91%
由于第一問中我們得到損失數額超過10萬元的概率小于0.05,故要求以95%的置信度保證損失的數額的最大值,其值必然小于10萬元,我們取它在(-10,10),以0.01為步長,找到概率為0.05的那個值,即為要求的最大值,我們用matlab軟件解得ans=-8.89,即損失數額的最大值為8.89萬元
第二問:由假設4,我們知初始投資額與日收益額之間為線性關系,故M0/1000=10/8.72,所以M0=10000/8.89=1124.86萬元
2.3.3 兩種模型的比較
首先比較兩組模型的結果發現它們的結果是近似相等的,這說明兩組模型均有一定準確度。對于模型一,我們由經驗猜測其服從正態分布,并用理論證明了我們的猜想,在得到其服從正態分布后,我們運用概率論的相關知識以及matlab軟件中的一些基本命令進行求解,得到了較為準確的結果;對于模型二,我們用蒙特卡洛法進行計算機隨機數模擬,利用模擬的過程得到相應要求的概率或損失最大額。
由于計算機模擬產生的是隨機數,其運算的結果必然不會每次相同,而有一定的范圍,要使運算結果相對準確,就需要產生更多的隨機數,即拓展的數據越大,得到的結果更準確,這樣必然就增大了計算量,增加運算時間,所以我們認為模型一相對更好。
第一問:(1)求周期內的損失的數額超過10萬元的可能性,即求p{X1+X2-10}:我們利用matlab軟件輸入命令:normspec([-inf-10],14.9726,13.9328),得到運行結果ans=0.0365,即p{X-10}=0.0365=3.65%;(2)同第一種情形的解法,得損失數額的最大值K=1.645*σ2-μ2=1.645*13.9328-14.9726=7.95萬元;第二問:同第一種情形的解法:M0/1000=10/7.95,所以M0=1257.86萬元.
(1)模型一通過經驗初步估計隨機變量服從正態分布,再根據數據的頻數直方圖以及擬合圖發現255個交易日的日收益額確實近似服從正態分布,最后通過理論驗證證實其確實服從正態分布,模型建立考慮周全,較嚴謹;
(2)模型二通過取大量的隨機數,得到相關的結果,結果較準確;
由于題中對初始投資額和日收益額之間的關系沒有給出,所以我們假設其呈線性關系,但在實際問題中未必如此。在實際問題中,我們應當查閱大量的不同初始投資額與每年的日收益額,分析數據得到初始投資額與日收益額的關系。