肖進勝 楊力衡 丁玲 張海劍



摘? 要:假設(shè)檢驗是現(xiàn)代概率論與數(shù)理統(tǒng)計教學(xué)中的重要內(nèi)容和知識點,而假設(shè)檢驗包含建立原假設(shè)、構(gòu)造統(tǒng)計量、計算概率分布、確定臨界值和得出結(jié)論等過程。在教學(xué)過程中,很多教師都忽視建立原假設(shè)這個方面。由于沒有強調(diào)原假設(shè)設(shè)計方法,學(xué)生碰到此類問題很容易產(chǎn)生疑惑出錯。實際上,原假設(shè)的三個選擇是不可以隨意互換的,需要通過閱讀問題,依據(jù)“小概率事件原理”來選擇合適的假設(shè)。通過對假設(shè)檢驗中單邊檢驗真題案例的教學(xué)探討和分析,完成對原假設(shè)存在的三個選擇的不同分析,然后對得到的結(jié)果進行比較。分析探討在假設(shè)檢驗教學(xué)中做原假設(shè)和備擇假設(shè)設(shè)計時,需要結(jié)合題目要求,按照“小概率事件原理”來設(shè)計假設(shè)的方案,促進學(xué)生對此問題的理解,并且在實際教學(xué)應(yīng)用中取得良好的效果。
關(guān)鍵詞:假設(shè)檢驗;原假設(shè);備擇假設(shè);數(shù)理統(tǒng)計;假設(shè)方案
中圖分類號:G642? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2024)08-0117-04
Abstract: Hypothesis testing is an important content and knowledge point in the teaching of probability theory and mathematical statistics, while hypothesis testing includes the null hypothesis, the design and selection of alternative hypotheses. In the teaching process, many teachers have neglected this aspect in teaching. Since there is no emphasis on these choice, students often have doubts when they encounter such problems. In fact, the three choices of the null hypothesis are not freely interchangeable. It is necessary to read the topic and select the appropriate hypothesis based on the principle of small probability events. Through the discussion and analysis of the unilateral test case in the hypothesis test, the different analysis of the three choices of the null hypothesis is completed, and then the obtained results are compared to verify the hypothesis and alternative hypothesis in the hypothesis test. When designing, it is necessary to combine the requirements of the topic and design the hypothetical solution according to the principle of "small probability event", and achieve good results in practical teaching applications.
Keywords: hypothesis test; null hypothesis; alternative hypothesis; mathematical statistics; hypothesis method
隨著社會的發(fā)展進步,教育理念、教育方法和培養(yǎng)模式的不斷改進[1-2],新的教學(xué)模式與實踐方案,需要與培養(yǎng)“具有國際視野的拔尖創(chuàng)新人才”的指導(dǎo)思想相結(jié)合[3],同時探索其他教學(xué)評價模式[4],并及時應(yīng)用于高校的日常教學(xué)工作中,以提高高等院校的教學(xué)效率和教學(xué)質(zhì)量[5]。概率論與數(shù)理統(tǒng)計課程是面向電子信息類學(xué)科專業(yè)開設(shè)的基礎(chǔ)課程,同時也是電子與計算機專業(yè)等信息領(lǐng)域?qū)W科的專業(yè)基礎(chǔ)課程,與語音處理、圖像處理、機器學(xué)習(xí)及計算機視覺等專業(yè)核心課程有著密切的聯(lián)系,是其先導(dǎo)課程。在現(xiàn)代概率論與數(shù)理統(tǒng)計的課程教學(xué)中,參數(shù)的假設(shè)檢驗是概率論與數(shù)理統(tǒng)計中的重要內(nèi)容。對于同一個假設(shè)檢驗問題,選擇兩個不同的原假設(shè)進行檢驗時,可能會得出自相矛盾的兩個結(jié)論。選擇單邊和雙邊檢驗有時也會得出自相矛盾的結(jié)論[6]。在岑成德[7]的《假設(shè)檢驗中的難點問題的教學(xué)方法》一文中,討論了對單邊假設(shè)檢驗的原假設(shè)選擇問題。同樣,在衛(wèi)海英[8]的《對假設(shè)檢驗方法應(yīng)用的思考》一文中也表達了在假設(shè)檢驗實際應(yīng)用中應(yīng)該注意正確建立零假設(shè)和對立假設(shè)。在對實際問題做假設(shè)檢驗時,什么作為原假設(shè),什么作為備擇假設(shè)應(yīng)由問題本身確定,而不是檢測者的態(tài)度或希望[9]。作者認為假設(shè)檢驗主要依據(jù)的理論是“小概率事件原理”,教學(xué)中以相應(yīng)的“小概率事件”發(fā)生的區(qū)域作為拒絕域來判斷是否拒絕或接受該假設(shè),就能很好地促進學(xué)生對此問題的理解,提高學(xué)習(xí)的效率和效果。
一? 假設(shè)檢驗問題的分析方法研究
在常規(guī)的概率論與數(shù)理統(tǒng)計教學(xué)過程中,對于假設(shè)檢驗問題的教學(xué)重點在于根據(jù)已有數(shù)據(jù)和參數(shù),如何進行檢驗統(tǒng)計量的選取和統(tǒng)計參數(shù)計算方面,套用相關(guān)的假設(shè)檢驗公式。忽略了原假設(shè)設(shè)計,即備擇假設(shè)的選取問題。而實際教學(xué)中發(fā)現(xiàn),假設(shè)檢驗中存在一些具體的應(yīng)用問題,對待檢驗的問題有著不同的文字描述,如“大于”“小于”“不大于”“變多”“變少”“合格”等。而這些不同的文字描述和復(fù)雜多樣的應(yīng)用問題在一起,很容易讓學(xué)生產(chǎn)生混淆,并出錯。
假設(shè)檢驗問題是不同于參數(shù)估計的另一類重要的統(tǒng)計推斷問題。假設(shè)檢驗就是根據(jù)總體X的信息,檢驗關(guān)于總體的某個假設(shè)是否正確,決定接受原假設(shè)拒絕備擇假設(shè)或者拒絕原假設(shè)接受備擇假設(shè)。原假設(shè)就是本身根據(jù)問題假設(shè)出來的驗證的主體,備擇假設(shè)與原假設(shè)相反并且和原假設(shè)共同構(gòu)成一個完備事件。
在顯著性水平α條件下,檢驗假設(shè)H0:μ=μ0?H1:μ≠μ0中的備擇假設(shè)H1表示μ可能大于μ0,也可能小于μ0,稱為雙邊備擇假設(shè),這樣的假設(shè)檢驗稱為雙邊假設(shè)檢驗。相對的單邊檢驗分為兩種,一種是右邊檢驗形如H0:μ≤μ0?H1:μ>μ0;一種是左邊檢驗形如H0:μ≥μ0?H1:μ<μ0。假設(shè)檢驗問題的本質(zhì)是運用小概率反證法思想。小概率思想是指概率很小P<α(α=0.01或α=0.05等)的事件,在一次試驗中基本上不會發(fā)生,也稱為小概率事件原理。這里備擇假設(shè)是屬于顯著性水平α下的一個小概率事件。
假設(shè)檢驗中,針對需要判斷的問題,進行準確的原假設(shè)提出是一個很關(guān)鍵的問題。在實際教學(xué)應(yīng)用中,很多學(xué)生都很難理解或者只能死記相關(guān)的規(guī)則,很容易出錯和弄混淆。實際上,我們分析理解了假設(shè)檢驗問題的本質(zhì),就能很準確地定位假設(shè)檢驗問題,進行準確合適的原假設(shè)。根據(jù)小概率事件原理,概率很小的事件在一次實驗中是幾乎不會發(fā)生的,因此我們重點關(guān)注“小概率”的地方[10]。可以從如下兩點進行分析。
第一,小概率事件原理中的“小概率”究竟有多小呢?這要根據(jù)假設(shè)檢驗結(jié)論的重要程度和其在實際問題中可能造成結(jié)果的嚴重程度來決定。
第二,把其稱作“小概率事件原理”,是因為“概率很小的事件在一次實驗中是幾乎不會發(fā)生的”,并沒有說其“絕對不會發(fā)生”。
假設(shè)檢驗的思想是先提出原假設(shè)H0,假設(shè)合理的依據(jù)就是備擇假設(shè)必須是屬于不常發(fā)生的“小概率事件”,再用適當(dāng)?shù)臋z驗統(tǒng)計量,通過對統(tǒng)計量的計算和判斷來確定假設(shè)成立的可能性大小,通過概率是否落入備擇假設(shè)區(qū)間來判斷假設(shè)是否成立。
通過采用以上方法來分析假設(shè)檢驗中的問題,可以排除具體假設(shè)檢驗應(yīng)用問題中各種文字描述的干擾,堅持“小概率事件”的判斷原則,實現(xiàn)準確的原假設(shè)和備擇假設(shè)的設(shè)計,順利地解決假設(shè)檢驗問題。
二? 假設(shè)檢驗中假設(shè)問題的教學(xué)設(shè)計
在教學(xué)設(shè)計過程中,為了增強學(xué)生對于假設(shè)檢驗問題本質(zhì)是“小概率原理”的認識,除了在講授時重點強調(diào)假設(shè)檢驗原理和公式,以及常規(guī)的解題思路之外。可以設(shè)計一些反例或看似矛盾的實例,利用實例來增強學(xué)生對該問題的關(guān)注度,提升對該問題的理解[11]。下面通過一個具體問題來說明假設(shè)檢驗中原假設(shè)設(shè)計的教學(xué)過程。可以先提出如下一個常見的例子。
一位大學(xué)校長在網(wǎng)上看到這樣的報道:“這一城市的大學(xué)生平均每周玩8小時手機游戲”。他認為他所在的學(xué)校,大學(xué)生玩手機游戲的時間明顯小于該數(shù)字。為此他隨機向他所在學(xué)校的30個大學(xué)生作了調(diào)查,得知平均每周玩手機游戲的時間為7小時,樣本標準差為3小時。問是否可以認為這位校長的看法是對的?設(shè)顯著性水平0.01,大學(xué)生玩手機游戲的時間服從正態(tài)分布。
首先,引導(dǎo)學(xué)生進行分析,這個問題其實不難。根據(jù)上面問題的描述先得到一些必須的數(shù)值:μ0=8,n=30,X=7,S=3,α=0.01.已知大學(xué)生每周玩手機游戲的時間服從正態(tài)分布,X~N(μ,σ2),對于這類單邊假設(shè)檢驗問題,能獲得的原假設(shè)只有兩種情況μ≤μ0或μ≥μ0(需要明確的一點,等號必須包含在原假設(shè)中)。通過兩種假設(shè)設(shè)計來分析這個問題的本質(zhì)。
第一種情況:直接把校長的看法作為假設(shè)(這是很多人很容易想到的方法),假設(shè)大學(xué)生平均每周玩手機游戲的時間明顯小于8小時,可以作如下假設(shè)
H0:μ≤μ0=8?H1:μ>μ0。(1)
這里方差σ2未知,需做T檢驗,所以取檢驗統(tǒng)計量
T=~t(n-1)。(2)
在顯著性水平α=0.01的情況下,拒絕域(圖1右邊陰影部分)為
C={T≥tα(n-1)=t0.01(29)≈2.46} 。 (3)
而實際計算統(tǒng)計量T的觀測值可得
T=≈-1.82 。 (4)
顯然T 第二種情況:我們可以反過來,假設(shè)大學(xué)生平均每周玩手機的時間不明顯小于8小時,所以有 H0:μ≥μ0=8?H1:μ<μ0 。 (5) 可以計算得拒絕域(圖1左邊陰影部分)為 C={T≤-tα(n-1)=-t0.01(29)≈-2.46} 。 (6) 同樣,可以計算出統(tǒng)計量T的觀測值為T≈-1.826,所以T>-tα(n-1),沒有落入拒絕域,不拒絕原假設(shè),即玩手機的時間不小于8小時。 其次,針對兩種不同的假設(shè)設(shè)計做法,引導(dǎo)學(xué)生發(fā)現(xiàn)和分析問題。兩種假設(shè)的過程都是正確的,但是相反的假設(shè)卻都得到了不拒絕原假設(shè)的結(jié)論。顯然這兩個結(jié)果是相互矛盾的,事出反常必有因。提醒并引導(dǎo)學(xué)生思考,到底哪個假設(shè)是正確的呢?到底校長的看法是對是錯?通過這個例子,通過一系列反問,能激起學(xué)生的興趣和求知欲。 然后,引導(dǎo)學(xué)生回到假設(shè)檢驗問題的本質(zhì)“小概率事件”。告訴學(xué)生假設(shè)檢驗的關(guān)鍵是尋找問題中的“小概率事件”,明確拒絕域為“小概率事件”。因此,拒絕域應(yīng)該處在正態(tài)分布的兩端區(qū)域(如圖1的陰影部分),不包括正態(tài)分布的中心區(qū)域。根據(jù)假設(shè)檢驗的定義,強調(diào)原假設(shè)中的等號成立對應(yīng)于正態(tài)分布圖中的中間峰值(如圖1的中間非陰影部分),是“較大概率”,必須包含在原假設(shè)中。仔細觀察圖1的正態(tài)分布圖,考慮拒絕域的分布區(qū)域,通過“小概率”的區(qū)域,來仔細分析原假設(shè)的設(shè)計問題。其拒絕區(qū)域如圖1所示。 上面第一種情況計算的拒絕域是T≥t0.01(29)≈2.46,即圖1中右邊的陰影區(qū)域。第二種情況計算的拒絕域是T≤-2.46,即圖1中左邊的陰影區(qū)域。兩個陰影部分都是處于正態(tài)分布的兩端,都是正態(tài)分布概率取值比較小的地方,對應(yīng)小概率事件,因此都沒有問題。但是實際計算出來的觀測值T≈-1.826落在了中間區(qū)域,所以兩個不同的假設(shè)才都會得到不拒絕原假設(shè)的結(jié)論。這又是什么原因呢? 再后,進一步引導(dǎo)學(xué)生對假設(shè)檢驗問題的本質(zhì)進行思考和分析。將假設(shè)檢驗待檢驗的問題假設(shè)和小概率事件合理關(guān)聯(lián)起來,仔細分析假設(shè)檢驗的問題。這里校長的看法是“大學(xué)生玩手機游戲的時間明顯小于該數(shù)字”。注意到“明顯小于(或小于)”是不同于“不大于”的。“明顯小于(或小于)”對應(yīng)于圖1中正態(tài)分布左邊的陰影部分,即μ<μ0,不包含“等于”,可以看成是小概率事件,只能作備擇假設(shè)(拒絕域)。其對立面為“不小于”,即μ≥μ0,包含等于部分,可以作為原假設(shè)。相反,“不大于”是“小于或等于”,即μ≤μ0,這里包含“等于”的,就包含圖1中正態(tài)分布中間的部分,屬于概率比較大的部分,只能作為原假設(shè),其對應(yīng)的小概率事件及備擇假設(shè)是“大于”,和這個問題中校長考慮的方向并不一致。 最后,根據(jù)分析得到結(jié)論:第二種方法的假設(shè)(μ≥μ0)是對的,結(jié)論是“玩手機的時間不小于8小時”。也就是說,雖然統(tǒng)計得到的時間7小時小于8小時,但是還不足以小到在0.01的顯著性水平下,落于圖1左邊的陰影區(qū)域(拒絕域)。沒有明顯小于8小時,就是小的程度還不夠,沒有小到“小概率事件”發(fā)生。小概率事件沒有發(fā)生,即得到校長的看法(假設(shè))是錯的。同時第一種方法的假設(shè)(μ≤μ0)是錯誤的,和校長本意(小于,或明顯小于)不符。第一種方法的假設(shè)(μ≤μ0)是“小于或等于”。其備擇假設(shè)或拒絕域?qū)?yīng)的是大于(μ>μ0)。第一種方法的假設(shè),只能判斷“大于”(落于拒絕域)或“不大于”(沒有落于拒絕域)。第一種方法的假設(shè)并不能判斷“小于”成立。 因此,假設(shè)檢驗拒絕域的設(shè)計和判斷的根本是“小概率”事件。假設(shè)檢驗中原假設(shè)的設(shè)計,需要把拒絕域與小概率有機地對應(yīng)起來,同時考慮具體應(yīng)用問題的描述,進行合理設(shè)置。 為了加深同學(xué)對這類問題的印象,我們還可以把問題稍微改一下。其他的條件和參數(shù)都不變,只是調(diào)查30個學(xué)生平均每周玩手機游戲的時間為6.5小時。問是否可以認為這位校長的看法是對的?具體結(jié)果和分析可以讓學(xué)生自己思考以加深對該問題的理解和判斷。 從這個假設(shè)檢驗問題的兩種原假設(shè)的分析來看,對于單變量的假設(shè)檢驗的原假設(shè)形式有三種。但是對于相應(yīng)的假設(shè)檢驗問題分析來說,三種假設(shè)是不能隨意設(shè)計的。需要引導(dǎo)同學(xué)了解在單邊檢驗建立原假設(shè)和備擇假設(shè)的時候要注意假設(shè)檢驗問題的要求。在假設(shè)檢驗問題分析過程中需要注意一個原則,就是“小概率事件”原理,在設(shè)計假設(shè)檢驗的時候?qū)⑿「怕适录陌l(fā)生設(shè)置在拒絕域。 大于,多于或高于等代表“>”,不大于,不多于或不高于等代表“≤”。 小于,少于或低于等代表“<”,不大于,不多于或不高于等代表“≥”。 在分析假設(shè)檢驗應(yīng)用問題時,需要根據(jù)具體問題分析,設(shè)計正確的假設(shè)。備擇假設(shè)及拒絕域是“小概率事件”,因此,拒絕域是正態(tài)分布的兩端區(qū)域,而不是包括正態(tài)分布的中心區(qū)域。這里有等號的一邊是大概率事件,放在原假設(shè)中,其他的是小概率事件,而假設(shè)檢驗就是利用“小概率事件”來拒絕原假設(shè)。 通過把以上實際生活中類似的假設(shè)檢驗例子,巧妙地設(shè)計和融合到教學(xué)過程中,可以引導(dǎo)學(xué)生對這類問題的思考和問題本質(zhì)的理解。利用看似矛盾的兩種分析方法,引起學(xué)生的注意和興趣,引導(dǎo)學(xué)生積極思考,積極討論,最終理解問題,得到問題的深入分析和徹底理解。這類方法通過多年的教學(xué)實踐,取得了明顯的效果。學(xué)生對這類問題的理解和分析效果有了明顯提升。 三? 結(jié)束語 概率論與數(shù)理統(tǒng)計課程是面向電子信息類學(xué)科專業(yè)開設(shè)的基礎(chǔ)課程,也是語音處理、圖像處理、機器學(xué)習(xí)及計算機視覺等專業(yè)核心課程的先導(dǎo)課程。本文以現(xiàn)代概率論與數(shù)理統(tǒng)計課程為研究對象,通過探索“假設(shè)檢驗”原理新的教學(xué)方法,改變以往的傳統(tǒng)教學(xué)思路,引導(dǎo)學(xué)生采用新的思維方式來分析問題、解決問題。總的來說,對于假設(shè)檢驗中單邊檢驗的原假設(shè)和備擇假設(shè)的設(shè)計,應(yīng)該根據(jù)問題的要求,引導(dǎo)學(xué)生思考如何依據(jù)“小概率事件原理”來設(shè)置假設(shè),促進學(xué)生對問題本質(zhì)的理解。在假設(shè)檢驗問題的求解過程中也要指導(dǎo)學(xué)生,不要盲目帶入公式,而是要注重理論和題目應(yīng)用的結(jié)合,加強個人對問題的思考。同時本文也通過對問題的分析,讓學(xué)生學(xué)習(xí)和理解了關(guān)于假設(shè)的設(shè)計方法,其是可以應(yīng)用于雙邊檢驗和兩個正態(tài)總體假設(shè)檢驗問題的。通過以上分析問題和解決問題的思路引導(dǎo),為學(xué)生進一步學(xué)習(xí)和應(yīng)用專業(yè)知識打下良好的思維基礎(chǔ);此外,也通過新方法新思維的引入,進一步提高了教師的教學(xué)和科研能力,在課程教學(xué)改革方向激發(fā)更多的新思潮。在后續(xù)的教學(xué)和教研工作中,將會利用計算機網(wǎng)絡(luò)、信息技術(shù)和多媒體技術(shù),創(chuàng)建該課程的教學(xué)網(wǎng)站,發(fā)布更多的教學(xué)資源,增加教學(xué)和學(xué)習(xí)的互動功能,打造成符合現(xiàn)代教學(xué)方式和多模態(tài)學(xué)習(xí)方式的精品教學(xué)網(wǎng)站。 參考文獻: [1] 伍春香,王麗娜,杜瑞穎,等.基礎(chǔ)學(xué)科拔尖人才培養(yǎng)模式探索與實踐[J].計算機教育,2018(7):135-138. [2] 劉丹.計算機專業(yè)本科生創(chuàng)新能力培養(yǎng)模式研究[J].計算機教育,2019(3):62-65. [3] 劉樹波,王麗娜,伍春香,等.計算機學(xué)科拔尖創(chuàng)新人才國際視野培養(yǎng)[J].計算機教育,2018(3):120-123. [4] 肖進勝,蔡紅濤,許賢澤,等.案例驅(qū)動的工程隨機數(shù)學(xué)課程教學(xué)探索[J].軟件,2017(12):1-4. [5] 羅羨華.關(guān)于隨機事件獨立性的教學(xué)探討[J].教育教學(xué)論壇,2017(14):85-87. [6] 郭寶才,孫利榮.關(guān)于假設(shè)檢驗中的幾個問題的探討[J].統(tǒng)計與決策,2010(6):10-11. [7] 岑成德.假設(shè)檢驗中的難點問題的教學(xué)方法[J].課程教育研究,2014(13):209. [8] 衛(wèi)海英.對假設(shè)檢驗方法應(yīng)用的思考[J].北京統(tǒng)計,2001(6):34-35. [9] 郭建新,許軍保.假設(shè)檢驗教學(xué)中一個問題的探討[J].蘭州交通大學(xué)學(xué)報,2015,34(2):131-133. [10] 許賢澤,肖進勝,張燕革,等.工程隨機數(shù)學(xué)基礎(chǔ)[M].武漢:武漢大學(xué)出版社,2018:8. [11] 張海劍,夏桂松,余磊,等.面向人工智能的數(shù)字信號處理課程案例設(shè)計[J].高教學(xué)刊,2022,8(28):86-89. 基金項目:教育部第二批產(chǎn)學(xué)合作協(xié)同育人項目“面向人工智能的電子信息類嵌入式系統(tǒng)課程改革”(202102001026);湖北省教育廳科學(xué)研究計劃項目“惡劣天氣條件下智能駕駛視覺感知增強技術(shù)研究”(B2021261);武漢大學(xué)本科教育質(zhì)量建設(shè)綜合改革項目“學(xué)風(fēng)傳承特色的嵌入式系統(tǒng)設(shè)計課程思政案例建設(shè)”(202205601) 第一作者簡介:肖進勝(1975-),男,漢族,湖北武漢人,博士,副教授,CCF高級會員。研究方向為計算機視覺,圖像處理與分析。 *通信作者:丁玲(1979-),男,漢族,湖北咸寧人,博士,副教授。研究方向為人工智能,計算機視覺,圖像處理與分析。