郝進宏
(北京市第一五六中學 100034)
當前我國的數學教學改革正在向縱深發展,新的課程標準強調對學生數學核心素養的培養.孔凡哲、史寧中[1]指出:數學核心素養的本質在于用數學的眼光觀察現實世界、用數學的思維思考現實世界、用數學的語言表達現實世界的綜合素養,數學核心素養包含三種成分:一是學生經歷數學化活動而習得的數學思維方式,二是學生數學發展所必需的關鍵能力,三是學生經歷數學化活動而習得的數學品格及健全人格的養成. 其中關鍵能力包括數學抽象能力、數學推理能力、數學建模能力、直觀想象能力、運算能力和數據分析觀念.
下面筆者以2016年北京高考理科第16題為例,來總結提煉“加權”思想在求解期望問題中的應用,并用提煉的思想方法解決2018年北京西城一模理科16題和2018年北京高考理科第17題,希望以此進一步深入體會數據分析在提高學生數學能力素養方面的作用,請同行不吝賜教.
近幾年來,北京高考中概率統計最后一問,題目要求往往是“結論不要求證明”,也就是重直觀輕計算,如果按部就班地計算,過大的計算量和學生較低的運算能力會大大降低做題的效率,進而影響考試的節奏和成績. 如果學生對相應問題理解得比較透徹,選用的方法恰當,那么往往會高效解決這類問題.
例1(2016年北京高考理科第16題)A,B,C三個班共有100名學生,為調查他們的體育鍛煉情況,通過分層抽樣獲得了部分學生一周的鍛煉時間,數據如下表(單位:小時):

表1.1
(Ⅰ)略;(Ⅱ)略;
(Ⅲ)再從A,B,C三個班中各隨機抽取一名學生,他們該周的鍛煉時間分別是7,9,8.25(單位:小時).這3個新數據與表格中的數據構成的新樣本的平均數記為μ1,表格中數據的平均數記為μ0,試判斷μ0和μ1的大小.(結論不要求證明)
若從A,B,C三個班中各隨機抽取一名學生,他們該周的鍛煉時間分別是7,9,8.25,數據變成如下表1.2所示,要比較兩組數據的均值大小,最基本的方法就是算出兩組數據的平均值,即

由上式看出這種方法計算量很大,在高考的有限時間內如果用很長時間去獲取這三分有所不值,而且對于計算能力不足的學生可能既花費了時間但最終又沒能得出正確結論,因此這種方法解題效率非常低.

表1.2
觀察新增的7,9,8.25這三個數,它們和A,B,C三組數據有何關系?我們發現7,9,8.25這三個數分別是增加數據前A,B,C三組數據的平均值,換句話說新增的三個數沒有改變三組數據的平均值. 因此上面的計算可以簡化如下:


按照這一思想,我們比較μ0和μ1中7, 8.25,9的權重大小,9的權重之差為

8.25的權重之差為

即在μ0中較大的兩個數9和8.25的權重都比μ1中對應數值的權重大,因此μ0>μ1.
從分析過程我們可以感知到:從“加權”角度來思考這個問題,解題效率大大提高,而且這一思想方法為我們提供了研究數據的一個新的角度,下面我們通過反思來探討一下這些計算平均值的方法之間的聯系.
該題的解決思路實際上來源于平均值的兩種定義.下面我們給出這兩種定義方法,并由此提煉出第三種定義,通過比較分析它們之間的關系以便進一步深刻理解均值的涵義.

該定義是我們中學對于平均值的定義,其直觀性比較強,學生記憶深刻,是學生求均值最常用的方法,如果x1,x2,…,xn中有相同數據,那么我們還可以將定義1簡化為如下定義2.
定義2[2]如果這n個數中有相同的,不妨設其中有ni個取值為xi,i=1,2,…,k,則其均值為:

那么有一個問題,如果數據x1,x2,…,xn沒有相同的,加權平均的想法還適用嗎?




實際上2016年北京高考理科卷第16題就是利用定義3的思想方法求解的. 利用定義3,我們得到μ0和μ1是7, 8.25,9的加權平均值,所以只要比較這三個數的權重大小立刻就能比較出μ0和μ1的大小. 加權思想實際上是對數據處理后的一種簡化的計算方法,其本質有助于理解概率論中隨機變量期望的定義.
下面我們利用加權思想來解決2018年北京西城一模理科第16題和2018年北京高考理科第17題.
例2(2018年北京市西城區一模理科16題)某企業2017年招聘員工,其中A、B、C、D、E五種崗位的應聘人數、錄用人數和錄用比例(精確到1%)如下:

崗位男性應聘人數男性錄用人數男性錄用比例女性應聘人數女性錄用人數女性錄用比例A26916762%402460%B401230%2026231%C1775732%1845932%D442659%382258%E3267%3267%總計53326450%46716936%
(Ⅰ)略;(Ⅱ)略;
(Ⅲ)表中A、B、C、D、E各崗位的男性、女性錄用比例都接近(二者之差的絕對值不大于5%),但男性的總錄用比例卻明顯高于女性的總錄用比例.研究發現,若只考慮其中某四種崗位,則男性、女性的總錄用比例也接近,請寫出這四種崗位.(只需寫出結論)
通過觀察發現C、D、E三組男女應聘人數、錄用人數和錄用比例相當,而A、B兩組盡管男女錄用比例相當,但是兩組的男女應聘人數以及錄用人數差距非常大,所以直觀上,男女總的錄用比例的差距應該主要是由A、B兩組數據的差異引起的,那么到底是A還是B,學生就犯難了.
接下來我們利用加權思想來解決該問題.
設男女生的總的錄用比例分別為k1和k2,其表達式如下:




因此要想保留男性、女性的總錄用比例也接近,需要剔除A組數據.
例3(2018年北京高考理科第17題)電影公司隨機搜集了電影的有關數據,經分析整理得到下表:

電影類型第一類第二類第三類第四類第五類第六類電影部數14050300200500510好評率0.40.20.150.250.20.1
好評率是指:一類電影中獲得好評的部數與該類電影的部數的比值.
假設所有電影是否獲得好評相互獨立.
(Ⅰ)略;(Ⅱ)略;
(Ⅲ)假設每類電影得到人們喜歡的概率與表中該類電影的好評率相等,用“ξk=1”表示第k類電影得到人們喜歡,“ξk=0”表示第k類電影沒有得到人們喜歡(k=1,2,3,4,5,6).寫出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小關系.
這道高考題的第三問,學生普遍反映比較難無從下手. 我們用兩種方法來解決.
方法一以第一類電影為例,電影部數是140,好評率為0.4,則共有140×0.4=56部電影獲得好評,并且其得分為1,未獲得好評的電影有94部,得分為0,140部電影得分均值為0.4,所以方差
=(1-0.4)2×0.4+(0-0.4)2×0.6
=0.4×0.6,
由此我們發現其對應方差為p(1-p),同理,
Dξ2=0.2×0.8,Dξ3=0.15×0.85,
Dξ4=0.25×0.75,Dξ5=0.2×0.8,
Dξ6=0.1×0.9,
因此方差大小關系為
Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6.

由分析過程我們發現,本質上,方差也是一種加權平均值,從加權平均值角度去計算和比較方差可以更透徹地理解方差的意義.
反思
實際上,第三問的假設“每類電影得到人們喜歡的概率與表中該類電影的好評率相等”提示我們可以將每部電影的得分看成一個隨機變量,如果找出該隨機變量的分布很快就能求出隨機變量的方差,最終求得結果.
由于每部電影的得分實際上服從n=1的二項分布,即兩點分布,設得分為ξ,P(ξ=1)=p,P(ξ=0)=1-p,我們知道兩點分布的方差為Dξ=p(1-p),與我們的計算結果一致.
盡管與反思的方法比,方法一和方法二有些繁瑣,但是對于中學生來講,這個過程具有深遠的意義,同學們可以通過親手計算去探索發現數學問題背后的數學原理,進而進行提煉和總結,最終提升學生的綜合素養.
數據分析已經變成我們日常生活中的必要組成部分,在日常的教學中,我們不僅要重視教授學生搜集、整理數據的方法,而且還要引導學生如何分析得到的數據并根據所得結論作出合理的判斷和決策. 因此,如果我們重視應用“加權”的思想處理、分析數據平均值的基本方法,那么既能提高解題效率,又能增強對數據整體特征的把握,從而從整體上提升學生的數學素養.