甘志國(guó) (正高級(jí)教師 特級(jí)教師) 白 琨
(1.北京豐臺(tái)二中 2.湖北省十堰市張灣區(qū)柏林鎮(zhèn)中心小學(xué))
由方差的計(jì)算公式可知,一組數(shù)據(jù)的方差與這組數(shù)據(jù)的每個(gè)數(shù)都有關(guān)系.因而,比較兩組數(shù)據(jù)方差的大小要慎之又慎,不可妄下結(jié)論,比如,不能說“若極差大,則方差大”.本文給出比較方差大小的幾個(gè)結(jié)論,用它們可迅速解決一些比較兩組數(shù)據(jù)方差大小的問題.
令h=0,可得兩組數(shù)據(jù)4,4的方差0 小于數(shù)據(jù)0,2的方差1;但數(shù)據(jù)4,4,1的方差2大于數(shù)據(jù)0,2,1的方差
推論2(1)若a≤b≤c≤d,則數(shù)據(jù)a,d的方差不小于數(shù)據(jù)b,c的方差(當(dāng)且僅當(dāng)“a=b且c=d”時(shí)兩者相等);
(2)若a≤b≤c≤d≤e≤f,則數(shù)據(jù)a,e,f的方差不小于數(shù)據(jù)b,c,d的方差(當(dāng)且僅當(dāng)“a=b且c=d=e=f”時(shí)兩者相等).
證明可用推論1中的(2)來證,下面只證(1).
當(dāng)a<b≤d時(shí),數(shù)據(jù)a,d的方差大于數(shù)據(jù)b,d的方差,所以當(dāng)a≤b≤d時(shí),數(shù)據(jù)a,d的方差大于等于數(shù)據(jù)b,d的方差(當(dāng)且僅當(dāng)a=b時(shí)取等號(hào)).同理,當(dāng)b≤c≤d時(shí),數(shù)據(jù)b,d的方差大于等于數(shù)據(jù)b,c的方差(當(dāng)且僅當(dāng)c=d時(shí)取等號(hào)),所以欲證結(jié)論成立.
定理3設(shè)a,α,n是已知的實(shí)數(shù),α>na,n≥2,n∈N,且則當(dāng)且僅當(dāng)時(shí),數(shù)據(jù)x1,x2,…,xn的方差取最小值且最小值是0;當(dāng)且僅當(dāng)x1=α-(n-1)a,xi=a(i=2,3,…,n)時(shí),數(shù)據(jù)x1,x2,…,xn的方差取最大值.
證明下面只證關(guān)于“最大值”的結(jié)論.設(shè)數(shù)據(jù)x1,x2,…,xn的方差為.先證當(dāng)n=2 時(shí)成立.由x1>a,x2≥a,x1+x2=α,可得a≤x2<α-a.又因?yàn)?/p>
從而可得當(dāng)且僅當(dāng)x1=α-a,x2=a時(shí),取最大值.
再證當(dāng)n≥3時(shí)成立.由引理,可得
在平面直角坐標(biāo)系x2Oy中,拋物線
即證得了結(jié)論:設(shè)a,α,n是已知的實(shí)數(shù),α>na,n≥2,n∈N,且
若數(shù)據(jù)x1,x2,…,xn的方差取最大值,則x2=a.
同理,可得結(jié)論:設(shè)a,α,n是已知的實(shí)數(shù),α>na,n≥2,n∈N,且
若數(shù)據(jù)x1,x2,…,xn的方差取最大值,則xi=a(i=2,3,…,n),進(jìn)而可得欲證結(jié)論成立.
定理4設(shè)x1,x2,…,xn均是給定的實(shí)數(shù)(且其平均數(shù)是a),x1,x2,…,xn,t(變量t取實(shí)數(shù))的方差是f(t),則
(2)當(dāng)t<(或>)a時(shí),f(t)是減(或增)函數(shù);當(dāng)且僅當(dāng)t=a時(shí),f(t)取到最小值,且最小值是
定理5設(shè)x1,x2,…,xn,c均是給定的實(shí)數(shù),則x1,x2,…,xn,a,b(a,b是變化的實(shí)數(shù),但a+b=c)的方差隨|a-b|的增加而增加.
證明由引理,可得x1,x2,…,xn,a,b的方差為
進(jìn)而可得欲證結(jié)論成立.
例1(2020年全國(guó)Ⅲ卷理3)在一組樣本數(shù)據(jù)中,1,2,3,4 出現(xiàn)的頻率分別為p1,p2,p3,p4,且,則下面四種情形中,對(duì)應(yīng)樣本的標(biāo)準(zhǔn)差最大的一組是( ).
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
由“對(duì)稱性”,可得這4組數(shù)據(jù)的平均數(shù)均是2.5.
把數(shù)據(jù)b與數(shù)據(jù)d中都去掉3個(gè)1、1個(gè)2、1個(gè)3、3個(gè)4后,剩下的數(shù)據(jù)分別是1,4與2,3,由推論2中的(1)可得前者方差大;再由定理1 中的(2)可得
例2甲、乙兩名射擊運(yùn)動(dòng)員參加某大型運(yùn)動(dòng)會(huì)的預(yù)選賽,他們各射擊了5次,成績(jī)(單位:環(huán))如表1所示.

表1
易知數(shù)據(jù)8,9的方差小于數(shù)據(jù)10,7的方差,再由定理1中的(2)可得
例3甲、乙、丙三名射箭運(yùn)動(dòng)員在某次測(cè)試中各射箭20次,三人的測(cè)試成績(jī)分別如表2、表3、表4所示.

表2 甲的成績(jī)

表3 乙的成績(jī)

表4 丙的成績(jī)
若用s1,s2,s3分別表示甲、乙、丙三名運(yùn)動(dòng)員在這次測(cè)試成績(jī)的標(biāo)準(zhǔn)差,則( ).
A.s3>s1>s2B.s2>s1>s3
C.s1>s2>s3D.s2>s3>s1
把甲、丙的成績(jī)都去掉4個(gè)7、5個(gè)8、5個(gè)9、4個(gè)10后,甲、丙剩下的成績(jī)分別為7,10與8,9,可得它們的平均數(shù)相等且前者的方差大于后者的方差,所以由定理1中的(2)知s1>s3.
綜上,s2>s1>s3,故選B.
例4設(shè)兩組數(shù)據(jù)A:-1,0,1,-1,0,1,-1,0,1,0與B:a,0,1,-1,0,1,-1,0,1,-1的方差分別為,求實(shí)數(shù)a的取值范圍.
若a>0,由題設(shè)結(jié)合定理2可得,也即a<0,前后矛盾,舍去該情形.
若a<0,可得題設(shè)即“設(shè)兩組數(shù)據(jù)B:-1,0,1,-1,0,1,-1,0,1,a與A:-1,0,1,-1,0,1,-1,0,1,0的方差分別為即a>0,前后矛盾,也舍去該情形.
綜上,實(shí)數(shù)a的取值范圍是?.
例5已知實(shí)數(shù)x1,x2,…,x10滿足x1>1,xi≥,求數(shù)據(jù)x1,x2,…,x10的方差s2的取值范圍.
由定理3及引理,可得當(dāng)且僅當(dāng)x1=11,xi=1(i=2,3,…,10)時(shí),有
再由題設(shè)中的方差s2是連續(xù)變化的,可得所求s2的取值范圍是[0,9].
例6某廠商調(diào)查甲、乙兩種不同型號(hào)電視機(jī)在10個(gè)賣場(chǎng)的銷售量(單位:臺(tái)),并根據(jù)這10個(gè)賣場(chǎng)的銷售情況,得到如圖1所示的莖葉圖.

圖1
為了鼓勵(lì)賣場(chǎng),在同型號(hào)電視機(jī)的銷售中,該廠商將銷售量高于數(shù)據(jù)平均數(shù)的賣場(chǎng)命名為該型號(hào)電視機(jī)的“星級(jí)賣場(chǎng)”.
若a=1,記乙型號(hào)電視機(jī)銷售量的方差為s2,根據(jù)圖1推斷當(dāng)b為何值時(shí),s2達(dá)到最小值(只需寫出結(jié)論).
但這種解法是不嚴(yán)密的:因?yàn)楫?dāng)b=0時(shí),30+b與平均數(shù)
最近,但當(dāng)b增加時(shí),其他的數(shù)(比如43)與平均數(shù)的距離可能會(huì)近一些,這樣就有可能使方差變小,所以以上解法并沒有說清道理.
但由定理4可知,這種解法是“貌似無(wú)理,實(shí)則正確”.
例7(2012年北京卷文、理17,節(jié)選)近年來,某市為促進(jìn)生活垃圾的分類處理,將生活垃圾分為廚余垃圾、可回收物和其他垃圾三類,并分別設(shè)置了相應(yīng)的垃圾箱.為調(diào)查居民生活垃圾分類投放情況,現(xiàn)隨機(jī)抽取了該市三類垃圾箱中總計(jì)1000t生活垃圾,數(shù)據(jù)統(tǒng)計(jì)如表5所示(單位:t).
假設(shè)廚余垃圾在“廚余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分別為a,b,c,其中a>0,a+b+c=600.當(dāng)數(shù)據(jù)a,b,c的方差s2最大時(shí),分別寫出a,b,c的值(結(jié)論不要求證明),并求此時(shí)s2的值.
下面再看0,600-a,a(0<a≤600)的方差s2何時(shí)最大.
由定理5知,當(dāng)且僅當(dāng)|(600-a)-a|即2|a-300|取最大值,也即a=600時(shí),方差s2最大,所以當(dāng)數(shù)據(jù)a,b,c的方差s2最大時(shí),a=600,b=c=0;還可求得此時(shí)s2的值是80000.
例8(2013年北京卷文、理16,節(jié)選)圖2是某市3月1日至14日的空氣質(zhì)量指數(shù)趨勢(shì)圖.空氣質(zhì)量指數(shù)小于100表示空氣質(zhì)量?jī)?yōu)良,空氣質(zhì)量指數(shù)大于200表示空氣重度污染.某人隨機(jī)選擇3 月1 日至3月13日中的某一天到達(dá)該市,并停留2天.
由圖2判斷從哪天開始連續(xù)三天的空氣質(zhì)量指數(shù)方差最大? (結(jié)論不要求證明)

圖2
s分別是兩組數(shù)據(jù)57,143,220;40,160,220的方差.注意到這兩組數(shù)據(jù)的平均數(shù)均是140,可得兩組新數(shù)據(jù)57,143;40,160的平均數(shù)也相等,由推論2中的(1)知,前者的方差小于后者的方差,再由定理1中的(2)可得
s分別是兩組數(shù)據(jù)220,160,40;158,86,79的方差,由40≤79≤86≤158≤160≤220及推論2中的(2)可得
注可能有讀者用錯(cuò)誤的結(jié)論“極差越大?方差越大”(反例:數(shù)據(jù)0,6,12的極差比數(shù)據(jù)0,10,11 的極差大,但前者方差小;數(shù)據(jù)20,3,12,15比數(shù)據(jù)0,3,12,15的極差大,但兩者方差相等)迅速得到了正確答案,這當(dāng)然是不嚴(yán)謹(jǐn)?shù)?解答該題要進(jìn)行必要的計(jì)算(包括估算)和推理.
可能有的讀者會(huì)想,當(dāng)兩組數(shù)據(jù)的平均數(shù)相等時(shí),結(jié)論“極差越大?方差越大”是否普遍成立呢? 答案也是否定的.若這兩組數(shù)據(jù)的平均數(shù)相差正數(shù)ε,則可把平均數(shù)小的那組數(shù)據(jù)的各數(shù)均加上ε,得到的新數(shù)據(jù)的極差及方差均不變.
一組數(shù)據(jù)的方差反映的是這組數(shù)據(jù)的波動(dòng)情況,但波動(dòng)情況不僅僅是由極差決定的.由方差公式知,它與每個(gè)數(shù)據(jù)都有關(guān).
(完)