概率統計問題是近幾年高考的重點和熱點之一.概率統計試題作為解答題之一的出現,已經成為高考命題的共識.對于概率與統計在考查要求上有所提高,反映在試卷中,對其的考查是趨于逐年加強和深化的,并且考查方式也不斷推新.高考對排列組合以及二項式定理的考查,往往以填空題或者選擇題為主,題小而靈活;高考對概率的考查,往往以實際應用題出現,它既考查邏輯思維能力,又考查運算能力,也符合高考發展的方向;有關統計的實際應用問題,主要考查對一些基本概念、基本方法的理解和掌握,屬于基礎題.
■
隨機抽樣
【考綱要求】 理解隨機抽樣的必要性和重要性;會用簡單隨機抽樣方法從總體中抽取樣本,了解分層抽樣和系統抽樣方法.
【考綱解讀】 考綱中盡管對“分層抽樣方法與系統抽樣方法”是了解的層面,但是分層抽樣一直是高考試題中的一個重要考點,年年必考,因此應定位在理解.
【經典例題】 1. 某學校有教師150人,其中高級教師15人,中級教師45人,初級教師90人. 現按職稱分層抽樣選出30名教師參加教工代表大會,則選出的高級、中級、初級教師的人數分別為( )
A. 5,10,15?搖?搖 B. 3,9,18
C. 3,10,17?搖?搖?搖?搖D. 5,9,16
2. 高三(1)班共有56人,學生編號依次為1,2,3,…,56,現用系統抽樣的方法抽取一個容量為4的樣本,已知編號為6,34,48的同學在樣本中,那么還有一位同學的編號應為_______.
命題意圖 簡單隨機抽樣、分層抽樣、系統抽樣是比較典型與常用的方法,雖然它們在高考中要求不高,但要明確這三種基本抽樣方法的特點,并能熟練掌握其操作方法. 本例主要考查我們對抽樣方法掌握的程度,考查實際應用能力.
思路分析 1. 根據分層抽樣的意義,將總體分成幾個部分,然后按各部分所占的比例進行抽樣,因此本題可以根據抽樣比,得到所要抽取的人數.
2. 由系統抽樣的意義知,它是一種等距抽樣,確定初始號后,樣本的編號組成等差數列.
完美解答 1. 因為抽樣比為■=■,所以選出的高及、中級、初級教師的人數分別為15×■=3,45×■=9,90×■=18,故選B.
2. 由系統抽樣的意義及題意可知,6就是初始號,公差為48-34=14,所以還有一位同的編號為6+14=20.
【命題趨勢】 預計高考主要仍以應用題為背景,題型以選擇題、填空題呈現為主,難度不大,主要考查簡單隨機抽樣、分層抽樣、系統抽樣的計算以及這三種抽樣的區別,由于分層抽樣相對來說比較顯性,因此在高考命題中會特別加以關注.
用樣本估計總體
【考綱要求】 了解分布的意義和作用,會列頻率分布表,會畫頻率分布直方圖、頻率折線圖、莖葉圖,理解它們各自的特點;理解樣本數據標準差的意義和作用,會計算數據標準差;能從樣本數據中提取基本的數字特征(如平均數、標準差),并給出合理的解釋;會用樣本的頻率分布估計總體分布,會用樣本的基本數字特征估計總體的基本數字特征,理解用樣本估計總體的思想;會用隨機抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題.
【考綱解讀】 考綱中明確要求:考生能對數據進行整理、分析,并解決給定的實際問題. 這說明了對樣本估計總體的要求已提升到能力的高度. 但是,由于高中學生的認知水平和生活經歷還相對不是很高,故所命制的樣本估計總體相關問題一般來說都相對比較簡單,主要考查其中的統計圖表和數字特征.
【經典例題】 1. 圖1是樣本容量為200的頻率分布直方圖,根據樣本的頻率分布直方圖估計,下列說法正確的是( )
■
圖1
A. 樣本數據落在[6,10)內的頻數為64,數據落在[2,10)內的概率約為0.4
B. 樣本數據落在[6,10)內的頻數為16,數據落在[2,10)內的概率約為0.1
C. 樣本數據落在[10,14)內的頻數為18,數據落在[6,14)內的概率約為0.68
D. 樣本數據落在[14,22)內的頻數為48,數據落在[10,18)內的概率約為0.12
2. 某苗圃基地為了解基地內甲、乙兩塊地種植的同一種樹苗的長勢情況,從兩塊地各隨機抽取了10株樹苗,分別測出它們的高度如下(單位:cm),
甲:19?搖20?搖21?搖23?搖25?搖29?搖32?搖33?搖37?搖41
乙:10?搖26?搖30?搖30?搖34?搖37?搖44?搖46?搖46?搖47
(1)用莖葉圖表示上述兩組數據,并對兩塊地抽取樹苗的高度的平均數和中位數進行比較,寫出兩個統計結論;
■
(2)綠化部門分配這20株樹苗的栽種任務,小王在株高大于40 cm的5株樹苗中隨機選種2株,則小王沒有選到甲苗圃樹苗的概率是多少?
命題意圖 1. 本題考查了統計中的基本方法思想,要求從直方圖中對樣本進行估計,考查識圖、用圖的有關技能.
2. 本題要求能從所給的數據進行整理,并用圖表進行處理,提取信息,以及處理統計中的平均數、方差(或標準差)等特征數據,并做出判斷.
思路分析 1. 根據樣本頻率直方圖中的矩形的縱軸表示■,得到小矩形的面積即為數據落在區間范圍內的頻率,并用頻率對其相應的概率進行估計;又因為頻數=樣本容量×頻率,所以可得相應區間范圍內的頻數,然后對總估頻率進行估計.
2. 根據所給數據,畫出莖葉圖,可以通過樣本的特征數進行比較,然后根據特征數的意義寫出相應的結論. 第2問可以用列舉法,根據古典概型的計算公式來求解.
完美解答 1. 由樣本的頻率分布直方圖知數據落在[6,10)內的頻率為0.08×(10-6)=0.32,所以可以估計樣本數據落在[6,10)內的頻數為0.32×200=64,同理可估計樣本數據落在[10,14)內的頻數為200×0.09×4=72,樣本數據落在[14,22)內的頻數為200×(0.03×4+0.03×4)=48,可以排除B、C.
數據落在[2,10)內的概率約0.02×4+0.08×4=0.40,A正確.
數據落在[10,18)內的概率約為0.09×4+0.03×4=0.48,D不正確.
所以選A.
2. (1)畫出莖葉圖如圖2所示:
甲 乙
9 1 0
9 5 3 1 0 2 6
7 3 2 3 0 0 4 7
1 4 4 6 6 7
圖2
①甲地樹苗高度的平均數為28 cm,乙地樹苗高度的平均數為35 cm,所以甲地樹苗高度的平均數小于乙地樹苗的高度的平均數;
②甲地樹苗高度的中位數為27 cm,乙地樹苗高度的中位數為35.5 cm,所以甲地樹苗高度的中位數小于乙地樹苗的高度的中位數.
(2)在5株樹苗中,記甲苗圃這株苗為a,乙苗圃中4株苗分別為b,c,d,e,則任取兩株共有ab,ac,ad,ae,bc,bd,be,cd,ce,de共10種情形.
不含a的有6種bc,bd,be,cd,ce,de,所以小王沒有選擇甲苗圃樹苗的概率為■=■.
【命題趨勢】 這部分涉及的知識點較多,概念性的內容也較多,但從高考的實際來看,這部分內容是統計考查的重心. 預計以考查頻率分布直方圖、莖葉圖、平均數、方差、標準差為主,同時考查對樣本估計總體的思想的理解,單純以方差計算為考查目的的考題也并不鮮見. 高考題型多以選擇題和填空題的形式出現,有時也會有解答題,但難度不大.
隨機事件的概率與古典概型
【考綱要求】 了解隨機事件發生的不確定性和頻率的穩定性,了解概率的意義,了解頻率與概率的區別,了解兩個互斥事件的概率加法公式;理解古典概型及其概率計算公式;會(用列舉法)計算一些隨機事件所含的基本事件數及事件發生的概率.
【考綱解讀】 從內容要求上看,有幾個關鍵:事件與概率要求中,均是以“了解”為主,古典概型中則是一個“理解”,一個“會”,其中的互斥事件的概率加法公式成為概率考查縱深的表現. 頻率與概率的區別與聯系是基礎,古典概型的概率計算是核心,文科生對于事件概率的獲得均是以列舉法描述發生事件和基本事件的比來獲取的,而理科生則側重于與排列、組合、隨機變量的分布列與期望等知識進行綜合考查.
【經典例題】 1. 甲、乙、丙三名同學按任意次序站成一排,則甲站在兩端的概率是( )
A. ■ B. ■ C. ■ D. ■
2. 將A,B,C,D,E五種不同的文件隨機地放入編號依次為1,2,3,4,5,6,7的七個抽屜內,每個抽屜至多放一種文件,則文件A,B被放在相鄰的抽屜內且文件C,D被放在不相鄰的抽屜內的概率是( )
A. ■ B. ■ C. ■ D. ■
3.
■
圖3
《中華人民共和國道路交通安全法》規定:車輛駕駛員血液酒精濃度在20~80 mg/100 ml(不含80)之間,屬于酒后駕車;在80 mg/100 ml(含80)以上時,屬醉酒駕車,對于酒后駕車和醉酒駕車的駕駛員公安機關將給予不同程度的處罰.
據《法制晚報》報道,2010年8月1日至8月28日,某市交管部門共抽查了1000輛車,查出酒后駕車和醉酒駕車的駕駛員80人,圖3是對這80人血液中酒精含量進行檢測所得結果的頻率分布直方圖.
(1)根據頻率分布直方圖完成表1:
(2)根據上述數據,求此次抽查的1000人中屬于醉酒駕車的概率;
(3)若用分層抽樣的方法從血液酒精濃度在[70,90)范圍內的駕駛員中抽取一個容量為5的樣本,并將該樣本看成一個總體,從中任取2人,求恰有1人屬于醉酒駕車的概率.
命題意圖 1. 本題主要考查古典概型的概率的計算,靈活運用列舉法或排列組合求事件的概率;
2. 本題主要考查排列組合知識的應用及古典概型的概率的計算.
3. 本題主要考查頻率分布表、頻率分布直方圖、抽樣方法中的分層抽樣、古典概型概率的計算等知識, 考查或然與必然的數學思想方法,以及數據處理能力、運算求解能力和應用意識.?搖
思路分析 1. 由于甲、乙、丙三名同學按任意次序站成一排,因此它屬于古典概型,可以用列舉法求出所有的基本事件數及所求事件所含的基本事件數,也可以用排列組合公式計算.
3. 求一個隨機事件的概率的基本方法是通過大量的重復試驗,可以用事件發生的頻率近似值作為它的概率. 根據分層抽樣確定在[70,90)范圍內的駕駛員的人數抽樣比,再確定5人這一樣本中有幾個,利用列舉法及古典概型的概率計算公式求出恰有1人屬于醉酒駕車的概率.
完美解答 1. (1)(法1)甲、乙、丙三名同學按任意次序站成一排,畫樹狀圖:
■
由圖可知,共有6種不同的結果,而甲站在兩端的有(甲-乙-丙,甲-丙-乙,乙-丙-甲, 丙-乙-甲)4種,所以所求概率為P=■=■.
(法2)由于甲站左端、中間、右端中的任何一個位置是等可能的,甲共有3種不同的站法,而甲站在兩端共有2種站法,所以所求概率為P=■.
(法3)甲、乙、丙三名同學按任意次序站成一排,不同的排法共有A■■=6種. 而甲站在兩端的排法有(C■■A■■)A■■=4,所以所求概率為P=■=■.
2. 將A,B,C,D,E五種不同的文件隨機地放入編號依次為1,2,3,4,5,6,7的七個抽屜內,共有A■■種不同的放法. 而文件A,B被放在相鄰的抽屜內且文件C,D被放在不相鄰的抽屜內可用排除法. 文件A,B被放在相鄰的抽屜內且不考慮文件C,D是否被放在相鄰的抽屜內,有A■■·A■■種不同的放法;文件A,B被放在相鄰的抽屜內且文件C,D也被放在相鄰的抽屜內,有A■■·A■■·A■■,故所求的概率為P=■=■. 選B.
3. (1)見表2
(2)P=■=0.012.
(3)因為血液酒精濃度在[70,80)范圍內有12人,[80,90)范圍內有8人,要抽取一個容量為5的樣本,[70,80)內范圍內應抽3人,記為a,b,c,[80,90)范圍內應抽2人,記為d,e,則從總體中任取2人的所有情況為(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),恰有一人的血液酒精濃度在[80,90)范圍內的情況有(a,d),(a,e),(b,d),(b,e),(c,d),(c,e),共6種,設“恰有1人屬于醉酒駕車”為事件A,則P(A)=■=■.
【命題趨勢】 概率試題通常是通過對課本原題進行改編,通過對基礎知識的重新組合、變式和拓展,從而加工為立意高、情境新、設問巧、并賦予時代氣息、貼近學生實際的問題.這樣的試題體現了數學試卷新的設計理念,尊重不同考生群體思維的差異,貼近考生的實際. 預計古典概型的概率問題仍將作為高考的重點來考查,多為解答題,可能會綜合隨機抽樣、統計圖表與數字特征等進行考查,而理科類試題還可能會與獨立事件、互斥事件等相關知識結合起來命題.
分類加法計數原理、分步乘法計數原理與排列與組合
【考綱要求】 理解分類加法計數原理和分步乘法計數原理;會用分類加法計數原理或分步乘法計數原理分析和解決一些簡單的實際問題;理解排列、組合的概念;能利用計數原理推導排列數公式、組合數公式;能用排列、組合知識解決簡單的實際問題.
【考綱解讀】 考綱中聚焦“兩個原理”是兩種重要的計算方法,重在會用兩個計數原理、排列組合知識分析、解決一些簡單的實際問題.
【經典例題】 1. 三位老師和三位學生站成一排,要求任何兩位學生都不相鄰,則不同的排法總數為( )
A. 720 B. 144 C. 36 D. 12
2. 用0,1,2,3,4,5組成沒有重復數字的六位數中,相鄰兩位數字的奇偶性都不同的有( )
A. 24個 B. 36個
C. 60個?搖?搖D. 72個
3. 3位教師分配到4個貧困村調查義務教育實施情況,若每個村最多去2人,則不同的分配方法種數是____.(用數字作答)?搖
命題意圖 兩個計數基本原理、排列與組合應用問題,是高考理科數學試題中的一個重要考點,考查分析問題、解決問題的能力.
思路分析 1. 本題是一個限制條件的排列問題,可以先分兩步進行,即先安排沒有限制條件的三位老師站好,然后再將三位學生安排到已站好的三位老師形成的空當.
2. 本題是一個數字排列問題,考慮到數字“0”的特殊性,先確定“0”的位置,然后根據相鄰兩位數字的奇偶性都不同確定其他位置.
3. 本題是一個分配問題,常先分組,然后到“位”,即先將3位教師分成三組或兩組,然后再分配到4個貧困村.
完美解答 1. 先安排三位老師站好,有A■■種排法;然后,再將三位學生分別安排到已安排好的三位老師形成的4個空當,有A■■種排法. 故根據分步計數原理,得不同的排法共有A■■·A■■=144種,故選B.
2. 利用特殊元素法是解本題的關鍵,考慮到特殊元素“0”,將“0”分別置于個、十、百、千、萬位考慮,得5×C■■C■■C■■C■■C■■=5×12=60個. 故選C.
3. 分兩類,第一類是3位教師分配到4個貧困村,每個村最多去1人,則不同的分配方法種數有A■■=24種;第二類是3位教師分配到4個貧困村,有一個村是2人,一個村為1人,則不同的分配方法種數有(C■■·C■■)·A■■=36種.
故不同的分配方法種數共有24+36=60種,答案填60.
【命題趨勢】 從近幾年高考試題與模擬試題來看,仍然會注重兩個基本原理,多以現實生活中的實際問題、經濟問題為背景,考查分析問題、解決問題的能力與分類討論的思想.預計題目仍多以選擇題或填空題形式出現,題小而靈活,若出現在解答題里,多與概率綜合在一起,常用來計算隨機事件的概率. 從形式上看,以下幾種類型最為常見:數字問題、人或物的排列問題、幾何問題、選代表或選樣品的問題、集合的子集個數問題,試題的難度與教材習題相當,多為“較易”到“中等”的程度.
二項式定理
【考綱要求】 能用計數原理證明二項式定理;會用二項式定理解決與二項展開式有關的簡單問題.
【考綱解讀】 《考綱說明》中要求考生會用二項式定理解決與二項展開式有關的簡單問題,會用二項式定理求某項系數或展開式系數,會用賦值法求系數和.
【經典例題】 1. 二項式2x-■■的展開式中的常數項為15,則實數a的值為_______.
2. 設(2x-3)10=a0+a1(x-1)+a2(x-1)2+…+a10(x-1)10,則a1+a2+…+a10的值為( )
A. 1-310B. -310-1
C. 310-1?搖?搖?搖 D. 0
命題意圖 1. 本題考查應用二項式定理解決與二項式系數有關的系數問題;
2. 本題考查對二項式定理的理解及賦值法.
思路分析 1. 根據已知指定項的特點,確定r為4,寫出通項公式,再確定所求的系數.
2. 本題與各項的系數有關,可考慮用“賦值法”.
完美解答 1. Tr+1=C■■(2x)6-r·-■■=(-a)r·26-rC■■x■,由6-3r=0得r=2,即T3為展開式的常數項,所以(-a)2·24C■■=15,解得a=±■.
2. 令x=1,得(2×1-3)10=a0,所以a0=1;再令x=2,得(2×2-3)10=a0+a1(2-1)+a2(2-1)2+…+a10(2-1)10,得a1+a2+…+a10=1-a0=1-1=0,所以選D.
【命題趨勢】 二項式定理的試題是多年來最缺少變化的試題,歷年高考二項式定理的試題以客觀題的形式出現,多為課本例題、習題遷移的改編題,難度不大,重點考查運用二項式定理去解決問題的能力和邏輯劃分、化歸轉化等思想方法.
預計多項式系數求和、求某項系數、求二項式中的參數值、求常數項、求冪指數n仍然是考查的重點,對于三項式轉化成二項式問題也有一定的考查趨勢.
離散型隨機變量的分布列、期望與方差
【考綱要求】 理解取有限個值的離散型隨機變量及其分布列的概念,了解分布列對于刻畫隨機現象的重要性. 理解超幾何分布及其導出過程,并能進行簡單的應用. 了解兩個事件相互獨立的概念,理解n次獨立重復試驗的模型及二項分布,并能解決一些簡單的實際問題. 理解取有限個值的離散型隨機變量均值、方差的概念,能計算簡單離散型隨機變量的均值、方差,并能解決一些實際問題.
【考綱解讀】 理科的概率要求顯然是從隨機變量及其分布列著手的,即從統計分布的角度進入的. 從行為動詞“理解”的角度看,重點應關注離散型隨機變量及其分布列、超幾何分布、二項分布(含n次獨立重復試驗模型),“會”計算離散型隨機變量的均值與方差,并且在上述基礎上解決簡單的實際問題,考查閱讀分析、運用數學知識解決問題的能力.
【經典例題】 1. 某中學選派40名同學參加北京市高中生技術設計創意大賽的培訓,他們參加培訓的次數統計如表3所示:
表3
■
(1)從這40人中任意選3名學生,求這3名同學中至少有2名同學參加培訓次數恰好相等的概率;
(2)從40人中任選兩名學生,用X表示這兩人參加培訓次數之差的絕對值,求隨機變量X的分布列及數學期望EX.
2. 已知武漢某公司2007年—2011年的產品抽檢情況如表4:
由于受到歐債危機的影響,2012年計劃生產8500件該產品,若生產一件合格產品贏利0.5萬元,生產一件次品虧損0.3萬元.
(1)完成題中表格,并指出該工廠生產的該產品的合格率最接近于哪個數值p(精確到0.1);
(2)以(1)中的數值p作為該產品的合格率,請你幫該工廠作出經營利潤方面的預測.
命題意圖 1. 本題主要考查組合、古典概型、互斥事件、離散型隨機變量的分布列及數學期望等知識,考查運算求解能力以及應用概率知識分析解決問題的能力,考查必然與或然思想及分類討論的數學思想.
2. 本題主要考查相互獨立事件、離散型隨機變量的分布列、二項分布的識別,考查綜合運用所學知識分析、解決實際問題的能力
思路分析 1. 從這40人中任意選3名學生,求這3名同學中至少有2名同學參加培訓次數恰好相等的概率,可以先求出3名學生參加培訓次數都不相等的概率,然后運用對立事件的概率公式求得. 又由于學生參加培訓次數為1,2,3,所以兩人參加培訓次數之差的絕對值X可能為0,1,2,然后求出相應的概率,列出分布列,根據數學期望的公式求得結果.
2. 由于每次抽取該工廠生產的產品是相互獨立的,因此合格產品的數量ξ服從二項分布,求Eξ可用公式Eξ=np求解,然后計算經營利潤.
完美解答 1. (1)這3名同學中至少有2名同學參加培訓次數恰好相等的概率為P=1-■=■.
■
所以的數學期望EX=0×■+1×■+2×■=■.
2. (1)合格率分別為0.798,0.801,0.803,0.798,0.800.
該產品的合格率最接近于數值0.8,即p=0.8.
(2)設8500件產品中合格產品的數量為ξ,則ξ為隨機變量,且ξ~B8500,■,故E(ξ)=8500×■=6800(件),即預測2012年該產品的合格產品數量為6800件,從而經營利潤為6800×0.5-(8500-6800)×0.3=3400-510=2890(萬元).
【命題趨勢】 由于離散型隨機變量的分布列、均值與方差與現實生活聯系密切,能充分體現數學的應用價值,也符合高考發展的方向,是近幾年高考的熱點與重點內容. 預計在今后的高考中,它仍然是考查的重點,題型有選擇題和填空題,但不同的地區,在命題設計上不盡相同,依然是以解答題為主.
■
隨機數與幾何概型
【考綱要求】 了解隨機數的意義,能運用模擬方法估計概率. 了解幾何概型的意義.
【考綱解讀】 《考試說明》要求“了解隨機數的意義,了解幾何概型的意義”,所以應在了解的基礎上,還要理解,會運用模擬方法估計概率,會解決一些幾何概型的求解問題. 由于幾何概型具有無限性和等可能性這兩個特點,因此幾何概型的求解與古典概型的求解思路是一樣的,都屬于比例解法.
【經典例題】 1. 如圖4,矩形的長為6,寬為4,在矩形內隨機地撒300顆黃豆,落在橢圓外的黃豆數為96顆,以此實驗數據為依據可以估計出橢圓的面積約為( )
■
圖4
A. 7.68B. 8.68
C. 16.32D. 17.32
2. 若A是圓C:x2+y2+4y=0上的定點,B是圓C上不同于A的動點,則△CAB的周長小于6的概率是______.
命題意圖 1. 本題直接以考綱中的“了解隨機數的意義,能運用模擬方法估計概率”來設計考題,并解決實際問題.
2. 本題把幾何概型的計算方法用于角度上,考查對幾何概型的掌握程度和事件轉化的能力.
思路分析 1. 統計落在橢圓內部的隨機點的個數與落在正方形中的隨機點的個數,根據比例關系求得橢圓面積的近似值.
2. 根據△CAB的周長找出只需要求弦AB的長小于2的概率,由B是圓C上的動點,再將概率問題轉化為圓心角來求解.
完美解答 1. 由于矩形的面積為6×4=24,設橢圓的面積約為S,則■=■,解得S=16.32,所以選C.
2. 由圓C:x2+y2+4y=0知圓的半徑為2,所以△CAB的周長為AC+CB+AB=2+2+AB=4+AB,且B是圓C上的動點,所以求△CAB的周長小于6的概率即求弦AB的長小于2的概率,進而求∠ACB≤■的概率.
故所求的概率為■=■.
【命題趨勢】 隨機數與幾何概型在高考中所占比較輕,近幾年的高考對概率要求有所降低,且它是新增內容,考試涉及的可能性會較大. 預測題目類型多以客觀題的形式出現,重點內容是幾何概型的求值問題,要善于將實際問題轉化為概率模型來處理.
變量的相關性、回歸分析、獨立性檢驗
【考綱要求】 變量的相關性:①會作兩個有關聯變量的數據的散點圖,會利用散點圖認識變量間的相關關系;②了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程.了解下列一些常見的統計方法,并能應用這些方法解決一些實際問題. ①獨立性檢驗:了解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及其簡單應用. ②回歸分析:了解回歸的基本思想、方法及其簡單應用.
【考綱解讀】 在《說明》中明確提出不要求記憶線性回歸方程系數公式、獨立性檢驗隨機變量K2值的計算公式. 從考綱中“變量相關性”的要求來看,有兩個“會”、一個“了解”、一個“能”,是一個完整的作散點圖、求回歸方程,并給出回歸分析的統計過程,試題常體現在“會”、“能”兩個行為動詞上. 而對兩種統計方法說是了解,實際上是要在“能”字上下工夫.
【經典例題】 1. 某農科所對冬季晝夜溫差大小與某反季節大豆新品種發芽多少之間的關系進行分析研究,他們分別記錄了12月1日至12月5日的每天晝夜溫差與實驗室每天每100顆種子中的發芽數,得到如表5的資料.
該農科所確定的研究方案是:先從這五組數據中選取2組,用剩下的3組數據求線性回歸方程,再對被選取的2組數據進行檢驗.
(1)求選取的2組數據恰好是不相鄰2天數據的概率;
(2)若選取的是12月1日與12月5日的兩組數據,請根據12月2日至12月4日的數據,求出y關于x的線性回歸方程,并預報當溫差為9℃時的種子發芽數.
2. 某中學舉辦安全法規知識競賽,從參賽的高一、高二學生中各抽出100人的成績作為樣本. 對高一年級的100名學生的成績進行統計,并按[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分組,得到成績分布的頻率分布直方圖(如圖5).
(1)若規定60分以上(包括60分)為合格,計算高一年級這次知識競賽的合格率;
■
圖5
(2)若高二年級這次知識競賽的合格率為60%,由以上統計數據填寫下面2×2列聯表,并問是否有99%的把握認為“這次知識競賽的成績與年級有關系”.
■
參考數據與公式:
由列聯表中數據計算K2=■
臨界值表
■
命題意圖 1. 本題主要考查古典概率的計算、線性回歸直線方程的理解及回歸分析方法的簡單應用,考查運算能力、處理數據和分析問題、解決問題的能力.
2. 本題重點考查了古典概型概率的計算與統計中獨立性檢驗的相關知識,要求我們能夠熟練地利用圖表中的數據來進行分析,進而得出相應的結論.
思路分析 1. 第1問可以用列舉法,計算基本事件總數與所求隨機事件所包含基本事件的總數,運算公式計算;第2問由線性回歸直線方程可知,它必過點(■,■),據此求出回歸系數,再令x=9,代入回歸方程預測種子發芽數.
2. 第1問由樣本對總體進行估計,通過樣本的頻率及互斥事件的概率公式計算高一年級在這次知識賽的合格率;第2問將關聯表的有關數據代入獨立性檢驗隨機變量K2值的計算公式算出K2,然后再通過獨立性檢驗臨界值表求解.
完美解答 1. (1)設抽到不相鄰的兩組數據為事件A,從5組數據中選取2組數據共有10種情況:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),其中數據為12月份的日期數. 每種情況都是等可能出現的,事件A包括的基本事件有6種,所以P(A)=■.
所以選取的2組數據恰好是不相鄰2天數據的概率是■
(2)由數據,求得■=12,■=27. 由公式■=■求得■=■,■=■-■■=-3,所以y關于x的線性回歸方程為■=■x-3. 由此可以預報當溫差為9℃時的種子發芽數為19或20顆.
2. (1)高一在這次知識競賽的合格率為0.02×10+0.03×10+0.02×10+0.01×10=80%.
(2)列聯表如下:
■
所以K2=■≈9.5>6.635,所以有99%的把握認為“這次知識競賽的成績與年級有關系”.
【命題趨勢】 統計案例內容主要包括回歸分析的基本思想及其初步應用和獨立性檢驗的基本思想和初步應用,是教材新增內容,估計高考中比重不會過大. 隨著新課程標準的全面推行,高考對概率與統計的考查要求與命題背景在不斷地變化著,高考對文科考生的概率知識要求降低,必然加大對統計知識的考查力度,目的是提高我們的統計判斷能力,預計2012年高考試題考查用獨立性檢驗判斷A與B間的關系及2×2列聯表的趨勢有所加強.
■
條件概率
【考綱要求】 了解條件概率的概念.
【考綱解讀】 考綱中對條件概率的要求較低,事實上它只是相互獨立事件概念的一個過渡. 條件概率的計算可以用定義法,但要做輔助計算;也可以通過縮小基本事件的個數的取值范圍,用古典概型計算求得.
【經典例題】 一個盒子里有6只好晶體管,4只壞晶體管,任取兩次,每次取一只,每次取后不放回,則若已知第一只是好的,則第二只也是好的概率為( )
A. ■?搖?搖 B. ■?搖?搖 C. ■?搖?搖?搖 D. ■
命題意圖 本題主要考查條件概率的計算.
思路分析 根據條件概率的計算公式P(AB)=■,分別計算出P(B),P(A∩B)即可獲解.
完美解答 設Ai={第i只是好的}(i=1,2),由題意知要求P(A2A1),因為,P(A1)=■=■,P(A1∩A2)=■=■,所以P(A2A1)=■=■,選C.
【命題趨勢】 從近幾年高考命題來看,各地區對條件概率知識的考查較少,僅在2011年遼寧高考試題中出現了. 預計在今后的高考題目設置時,條件概率作為新增內容,仍以選擇題、填空題的形式出現,也可與其他的概率問題綜合考查.
正態分布
【考綱要求】 利用實際問題的直方圖,了解正態分布曲線的特點及曲線所表示的意義.
【考綱解讀】 從考綱中可以看出,正態分布這一考點要求較低,只需要“了解”,對概率的計算要正確運用正態分布曲線的對稱性.
【經典例題】 已知隨機變量x服從正態分布N(μ,σ2),且P(μ-2σ<x≤μ+2σ)=0.9544,P(μ-σ<x≤μ+σ)=0.6826,若μ=4,σ=1,則P(5<x<6)等于( )
A. 0.1358?搖?搖B. 0.1359
C. 0.2716?搖?搖D. 0.2718
命題意圖 本題主要考查利用正態分布曲線的性質求某特定區間的概率的計算能力與轉化能力.
■
圖6
思路分析 根據標準正態分布曲線是關于y軸對稱的,可以將區間進行合理轉化求得結果.
完美解答 由題知x~N(4,1),作出相應的正態曲線,如圖6,依題意P(2 【命題趨勢】 高考中對正態分布的考查主要體現在對正態分布曲線性質的考查,標準正態分布與一般正態分布間的轉化,以及利用正態分布曲線的性質求某特定事件的概率.雖然考綱對其要求很低,但是正態分布廣泛應用于實踐之中,隨著新課改的深入,預計2012年正態分布這個考點還會出現在少數地區的高考試卷中. ■ 一、選擇題 1. 圖7是某社區工會對當地企業工人月收入情況進行一次抽樣調查后畫出的頻率分布直方圖,其中第二組月收入在[1.5,2)千元的頻數為300,則此次抽樣的樣本容量為( ) ■ 圖7 A. 1000?搖?搖?搖?搖 B. 2000 C. 3000?搖?搖?搖?搖?搖D. 4000 2. 某地為了調查職業滿意度,決定用分層抽樣的方法從公務員、教師、自由職業者三個群體的相關人員中抽取若干人組成調查小組,相關數據見表6: 表6 ■ 則調查小組的總人數為( ) A. 84?搖?搖?搖?搖 B. 12?搖?搖?搖?搖 C. 81?搖?搖?搖?搖?搖D. 14 3. 表7是某機電設備的廣告費用x與銷售額y的統計數據: 表7 ■ 據此模型預報廣告費用為6萬元時的銷售額為( ) A. 63.6萬元 B. 65.5萬元 C. 67.7萬元 D. 72.0萬元 二、填空題 6. 從4名男生和3名女生中選出4人參加市中學生知識競賽活動,若這4人中必須既有男生又有女生,不同的選法共有_______種. 7. 某市派出甲、乙兩支球隊參加全省足球冠軍賽,甲、乙兩隊奪取冠軍的概率分別是■和■,則該市足球隊奪得全省足球冠軍的概率是_____. 三、解答題 8. 文科班某同學參加某省學業水平測試,物理、化學、生物獲得等級A和獲得等級不是A的機會相等,物理、化學、生物獲得等級A的事件分別記為W1,W2,W3,物理、化學、生物獲得等級不是A的事件分別記為W1,W2,W3. (1)試列舉該同學這次水平測試中物理、化學、生物成績是否為A的所有可能結果(如三科成績均為A記為(W1,W2,W3)); (2)求該同學參加這次水平測試獲得兩個A的概率; (3)試設計一個關于該同學參加這次水平測試物理、化學、生物成績情況的事件,使該事件的概率大于85%,并說明理由. 9. 某食品廠為了檢查甲、乙兩條自動包裝流水線的生產情況,隨機在這兩條流水線上各抽取40件產品作為樣本稱出它們的重量(單位:克),重量值落在(495,510]的產品為合格品,否則為不合格品. 圖8是甲流水線樣本的頻率分布直方圖,表8是乙流水線樣本頻數分布表. (1)若以頻率作為概率,試估計從甲流水線上任取5件產品,求其中合格品的件數X的數學期望; (2)從乙流水線樣本的不合格品中任意取2件,求其中超過合格品重量的件數Y的分布列; (3)由以上統計數據完成下面2×2列聯表,并回答有多大的把握認為“產品的包裝質量與兩條自動包裝流水線的選擇有關”. 10. 3月是植樹造林的最佳時節,公園打算在3·12植樹節前后引種一批名優樹種. 現有甲、乙兩家苗木場各送來一批同種樹苗.公園園林部分別各抽取100棵測量其高度,得到如表11的頻率分布表. (1)分別算出甲、乙兩家苗木場樹苗樣本高度的平均值■甲,■乙;(樣本數據第i組的頻率為pi,中間值為xi(i=1,2,…,n),則平均值為■=x1p1+x2p2+…+xnpn) (2)根據樣本數據可算得兩個方差:S■■=120.16,S■■=105.0,結合(1)中算出的數據,如果你是公園園林部主管,你將選擇哪家苗木場的樹苗?說明你的觀點; (3)用分層抽樣方法從乙苗木場的樣本中抽取10棵,小林同學從這10棵中挑選2棵試種,其中高度在[90,100]范圍的有X棵,求X的分布列和數學期望. 11. 甲、乙兩同學進行下棋比賽,約定每局勝者得1分,負者得0分(無平局),比賽進行到有一個人比對方多2分或比滿8局時停止,設甲在每局中獲勝的概率為pp>■,且各局勝負相互獨立.已知第二局比賽結束時比賽停止的概率為■. (1)圖9為統計這次比賽的局數n和甲、乙的總得分S,T的程序框圖. 其中如果甲獲勝,輸入a=1,b=0;如果乙獲勝,則輸入a=0,b=1. 請問在①②兩個判斷框中應分別填寫什么條件; (2)求p的值; (3)設ξ表示比賽停止時已比賽的局數,求隨機變量ξ的分布列和Eξ.