《2020年高三數(shù)學(xué)二輪復(fù)習(xí) 專題五第二講 統(tǒng)計、統(tǒng)計案例教案 理》由會員分享,可在線閱讀,更多相關(guān)《2020年高三數(shù)學(xué)二輪復(fù)習(xí) 專題五第二講 統(tǒng)計、統(tǒng)計案例教案 理(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第二講 統(tǒng)計、統(tǒng)計案例
研熱點(聚焦突破)
類型一 抽樣方法
抽樣方法主要有簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣三種,這三種抽樣方法各自適用不同特點的總體,但無論哪種抽樣方法,每一個個體被抽到的概率都是相等的,都等于樣本容量和總體容量的比值.
[例1] (2020年高考山東卷)采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調(diào)查,為此將他們隨機編號為1,2,…,960,分組后在第一組采用簡單隨機抽樣的方法抽到的號碼為9.抽到的32人中,編號落入?yún)^(qū)間[1,450]的人做問卷A,編號落入?yún)^(qū)間[451,750]的人做問卷B,其余的人做問卷C.則抽到的人中,做問卷B的人數(shù)為( )
A.7
2、 B.9 C.10 D.15
[解析] 結(jié)合系統(tǒng)抽樣的概念、等差數(shù)列的概念及通項公式求解.
由系統(tǒng)抽樣的特點知:抽取號碼的間隔為=30,抽取的號碼依次為9,39,69,…,939.落入?yún)^(qū)間[451,750]的有459,489,…,729,這些數(shù)構(gòu)成首項為459,公差為30的等差數(shù)列,設(shè)有n項,顯然有729=459+(n-1)×30,解得n=10.所以做問卷B的有10人.
[答案] C
跟蹤訓(xùn)練
(2020年高考江蘇卷)某學(xué)校高一、高二、高三年級的學(xué)生人數(shù)之比為3∶3∶4,現(xiàn)用分層抽樣的方法從該校高中三個年級的學(xué)生中抽取容量為50的樣本,則應(yīng)從高二
3、年級抽取________名學(xué)生.
解析:抽取比例與學(xué)生比例一致.
設(shè)應(yīng)從高二年級抽取x名學(xué)生,則x∶50=3∶10.解得x=15.
答案:15
類型二 用樣本估計總體
1.頻率分布直方圖
(1)各矩形的面積和為1;
(2)縱軸表示的不是頻率而是頻率/組距;
(3)樣本數(shù)據(jù)的平均數(shù)為各組中值與各組頻率積的和;
(4)眾數(shù)為最高矩形底邊中點的坐標(biāo).
2.莖葉圖:沒有數(shù)據(jù)的流失.
3.樣本平均數(shù):x=(x1+x2+…+xn)
樣本方差s2=[(x1-x)2+(x2-x)2+…)2].
4.眾數(shù)
在樣本數(shù)據(jù)中,頻率分布最大值所對應(yīng)的樣本數(shù)據(jù)(或出現(xiàn)次數(shù)最多的那個數(shù)據(jù)).
4、
5.中位數(shù)
樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù).如果數(shù)據(jù)的個數(shù)為偶數(shù),就取當(dāng)中兩個數(shù)據(jù)的平均數(shù)作為中位數(shù).
例2] (1)(2020年高考山東卷)如圖是根據(jù)部分城市某年6月份的平均氣溫(單位:℃)數(shù)據(jù)得到的樣本頻率分布直方圖,其中平均氣溫的范圍是[20.5,26.5],樣本數(shù)據(jù)的分組為[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知樣本中平均氣溫低于22.5 ℃的城市個數(shù)為11,則樣本中平均氣溫不低于25.5 ℃的城市個數(shù)為________.
[解析] 結(jié)合直方圖和樣本數(shù)
5、據(jù)的特點求解.
最左邊兩個矩形面積之和為0.10×1+0.12×1=0.22,總城市數(shù)為11÷0.22=50,最右面矩形面積為0.18×1=0.18,50×0.18=9.
[答案] 9
(2)(2020年高考陜西卷)從甲、乙兩個城市分別隨機抽取16臺自動售貨機,對其銷售額進行統(tǒng)計,統(tǒng)計數(shù)據(jù)用莖葉圖表示(如圖所示).設(shè)甲、乙兩組數(shù)據(jù)的平均數(shù)分別為甲、乙,中位數(shù)分別為m甲、m乙,則( )
A.甲<乙,m甲>m乙
B.甲<乙,m甲乙,m甲>m乙
D.甲>乙,m甲
6、14+18+18+5+6+8)=,
乙=(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=.
∴甲<乙.
又∵m甲=20,m乙=29,∴m甲
7、5. 所以x+y=8.
答案:C
類型三 線性回歸分析
1.判斷兩變量是否有線性相關(guān)關(guān)系的方法
(1)作散點圖;
(2)利用相關(guān)系數(shù)判斷相關(guān)性的強弱.
2.回歸直線方程=x+必過定點(,).
[例3] (2020年高考湖南卷)設(shè)某大學(xué)的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為=0.85x-85.71,則下列結(jié)論中不正確的是( )
A.y與x具有正的線性相關(guān)關(guān)系
B.回歸直線過樣本點的中心(,)
C.若該大學(xué)某女生身高增加1 cm,則其體重約增加0.85 kg
D.
8、若該大學(xué)某女生身高為170 cm,則可斷定其體重必為58.79 kg
[解析] 根據(jù)線性回歸方程中各系數(shù)的意義求解.
由于線性回歸方程中x的系數(shù)為0.85,因此y與x具有正的線性相關(guān)關(guān)系,故A正確.又線性回歸方程必過樣本中心點(,),因此B正確.由線性回歸方程中系數(shù)的意義知,x每增加1 cm,其體重約增加0.85 kg,故C正確.當(dāng)某女生的身高為170 cm時,其體重估計值是58.79 kg,而不是具體值,因此D不正確.
[答案] D
跟蹤訓(xùn)練
已知變量x,y之間具有線性相關(guān)關(guān)系,其散點圖如圖所示,則其回歸方程可能為( )
A.=1.5x+2
B.=-1.5x+2
C.=
9、1.5x-2
D.=-1.5x-2
解析:設(shè)回歸方程為=bx+a.由散點圖可知變量x、y之間負(fù)相關(guān),回歸直線在y軸上的截距為正數(shù),所以b<0,a>0,因此其回歸直線方程可能為=-1.5x+2.
答案:B
類型四 獨立性檢驗
2×2列聯(lián)表
一般地,假設(shè)有兩個分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表為:
構(gòu)造一個隨機變量:
K2=(其中n=a+b+c+d為樣本容量).
[例4] (2020年高考遼寧卷)電視傳媒公司為了解某地區(qū)觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調(diào)查,其中女性有55名.下面是根據(jù)調(diào)查結(jié)果繪制的觀眾日均
10、收看該體育節(jié)目時間的頻率分布直方圖:
將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”,已知“體育迷”中有10名女性.
(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,并據(jù)此資料你是否認(rèn)為“體育迷”與性別有關(guān)?
(2)將日均收看該體育節(jié)目不低于50分鐘的觀眾稱為“超級體育迷”,已知“超級體育迷”中有2名女性,若從“超級體育迷”中任意選取2人,求至少有1名女性觀眾的概率.
附:χ2=
[解析] (1)由頻率分布直方圖可知,在抽取的100人中,“體育迷”有25人,從而完成2×2列聯(lián)表如下:
將2×2列聯(lián)表中的數(shù)據(jù)代入公式計算,得
χ2=
==≈3.030.因為3
11、.030<3.841,所以我們沒有理由認(rèn)為“體育迷”與性別有關(guān).
(2)由頻率分布直方圖可知,“超級體育迷”為5人,從而一切可能結(jié)果所組成的基本事件空間為Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},其中ai表示男性,i=1,2,3,bj表示女性,j=1,2.
Ω由10個基本事件組成,而且這些基本事件的出現(xiàn)是等可能的.用A表示“任選2人中,至少有1人是女性”這一事件,則A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),
12、(b1,b2)},事件A由7個基本事件組成,因而P(A)=.
跟蹤訓(xùn)練
一個車間為了規(guī)定工時定額.需要確定加工零件所花費的時間,為此進行了10次試驗.測得的數(shù)據(jù)如下:
(1)y與x是否具有線性相關(guān)關(guān)系?
(2)如果y與x具有線性相關(guān)關(guān)系,求回歸直線方程;
(3)根據(jù)求出的回歸直線方程,預(yù)測加工200個零件所用的時間為多少?
解析:(1)列出下表:
由于r=0.999 8>0.75,因此x與y之間有很強的線性相關(guān)關(guān)系,因而可求回歸直線方程.
(2)設(shè)所求的回歸直線方程為=x+,則有
因此,所求的回歸直線方程為=0.668x+54.96.
(3)這個回歸直線
13、方程的意義是當(dāng)x每增大1時,y的值約增加0.668,而54.96是y不隨x增加而變化的部分.因此,當(dāng)x=200時,y的估計值為=0.668×200+54.96=188.56≈189.
因此,加工200個零件所用的工時約為189分.
析典題(預(yù)測高考)
高考真題
【真題】 (2020年高考陜西卷)假設(shè)甲乙兩種品牌的同類產(chǎn)品在某地區(qū)市場上銷售量相等,為了解它們的使用壽命,現(xiàn)從這兩種品牌的產(chǎn)品中分別隨機抽取100個進行測試,結(jié)果統(tǒng)計如圖所示:
(1)估計甲品牌產(chǎn)品壽命小于200小時的概率;
(2)這兩種品牌產(chǎn)品中,某個產(chǎn)品已使用了200小時,試估計該產(chǎn)品是甲品牌的概率.
【解析】
14、(1)甲品牌產(chǎn)品壽命小于200小時的頻率為=,用頻率估計概率,所以甲品牌產(chǎn)品壽命小于200小時的概率為.
(2)根據(jù)抽樣結(jié)果,壽命大于200小時的產(chǎn)品共有75+70=145(個),其中甲品牌產(chǎn)品是75個,所以在樣本中,壽命大于200小時的產(chǎn)品是甲品牌的頻率是=,用頻率估計概率,所以已使用了200小時的該產(chǎn)品是甲品牌的概率為.
【名師點睛】 本題通過直方圖考查頻率的求解及頻率與概率間的關(guān)系,著重考查讀圖、識圖能力,難度中等.解答本題時要注意甲、乙兩圖中縱軸含義為“頻數(shù)”.
考情展望
概率統(tǒng)計部分是高考命題熱點,各種題型都有,主要有兩個方面:一是在選擇填空中考查抽樣方法,用樣本估計總體
15、、回歸分析以及獨立性檢驗等基本問題.二是在解答題中,考查概率與統(tǒng)計中內(nèi)容的綜合問題,應(yīng)用性較強.
名師押題
【押題】 第30屆夏季奧運會于2020年7月27日在倫敦舉行,當(dāng)?shù)啬硨W(xué)校招募了8名男志愿者和12名女志愿者.將這20名志愿者的身高編成如下莖葉圖(單位:cm):
若身高在180 cm以上(包括180 cm)定義為“高個子”,身高在180 cm以下(不包括180 cm)定義為“非高個子”,且只有“女高個子”才能擔(dān)任“禮儀小姐”.
(1)如果用分層抽樣的方法從“高個子”和“非高個子”中抽取5人,再從這5人中選2人,那么至少有一人是“高個子”的概率是多少?
(2)若從所有“高個子
16、”中選3名志愿者,用X表示所選志愿者中能擔(dān)任“禮儀小姐”的人數(shù),試寫出X的分布列,并求X的數(shù)學(xué)期望.
【解析】 (1)根據(jù)莖葉圖可知,這20名志愿者中有“高個子”8人,“非高個子”12人,
用分層抽樣的方法從中抽取5人,則每個人被抽中的概率是=,
所以應(yīng)從“高個子”中抽8×=2人,從“非高個子”中抽12×=3人.
用事件A表示“至少有一名‘高個子’被選中”,則它的對立事件A表示“沒有一名‘高個子’被選中”,則P(A)=1-P(A)=1-=1-=.因此,至少有一人是“高個子”的概率是.
2)依題意知,所選志愿者中能擔(dān)任“禮儀小姐”的人數(shù)X的所有可能取值為0,1,2,3.
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==.
因此,X的分布列如下:
0
1
2
3
所以X的數(shù)學(xué)期望EX=0×+1×+2×+3×=.