《2018版高考數(shù)學二輪復習 第1部分 重點強化專題 專題3 概率與統(tǒng)計 第7講 回歸分析、獨立性檢驗教學案 理》由會員分享,可在線閱讀,更多相關《2018版高考數(shù)學二輪復習 第1部分 重點強化專題 專題3 概率與統(tǒng)計 第7講 回歸分析、獨立性檢驗教學案 理(11頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
第7講 回歸分析、獨立性檢驗
題型1 回歸分析
(對應學生用書第23頁)
■核心知識儲備………………………………………………………………………·
1.變量的相關性
(1)正相關:在散點圖中,點散布在從左下角到右上角的區(qū)域.
(2)負相關:在散點圖中,點散布在從左上角到右下角的區(qū)域.
(3)相關系數(shù)r:當r>0時,兩變量正相關;當r<0時,兩變量負相關;當|r|≤1且|r|越接近于1,相關程度越高,當|r|≤1且|r|越接近于0,相關程度越低.
2.線性回歸方程
方程=x+稱為線性回歸方程,其中=,=-.(,)稱為樣本中心點.
■典題試解尋法…………………………………
2、……………………………………·
【典題】 (2015·全國Ⅰ卷)某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.
圖7-1
表中wi=,w]=.
(1)根據(jù)散點圖判斷,y=a+bx與y=c+d哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立y關于x的回歸方程;
(3)已知這種產品的年利潤z與x,y的關系為z=
3、0.2y-x.根據(jù)(2)的結果回答下列問題:
①年宣傳費x=49時,年銷售量及年利潤的預報值是多少?
②年宣傳費x為何值時,年利潤的預報值最大?
【導學號:07804047】
附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為,=-.
[解] (1)由散點圖可以判斷,y=c+d適宜作為年銷售量y關于年宣傳費x的回歸方程類型.
(2)令w=,先建立y關于w的線性回歸方程.
由于===68,
=- =563-68×6.8=100.6,
所以y關于w的線性回歸方程為=100.6+68w,
因此y關于x的回歸
4、方程為=100.6+68.
(3)①由(2)知,當x=49時,
年銷售量y的預報值=100.6+68=576.6,
年利潤z的預報值=576.6×0.2-49=66.32.
②根據(jù)(2)的結果知,年利潤z的預報值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以當==6.8,即x=46.24時,取得最大值.
故年宣傳費為46.24千元時,年利潤的預報值最大.
[類題通法]求線性回歸方程的步驟:
■對點即時訓練………………………………………………………………………·
某品牌2017款汽車即將上市,為了對這款汽車進行合理定價,某公司在某市五家4S店分別進
5、行了兩天試銷售,得到如下數(shù)據(jù):
4S店
甲
乙
丙
丁
戊
單價x/萬元
18.0
18.6
18.2
18.8
18.4
19.0
18.3
18.5
18.5
18.7
銷量y/輛
88
78
85
75
82
66
82
78
80
76
(1)分別以五家4S店的平均單價與平均銷量為散點,求出單價與銷量的回歸直線方程=x+;
(2)在大量投入市場后,銷量與單價仍服從(1)中的關系,且該款汽車的成本為12萬元/輛,為使該款汽車獲得最大利潤,則該款汽車的單價約為多少萬元(保留一位小數(shù))?
附:=,=-.
[解] (1)五家4S店
6、的平均單價和平均銷量分別為(18.3,83),(18.5,80),(18.7,74),(18.4,80) ,(18.6,78),
∴==18.5,
==79,
∴===-20.
∴=-=79-(-20)×18.5=79+370=449,
∴=-20x+449.
(2)設該款汽車的單價應為x萬元,
設利潤f(x)=(x-12)(-20x+449)=-20x2+689x-5 388,
f′(x)=-40x+689,令-40x+689=0,解得x≈17.2,
故當x≈17.2時,f(x)取得最大值.
∴要使該款汽車獲得最大利潤,該款汽車的單價約為17.2萬元.
■題型強化集訓…
7、……………………………………………………………………·
(見專題限時集訓T1、T3、T5、T6、T7、T9、T10、T11、T12、T14)
題型2 獨立性檢驗
(對應學生用書第24頁)
■核心知識儲備………………………………………………………………………·
獨立性檢驗的步驟
(1)確定分類變量,獲取樣本頻數(shù),得到列聯(lián)表.
(2)求觀測值:k=.
(3)根據(jù)臨界值表,作出正確判斷.如果k≥kα,就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”.
■典題試解尋法………………………………………………………………
8、………·
【典題】 (2017·鄭州第一次質量預測)人機大戰(zhàn)也引發(fā)全民對圍棋的關注,某學校社團為調查學生學習圍棋的情況,隨機抽取了100名學生進行調查.根據(jù)調查結果繪制的學生日均學習圍棋時間的頻率分布直方圖如圖7-2所示,將日均學習圍棋時間不低于40分鐘的學生稱為“圍棋迷”.
圖7-2
(1)根據(jù)已知條件完成下面的列聯(lián)表,并據(jù)此資料判斷是否有95%的把握認為“圍棋迷”與性別有關?
非圍棋迷
圍棋迷
合計
男
女
10
55
合計
(2)將上述調查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量學生中,采用隨機抽樣方法每次抽取1名學生,抽取3次,
9、記被抽取的3名學生中的“圍棋迷”人數(shù)為X.若每次抽取的結果是相互獨立的,求X的分布列,期望E(X)和方差D(X).
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.05
0.01
k0
3.841
6.635
[思路分析] (1)頻率分布直方圖2×2列聯(lián)表下結論;
(2)頻率計算二項分布計算E(X)、D(X).
[解] (1)由頻率分布直方圖可知,在抽取的100人中,“圍棋迷”有25人,
從而2×2列聯(lián)表如下:
非圍棋迷
圍棋迷
合計
男
30
15
45
女
45
10
55
合計
75
25
100
將2×2列聯(lián)表中的數(shù)
10、據(jù)代入公式計算,得
K2==
=≈3.030,
因為3.030<3.841,所以沒有95%的把握認為“圍棋迷”與性別有關.
(2)由頻率分布直方圖知抽到“圍棋迷”的頻率為0.25,將頻率視為概率,即從該地區(qū)學生中抽取一名“圍棋迷”的概率為.由題意知,X~B,從而X的分布列為
X
0
1
2
3
P
E(X)=3×=,D(X)=3××=.
[類題通法] 獨立性檢驗的方法
(1)在2×2列聯(lián)表中,如果兩個變量沒有關系,則應滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關系越弱;|ad-bc|越大,說明兩個變量之間
11、關系越強.
(2)解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟進行求解.
■對點即時訓練………………………………………………………………………·
某課題組對全班45名同學的飲食習慣進行了一次調查,并用如圖7-3所示的莖葉圖表示45名同學的飲食指數(shù).說明:飲食指數(shù)低于70的人被認為喜食蔬菜,飲食指數(shù)不低于70的人被認為喜食肉類.
圖7-3
(1)根據(jù)莖葉圖,完成下面2×2列聯(lián)表,并判斷是否有90%的把握認為“喜食蔬菜還是喜食肉類與性別有關”,說明理由;
喜食蔬菜
喜食肉類
合計
男同學
女同學
合計
(2)用分層抽樣的方
12、法按照喜食蔬菜、喜食肉類從全班同學中隨機抽取15名同學進行進一步調查,記抽到的喜食肉類的女同學的人數(shù)為ξ,求ξ的分布列和數(shù)學期望E(ξ).
【導學號:07804048】
附:K2=.
P(K2≥k0)
0.10
0.05
0.01
k0
2.706
3.841
6.635
[解] (1)根據(jù)莖葉圖,完成的2×2列聯(lián)表如下:
喜食蔬菜
喜食肉類
合計
男同學
19
6
25
女同學
17
3
20
合計
36
9
45
計算得K2==0.562 5<2.706,
對照臨界值得出,沒有90%的把握認為“喜食蔬菜還是喜食肉類與性別有關”.
13、
(2)因為從喜食肉類的同學中抽取的人數(shù)為9×=3,所以ξ的可能取值有0,1,2,3.
P(ξ=0)==,
P(ξ=1)==,
P(ξ=2)==,
P(ξ=3)==.
所以ξ的分布列為
ξ
0
1
2
3
P
所以ξ的數(shù)學期望E(ξ)=0×+1×+2×+3×=1.
■題型強化集訓………………………………………………………………………·
(見專題限時集訓T2、T4、T8、T13)
三年真題| 驗收復習效果
(對應學生用書第26頁)
1.(2015·全國Ⅱ卷)根據(jù)下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結論中
14、不正確的是( )
圖7-4
A.逐年比較,2008年減少二氧化硫排放量的效果最顯著
B.2007年我國治理二氧化硫排放顯現(xiàn)成效
C.2006年以來我國二氧化硫年排放量呈減少趨勢
D.2006年以來我國二氧化硫年排放量與年份正相關
D [對于A選項,由圖知從2007年到2008年二氧化硫排放量下降得最多,故A正確.對于B選項,由圖知,由2006年到2007年矩形高度明顯下降,因此B正確.對于C選項,由圖知從2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知2006年以來我國二氧化硫年排放量與年份負相關,故選D.]
2.(2016·全國Ⅲ卷)如圖7
15、-5所示,是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖.
圖7-5
注:年份代碼1-7分別對應年份2008-2014.
(1)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數(shù)加以說明;
(2)建立y關于t的回歸方程(系數(shù)精確到0.01),預測2016年我國生活垃圾無害化處理量.
【導學號:07804049】
參考數(shù)據(jù):yi=9.32,tiyi=40.17,=0.55,≈2.646.
參考公式:相關系數(shù)r=,回歸方程=+t中斜率和截距的最小二乘估計公式分別為=,=-.
[解] (1)由折線圖中的數(shù)據(jù)和附注中的參考數(shù)據(jù)得
=4, (ti
16、-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,
所以r≈≈0.99.
因為y與t的相關系數(shù)近似為0.99,說明y與t的線性相關程度相當大,從而可以用線性回歸模型擬合y與t的關系.
(2)由=≈1.331及(1)得
==≈0.103.
=-≈1.331-0.103×4≈0.92.
所以y關于t的回歸方程為=0.92+0.10t.
將2016年對應的t=9代入回歸方程得=0.92+0.10×9=1.82.
所以預測2016年我國生活垃圾無害化處理量約為1.82億噸.
3.(2017·全國Ⅱ卷)海水養(yǎng)殖場進行某水產
17、品的新、舊網(wǎng)箱養(yǎng)殖方法的產量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產品的產量(單位:kg),其頻率分布直方圖如7-6所示:
圖7-6
(1)設兩種養(yǎng)殖方法的箱產量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產量低于50 kg,新養(yǎng)殖法的箱產量不低于50 kg”,估計A的概率;
(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產量與養(yǎng)殖方法有關;
箱產量<50 kg
箱產量≥50 kg
舊養(yǎng)殖法
新養(yǎng)殖法
(3)根據(jù)箱產量的頻率分布直方圖,求新養(yǎng)殖法箱產量的中位數(shù)的估計值(精確到0.01).
附:
K2=.
[解] (1)記B表示事件
18、“舊養(yǎng)殖法的箱產量低于50 kg”,C表示事件“新養(yǎng)殖法的箱產量不低于50 kg”.
由題意知P(A)=P(BC)=P(B)P(C).
舊養(yǎng)殖法的箱產量低于50 kg的頻率為
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估計值為0.62.
新養(yǎng)殖法的箱產量不低于50 kg的頻率為
(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估計值為0.66.
因此,事件A的概率估計值為0.62×0.66=0.409 2.
(2)根據(jù)箱產量的頻率分布直方圖得列聯(lián)表
箱產量<50 kg
箱產量≥50 kg
舊養(yǎng)殖法
62
38
新養(yǎng)殖法
34
66
K2=≈15.705.
由于15.705>6.635,故有99%的把握認為箱產量與養(yǎng)殖方法有關.
(3)因為新養(yǎng)殖法的箱產量頻率分布直方圖中,箱產量低于50 kg的直方圖面積為
(0.004+0.020+0.044)×5=0.34<0.5,
箱產量低于55 kg的直方圖面積為
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新養(yǎng)殖法產量的中位數(shù)的估計值為
50+≈52.35(kg).
11