2020高考數(shù)學刷題首秧第八章概率與統(tǒng)計考點測試56變量間的相關關系與統(tǒng)計案例文含解析.docx
《2020高考數(shù)學刷題首秧第八章概率與統(tǒng)計考點測試56變量間的相關關系與統(tǒng)計案例文含解析.docx》由會員分享,可在線閱讀,更多相關《2020高考數(shù)學刷題首秧第八章概率與統(tǒng)計考點測試56變量間的相關關系與統(tǒng)計案例文含解析.docx(14頁珍藏版)》請在裝配圖網(wǎng)上搜索。
考點測試56 變量間的相關關系與統(tǒng)計案例 高考概覽 考綱研讀 1.會作兩個相關變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關關系 2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程 3.了解獨立性檢驗的基本思想、方法及其簡單應用 4.了解回歸分析的基本思想、方法及其簡單應用 一、基礎小題 1.已知回歸直線的斜率的估計值是1.23,樣本點的中心為(4,5),則回歸直線的方程是( ) A.=1.23x+4 B.=1.23x+5 C.=1.23x+0.08 D.=0.08x+1.23 答案 C 解析 選項D顯然錯誤.因為回歸方程必過樣本中心點,把點(4,5)代入選項A,B,C檢驗,滿足的只有選項C.故選C. 2.在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關系數(shù)為( ) A.-1 B.0 C. D.1 答案 D 解析 由題設知,這組樣本數(shù)據(jù)完全正相關,故其相關系數(shù)為1.故選D. 3.甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m,如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 則試驗結果體現(xiàn)A,B兩變量有更強的線性相關性的是( ) A.甲 B.乙 C.丙 D.丁 答案 D 解析 r越大,m越小,線性相關性越強,丁同學的試驗結果體現(xiàn)A,B兩變量有更強的線性相關性.故選D. 4.在研究吸煙與患肺癌的關系中,通過收集數(shù)據(jù)、整理分析數(shù)據(jù)得“吸煙與患肺癌有關”的結論,并且有99%以上的把握認為這個結論是成立的,則下列說法中正確的是( ) A.100個吸煙者中至少有99人患肺癌 B.1個人吸煙,那么這人有99%的概率患有肺癌 C.在100個吸煙者中一定有患肺癌的人 D.在100個吸煙者中可能一個患肺癌的人也沒有 答案 D 解析 統(tǒng)計的結果只是說明事件發(fā)生可能性的大小,具體到一個個體不一定發(fā)生.故選D. 5.設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為=0.85x-85.71,則下列結論中不正確的是( ) A.y與x具有正的線性相關關系 B.回歸直線過樣本點的中心(,) C.若該大學某女生身高增加1 cm,則其體重約增加0.85 kg D.若該大學某女生身高為170 cm,則可斷定其體重必為58.79 kg 答案 D 解析 由于線性回歸方程中x的系數(shù)為0.85,因此y與x具有正的線性相關關系,故A正確.又線性回歸方程必過樣本點的中心(,),因此B正確.由線性回歸方程中系數(shù)的意義知,x每增加1 cm,其體重約增加0.85 kg,故C正確.當某女生的身高為170 cm時,其體重估計值是58.79 kg,而不是具體值,因此D不正確. 6.以模型y=cekx去擬合一組數(shù)據(jù)時,為了求出回歸方程,設z=ln y,其變換后得到線性回歸方程z=0.3x+4,則c=________. 答案 e4 解析 因為y=cekx,所以兩邊取對數(shù),可得ln y=ln (cekx)=ln c+ln ekx=ln c+kx,令z=ln y,可得z=ln c+kx.因為z=0.3x+4,所以ln c=4,所以c=e4. 二、高考小題 7.(xx山東高考)為了研究某班學生的腳長x(單位:厘米)和身高y(單位:厘米)的關系,從該班隨機抽取10名學生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與x之間有線性相關關系.設其回歸直線方程為=x+.已知i=225,i=1600,=4.該班某學生的腳長為24,據(jù)此估計其身高為( ) A.160 B.163 C.166 D.170 答案 C 解析 ∵i=225,∴=i=22.5. ∵i=1600,∴=i=160. 又=4,∴=-=160-422.5=70. ∴回歸直線方程為=4x+70. 將x=24代入上式得=424+70=166. 故選C. 8.(xx全國卷Ⅲ)某城市為了解游客人數(shù)的變化規(guī)律,提高旅游服務質(zhì)量,收集并整理了xx年1月至xx年12月期間月接待游客量(單位:萬人)的數(shù)據(jù),繪制了下面的折線圖. 根據(jù)該折線圖,下列結論錯誤的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相對于7月至12月,波動性更小,變化比較平穩(wěn) 答案 A 解析 對于選項A,由圖易知月接待游客量每年7,8月份明顯高于12月份,故A錯;對于選項B,觀察折線圖的變化趨勢可知年接待游客量逐年增加,故B正確;對于選項C,D,由圖可知顯然正確.故選A. 三、模擬小題 9.(xx合肥質(zhì)檢)某公司一種型號的產(chǎn)品近期銷售情況如下表: 月份(x) 2 3 4 5 6 銷售額y/萬元 15.1 16.3 17.0 17.2 18.4 根據(jù)上表可得到回歸直線方程=0.75x+,據(jù)此估計,該公司7月份這種型號產(chǎn)品的銷售額約為( ) A.19.5萬元 B.19.25萬元 C.19.15萬元 D.19.05萬元 答案 D 解析 由表可知=(2+3+4+5+6)=4, =(15.1+16.3+17+17.2+18.4)=16.8,則樣本中心點(4,16.8)在線性回歸直線上,故16.8=0.754+,得=13.8.故當x=7時,=0.757+13.8=19.05.故選D. 10.(2019衡陽模擬)某城市收集并整理了該市xx年1月份至10月份每月最低氣溫與最高氣溫(單位:℃)的數(shù)據(jù),繪制了下面的折線圖.已知該市每月的最低氣溫與當月的最高氣溫兩變量具有較好的線性關系,則根據(jù)該折線圖,下列結論錯誤的是( ) A.每月的最低氣溫與當月的最高氣溫兩變量為正相關 B.10月份的最高氣溫不低于5月份的最高氣溫 C.月溫差(最高氣溫減最低氣溫)的最大值出現(xiàn)在1月份 D.最低氣溫低于0 ℃的月份有4個 答案 D 解析 由圖觀察可得,當最低氣溫較大時,最高氣溫也較大,故A正確;10月份的最高氣溫大于20 ℃,而5月份的最高氣溫不超過20 ℃,故B正確;從各月的溫差看,1月份的溫差最大,故C正確;而最低氣溫低于0 ℃的月份是1,2,4三個月份.故選D. 11.(xx河北邯鄲二模)觀察下面頻率等高條形圖,其中兩個分類變量x,y之間關系最強的是( ) 答案 D 解析 在頻率等高條形圖中,與相差很大時,我們認為兩個分類變量有關系,在四個選項中(等高的條形圖)中,若x1,x2所占比例相差越大,則分類變量x,y的相關性越強.故選D. 12.(xx河北武邑中學調(diào)研)為了考察兩個變量x和y之間的線性相關性,甲、乙兩位同學各自獨立地做了100次和150次試驗,并且利用線性回歸方法,求得回歸直線分別為l1和l2,已知兩個人在試驗中發(fā)現(xiàn)對變量x的觀測數(shù)據(jù)的平均值都是s,對變量y的觀測數(shù)據(jù)的平均值都是t,那么下列說法正確的是( ) A.l1和l2有交點(s,t) B.l1與l2相交,但交點不一定是(s,t) C.l1與l2必定平行 D.l1與l2必定重合 答案 A 解析 由題意知(s,t)是甲、乙兩位同學所做試驗的樣本點的中心,而線性回歸直線恒過樣本點的中心.故選A. 13.(xx大連雙基測試)已知x與y之間的幾組數(shù)據(jù)如下表: x 1 2 3 4 5 6 y 0 2 1 3 3 4 假設根據(jù)上表數(shù)據(jù)所得線性回歸直線方程為=x+.若某同學根據(jù)上表中的前兩組數(shù)據(jù)(1,0)和(2,2)求得的直線方程為y=b′x+a′,則以下結論正確的是( ) A.>b′,>a′ B.>b′,a′ D.a′.選C. 解法二:根據(jù)所給數(shù)據(jù)畫出散點圖,如圖所示,可直接判斷:從l2旋轉到l1,斜率變大,縱截距變小,即a′.選C. 一、高考大題 1.(xx全國卷Ⅱ)下圖是某地區(qū)xx年至xx年環(huán)境基礎設施投資額y(單位:億元)的折線圖.為了預測該地區(qū)xx年的環(huán)境基礎設施投資額,建立了y與時間變量t的兩個線性回歸模型.根據(jù)xx年至xx年的數(shù)據(jù)(時間變量t的值依次為1,2,…,17)建立模型①:=-30.4+13.5t;根據(jù)xx年至xx年的數(shù)據(jù)(時間變量t的值依次為1,2,…,7)建立模型②:=99+17.5t. (1)分別利用這兩個模型,求該地區(qū)xx年的環(huán)境基礎設施投資額的預測值; (2)你認為用哪個模型得到的預測值更可靠?并說明理由. 解 (1)利用模型①,該地區(qū)xx年的環(huán)境基礎設施投資額的預測值為 =-30.4+13.519=226.1(億元). 利用模型②,該地區(qū)xx年的環(huán)境基礎設施投資額的預測值為 =99+17.59=256.5(億元). (2)利用模型②得到的預測值更可靠. 理由如下: (ⅰ)從折線圖可以看出,xx年至xx年的數(shù)據(jù)對應的點沒有隨機散布在直線y=-30.4+13.5t上下,這說明利用xx年至xx年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎設施投資額的變化趨勢.xx年相對xx年的環(huán)境基礎設施投資額有明顯增加,xx年至xx年的數(shù)據(jù)對應的點位于一條直線的附近,這說明從xx年開始環(huán)境基礎設施投資額的變化規(guī)律呈線性增長趨勢,利用xx年至xx年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述xx年以后的環(huán)境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠. (ⅱ)從計算結果看,相對于xx年的環(huán)境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠. 2.(xx全國卷Ⅲ)某工廠為提高生產(chǎn)效率,開展技術創(chuàng)新活動,提出了完成某項生產(chǎn)任務的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務的工作時間(單位:min)繪制了如下莖葉圖: (1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由; (2)求40名工人完成生產(chǎn)任務所需時間的中位數(shù)m,并將完成生產(chǎn)任務所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表: 超過m 不超過m 第一種生產(chǎn)方式 第二種生產(chǎn)方式 (3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異? 附:K2=, P(K2≥k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解 (1)第二種生產(chǎn)方式的效率更高.理由如下: (ⅰ)由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時間至少80分鐘,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時間至多79分鐘.因此第二種生產(chǎn)方式的效率更高. (ⅱ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為85.5分鐘,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為73.5分鐘.因此第二種生產(chǎn)方式的效率更高. (ⅲ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間高于80分鐘;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間低于80分鐘,因此第二種生產(chǎn)方式的效率更高. (ⅳ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖8上的最多,關于莖8大致呈對稱分布;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖7上的最多,關于莖7大致呈對稱分布,又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布的區(qū)間相同,故可以認為用第二種生產(chǎn)方式完成生產(chǎn)任務所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務所需的時間更少,因此第二種生產(chǎn)方式的效率更高. (以上給出了4種理由,考生答出其中任意一種或其他合理理由均可得分.) (2)由莖葉圖知m==80.列聯(lián)表如下: 超過m 不超過m 第一種生產(chǎn)方式 15 5 第二種生產(chǎn)方式 5 15 (3)由于K2的觀測值k==10>6.635,所以有99%的把握認為兩種生產(chǎn)方式的效率有差異. 3.(xx全國卷Ⅱ)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下: (1)設兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg,新養(yǎng)殖法的箱產(chǎn)量不低于50 kg”,估計A的概率; (2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關; 箱產(chǎn)量<50 kg 箱產(chǎn)量≥50 kg 舊養(yǎng)殖法 新養(yǎng)殖法 (3)根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01). P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 , K2=. 解 (1)記B表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,C表示事件“新養(yǎng)殖法的箱產(chǎn)量不低于50 kg”. 由題意知P(A)=P(BC)=P(B)P(C). 舊養(yǎng)殖法的箱產(chǎn)量低于50 kg的頻率為 (0.012+0.014+0.024+0.034+0.040)5=0.62, 故P(B)的估計值為0.62. 新養(yǎng)殖法的箱產(chǎn)量不低于50 kg的頻率為 (0.068+0.046+0.010+0.008)5=0.66, 故P(C)的估計值為0.66. 因此,事件A的概率的估計值為0.620.66=0.4092. (2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表 箱產(chǎn)量<50 kg 箱產(chǎn)量≥50 kg 舊養(yǎng)殖法 62 38 新養(yǎng)殖法 34 66 K2=≈15.705. 由于15.705>6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關. (3)因為新養(yǎng)殖法的箱產(chǎn)量頻率分布直方圖中,箱產(chǎn)量低于50 kg的直方圖面積為 (0.004+0.020+0.044)5=0.34<0.5, 箱產(chǎn)量低于55 kg的直方圖面積為 (0.004+0.020+0.044+0.068)5=0.68>0.5, 故新養(yǎng)殖法產(chǎn)量的中位數(shù)的估計值為 50+≈52.35(kg). 二、模擬大題 4.(xx廈門質(zhì)檢一)為了解學生的課外閱讀時間情況,某學校隨機抽取了50人進行統(tǒng)計分析,把這50人每天閱讀的時間(單位:分鐘)繪制成頻數(shù)分布表,如下表所示: 閱讀 時間 [0,20) [20,40) [40,60) [60,80) [80,100) [100,120) 人數(shù) 8 10 12 11 7 2 若把每天閱讀時間在60分鐘以上(含60分鐘)的同學稱為“閱讀達人”,根據(jù)統(tǒng)計結果中男女生閱讀達人的數(shù)據(jù),制作出如圖所示的等高條形圖. (1)根據(jù)抽樣結果估計該校學生的每天平均閱讀時間(同一組數(shù)據(jù)用該區(qū)間的中點值作為代表); (2)根據(jù)已知條件完成下面的22列聯(lián)表,并判斷是否有99%的把握認為“閱讀達人”跟性別有關? 男生 女生 總計 閱讀達人 非閱讀達人 總計 附:參考公式: K2=,其中n=a+b+c+d. 臨界值表: P(K2≥k0) 0.100 0.050 0.010 0.001 k0 2.706 3.841 6.635 10.828 解 (1)該校學生的每天平均閱讀時間為 10+30+50+70+90+110=1.6+6+12+15.4+12.6+4.4 =52(分鐘). (2)由頻數(shù)分布表得“閱讀達人”的人數(shù)是11+7+2=20(人), 根據(jù)等高條形圖得22列聯(lián)表如下: 男生 女生 總計 閱讀達人 6 14 20 非閱讀達人 18 12 30 總計 24 26 50 K2==≈4.327, 由于4.327<6.635,故沒有99%的把握認為“閱讀達人”跟性別有關. 5.(xx湖北第二次聯(lián)考)菜農(nóng)定期使用低害殺蟲農(nóng)藥對蔬菜進行噴灑,以防止害蟲的危害,但蔬菜上市時仍存在少量的殘留農(nóng)藥,食用時需要用清水清洗干凈,下表是用清水x(單位:千克)清洗該蔬菜1千克后,蔬菜上殘留的農(nóng)藥y(單位:微克)的統(tǒng)計表: x 1 2 3 4 5 y 58 54 39 29 10 (1)在右面的坐標系中,描出散點圖,并判斷變量x與y是正相關還是負相關; (2)若用解析式=cx2+d作為蔬菜上農(nóng)藥殘留量與用水量x的回歸方程,令w=x2,計算平均值與,完成以下表格,求出與x的回歸方程(c,d保留兩位有效數(shù)字); w 1 4 9 16 25 y 58 54 39 29 10 wi- yi- (3)對于某種殘留在蔬菜上的農(nóng)藥,當它的殘留量低于20微克時對人體無害,為了放心食用該蔬菜,請估計需要用多少千克的清水清洗一千克蔬菜?(精確到0.1,參考數(shù)據(jù):≈2.236) 附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線=+u的斜率和截距的最小二乘估計分別為=,=-. 解 (1) 變量x與y是負相關. (2)由題中表格易得=11,=38, w 1 4 9 16 25 y 58 54 39 29 10 wi- -10 -7 -2 5 14 yi- 20 16 1 -9 -28 c= =-≈-2.0, d=-c=38--11≈60, ∴=-2.0w+60=-2.0x2+60. (3)當<20時,-2.0x2+60<20,即x>2≈4.5, ∴為了放心食用該蔬菜,估計需要用4.5千克的清水清洗一千克蔬菜.- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 2020 高考 數(shù)學 刷題首秧 第八 概率 統(tǒng)計 考點 測試 56 變量 相關 關系 案例 解析
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.hcyjhs8.com/p-3850216.html