2018-2019學年高中數學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2.docx
《2018-2019學年高中數學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2.docx》由會員分享,可在線閱讀,更多相關《2018-2019學年高中數學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2.docx(19頁珍藏版)》請在裝配圖網上搜索。
1.1 回歸分析的基本思想及其初步應用 學習目標 1.了解回歸分析的必要性及其一般步驟.2.了解隨機誤差的概念.3.會作散點圖,并會求線性回歸方程.4.利用殘差分析來判斷線性回歸模型的擬合效果.5.掌握建立回歸模型的基本步驟,并通過實例進一步學習回歸分析的基本思想及其初步應用. 知識點一 回歸分析的相關概念 思考1 相關關系是確定性關系嗎?函數關系呢? 答案 相關關系是一種非確定性關系,而函數關系是一種確定性關系. 思考2 請問產生隨機誤差的主要原因有哪些? 答案 (1)所選用的模型不恰當;(2)忽略了某些因素的影響;(3)存在測量誤差. 梳理 (1)回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.若兩個變量之間具有線性相關關系,則稱相應的回歸分析為線性回歸分析. (2)線性回歸方程為=x+,且=,=-,其中=i,=i,(,)稱為樣本點的中心,回歸直線一定過樣本點的中心. (3)樣本點散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數y=bx+a來描述它們之間的關系,而是用線性回歸模型y=bx+a+e來表示,其中a和b為模型的未知參數,e稱為隨機誤差,自變量x稱為解釋變量,因變量y稱為預報變量. 預報變量y的值由解釋變量x和隨機誤差e共同確定,即解釋變量x只能解釋部分預報變量y的變化. 知識點二 回歸模型的模擬效果 思考 如何評價回歸模型擬合效果的優(yōu)劣? 答案 計算相關指數R2的值,R2越接近于1,效果就越好. 梳理 殘差 把隨機誤差的估計值i稱為相應于點(xi,yi)的殘差 殘差圖 作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或解釋變量的數值,這樣作出的圖形稱為殘差圖 殘差 圖法 殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高 殘差平方和 殘差平方和為(yi-i)2,殘差平方和越小,模型的擬合效果越好 相關指數R2 R2=1-,R2表示解釋變量對于預報變量變化的貢獻率,R2越接近于1,表示回歸的效果越好 1.回歸方程=x+中的表示當x每增加一個單位時,的變化量.( √ ) 2.R2越大,殘差平方和越小,即模型的擬合效果越好;R2越小,殘差平方和越大,即模型的擬合效果越差.( √ ) 3.散點圖是判斷兩個變量是否有相關關系的工具之一.( √ ) 4.在一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有點(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數據的樣本相關系數為1.( √ ) 5.回歸直線=x+不一定過點(,).( ) 類型一 線性回歸方程的求解 例1 現有某高新技術企業(yè)年研發(fā)費用投入x(百萬元)與企業(yè)年利潤y(百萬元)之間具有線性相關關系,近5年的年科研費用和年利潤具體數據如下表: 年科研費用x(百萬元) 1 2 3 4 5 企業(yè)所獲利潤y(百萬元) 2 3 4 4 7 (1)畫出散點圖; (2)求y對x的線性回歸方程. 考點 回歸分析 題點 建立回歸模型的基本步驟 解 (1)散點圖如下圖所示: (2)由題意可知,==3, ==4, iyi=12+23+34+44+57=71, =12+22+32+42+52=55, 根據公式,可求得==1.1, =4-1.13=0.7, 故所求線性回歸方程為=1.1x+0.7. 引申探究 在例1基礎上,試估計當x=10時,企業(yè)所獲利潤為多少? 解 依上例得=1.1x+0.7, 將x=10代入,得=11.7(百萬元). 故估計企業(yè)所獲利潤為11.7百萬元. 反思與感悟 (1)求線性回歸方程的基本步驟 ①列出散點圖,從直觀上分析數據間是否存在線性相關關系. ②計算:,,,iyi. ③代入公式求出=x+中參數,的值. ④寫出線性回歸方程并對實際問題作出估計. (2)需特別注意的是,只有在散點圖大致呈線性時,求出的回歸方程才有實際意義,否則求出的回歸方程毫無意義. 跟蹤訓練1 假設關于某設備的使用年限x(年)和所支出的維修費用y(萬元)有如下的統(tǒng)計數據: x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0 由此資料可知y對x呈線性相關關系. (1)求線性回歸方程; (2)求使用年限為10年時,該設備的維修費用為多少? 考點 線性回歸方程 題點 求線性回歸方程 解 (1)由上表中的數據可得 =4,=5,=90,iyi=112.3, ∴===1.23, ∴=-=5-1.234=0.08. ∴線性回歸方程為=1.23x+0.08. (2)當x=10時,=1.2310+0.08=12.38. 即使用年限為10年時,該設備的維修費用為12.38萬元. 類型二 回歸模型的效果 例2 某運動員訓練次數與運動員成績之間的數據關系如下: 編號 1 2 3 4 5 6 7 8 次數(x) 30 33 35 37 39 44 46 50 成績(y) 30 34 37 39 42 46 48 51 (1)作出散點圖; (2)求出線性回歸方程; (3)作出殘差圖,并說明模型的擬合效果; (4)計算R2,并說明其含義. 考點 殘差分析與相關指數 題點 殘差及相關指數的應用 解 (1)該運動員訓練次數(x)與成績(y)之間的散點圖如圖所示. (2)可求得=39.25,=40.875,=12656,iyi=13180, ∴==≈1.0415, =-=-0.003875, ∴線性回歸方程為=1.0415x-0.003875. (3)作殘差圖如圖所示, 由圖可知,殘差點比較均勻地分布在水平的帶狀區(qū)域中,說明選用的模型比較合適. (4)R2=1-=0.9855,說明了該運動員成績差異有98.55%是由訓練次數引起的. 反思與感悟 (1)該類題屬于線性回歸問題,解答本題應先通過散點圖來分析兩變量間的關系是否線性相關,然后再利用求回歸方程的公式求解回歸方程,并利用殘差圖或相關指數R2來分析函數模型的擬合效果,在此基礎上,借助回歸方程對實際問題進行分析. (2)刻畫回歸效果的三種方法 ①殘差圖法,殘差點比較均勻地落在水平的帶狀區(qū)域內說明選用的模型比較合適. ②殘差平方和法:殘差平方和(yi-i)2越小,模型的擬合效果越好. ③相關指數法:R2=1-越接近1,表明回歸的效果越好. 跟蹤訓練2 (1)甲、乙、丙、丁4位同學各自對A,B兩變量進行回歸分析,分別得到散點圖與殘差平方和(yi-i)2如下表: 甲 乙 丙 丁 散點圖 殘差平方和 115 106 124 103 則________同學的試驗結果體現擬合A,B兩變量間關系的模型的擬合效果最好. 考點 殘差分析與相關指數 題點 殘差及相關指數的應用 答案 丁 解析 殘差平方和越小,模型的擬合效果越好,因丁對應的殘差平方和最小,故丁所對應的模型擬合效果最好. (2)關于x與y有如下數據: x 2 4 5 6 8 y 30 40 60 50 70 現有兩個線性模型:(1)=6.5x+17.5;(2)=7x+17.試比較哪一個擬合效果更好. 考點 殘差分析與相關指數 題點 殘差及相關指數的應用 解 由(1)可得yi-i與yi-的關系如下表: yi-i -0.5 -3.5 10 -6.5 0.5 yi- -20 -10 10 0 20 ∴(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155, (yi-)2=(-20)2+(-10)2+102+02+202=1000. ∴R=1-=1-=0.845. 由(2)可得yi-i與yi-的關系如下表: yi-i -1 -5 8 -9 -3 yi- -20 -10 10 0 20 ∴(yi-i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180, (yi-)2=(-20)2+(-10)2+102+02+202=1000. ∴R=1-=1-=0.82. 由于R=0.845,R=0.82,0.845>0.82, ∴R>R. ∴(1)的擬合效果好于(2)的擬合效果. 1.設回歸方程為=7-3x,當變量x增加兩個單位時( ) A.y平均增加3個單位 B.y平均減少3個單位 C.y平均增加6個單位 D.y平均減少6個單位 考點 線性回歸分析 題點 回歸直線的概念 答案 D 解析 因為兩個相關變量為負相關關系. 2.已知x與y之間的一組數據: x 0 1 2 3 y 1 3 5 7 則y與x的線性回歸方程=x+必過點( ) A.(2,2) B.(1,2) C.(1.5,0) D.(1.5,4) 考點 線性回歸方程 題點 樣本點中心的性質 答案 D 解析 過樣本點中心. 3.在回歸分析中,相關指數R2的值越大,說明殘差平方和( ) A.越大 B.越小 C.可能大也可能小 D.以上均不正確 考點 殘差分析與相關指數 題點 殘差及相關指數的概念 答案 B 解析 因為R2=1-, 所以當R2越大時,(yi-i)2越小, 即殘差平方和越小,故選B. 4.某學生課外活動興趣小組對兩個相關變量收集到5組數據如表: x 10 20 30 40 50 y 62 ■ 75 81 89 由最小二乘法求得回歸方程為=0.67x+54.9,現發(fā)現表中有一個數據模糊不清,請推斷該點數據的值為________. 考點 線性回歸方程 題點 樣本點中心的性質 答案 68 解析 由題意可得=(10+20+30+40+50)=30, 設要求的數據為t, 則有=(62+t+75+81+89)=, 因為回歸直線=0.67x+54.9過樣本點的中心(,), 所以=0.6730+54.9,解得t=68. 5.已知方程=0.85x-82.71是根據女大學生的身高預報她的體重的回歸方程,其中x的單位是cm,的單位是kg,那么針對某個體(160,53)的殘差是________. 考點 殘差分析與相關指數 題點 殘差及相關指數的運算 答案?。?.29 解析 把x=160代入=0.85x-82.71, 可得=0.85160-82.71=53.29, 所以殘差=y(tǒng)-=53-53.29=-0.29. 回歸分析的步驟 (1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量; (2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系(如是否存在線性關系等); (3)由經驗確定回歸方程的類型(如果呈線性關系,則選用線性回歸方程=x+); (4)按一定規(guī)則估計回歸方程中的參數; (5)得出結果后分析殘差圖是否有異常(個別數據對應的殘差過大,或殘差呈現不隨機的規(guī)律性等),若存在異常,則檢查數據是否有誤或模型是否合適等. 一、選擇題 1.某同學在研究性學習中,收集到某制藥廠今年前5個月甲膠囊生產產量(單位:萬盒)的數據如下表所示: x(月份) 1 2 3 4 5 y(萬盒) 5 5 6 6 8 若x,y線性相關,線性回歸方程為=0.7x+,估計該制藥廠6月份生產甲膠囊產量為( ) A.8.0萬盒 B.8.1萬盒 C.8.9萬盒 D.8.6萬盒 考點 線性回歸方程 題點 樣本點中心的性質 答案 B 解析 回歸直線一定過樣本點的中心.由已知數據可得=3,=6,代入線性回歸方程,可得=-0.7=3.9,即線性回歸方程為=0.7x+3.9.把x=6代入,可近似得=8.1,故選B. 2.如圖所示,由這兩個散點圖可以判斷( ) A.變量x與y正相關,u與v正相關 B.變量x與y正相關,u與v負相關 C.變量x與y負相關,u與v正相關 D.變量x與y負相關,u與v負相關 考點 線性回歸分析 題點 回歸直線的概念 答案 C 解析 圖(1)中的數據隨著x的增大y減小,因此變量x與變量y負相關; 圖(2)中的數據隨著u的增大v增大,因此u與v正相關. 3.已知變量x與y負相關,且由觀測數據求得樣本平均數=3,=3.5,則由該觀測數據求得的線性回歸方程可能是( ) A.=-2x+9.5 B.=2x-2.4 C.=-0.3x-4.4 D.=0.4x+2.3 考點 線性回歸方程 題點 求線性回歸方程 答案 A 解析 因為變量x與y負相關,所以排除B,D,將樣本平均數=3,=3.5代入選項驗證可知,選項A符合題意. 4.對具有線性相關關系的變量x,y,有一組觀測數據(xi,yi)(i=1,2,…,8),其線性回歸方程是=x+,若x1+x2+x3+…+x8=3,y1+y2+y3+…+y8=6,則實數的值是( ) A. B. C. D. 考點 線性回歸方程 題點 樣本點中心的性質 答案 D 解析 由x1+x2+x3+…+x8=3,y1+y2+y3+…+y8=6可知樣本點的中心為,將該點坐標代入回歸方程=x+,得=. 5.若對某地區(qū)人均工資x(萬元)與該地區(qū)人均消費y(萬元)進行調查統(tǒng)計得y與x具有線性相關關系,且線性回歸方程為=0.7x+2.1,若該地區(qū)人均消費水平為10.5,則估計該地區(qū)人均消費額占人均工資收入的百分比約為( ) A.75% B.87.5% C.70% D.10.5% 考點 線性回歸方程 題點 線性回歸方程的應用 答案 B 解析 y=10.5時,由=0.7x+2.1得x==12, 故得100%=87.5%. 6.甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關試驗用回歸分析的方法分別求得相關系數r如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 則這四位同學的試驗結果能體現出A,B兩變量有更強的線性相關性的是( ) A.甲 B.乙 C.丙 D.丁 考點 線性相關系數 題點 線性相關系數的概念及計算 答案 D 解析 由相關系數的意義可知,相關系數的絕對值越接近于1,相關性越強,結合題意可知丁的線性相關性更強,故選D. 7.某化工廠為預測某產品的回收率y,而要研究它和原料有效成分含量之間的相關關系,現取了8對觀測值,計算得i=52,i=228,=478,iyi=1849,則y與x的線性回歸方程是( ) A.=11.47+2.62x B.=-11.47+2.62x C.=2.62+11.47x D.=11.47-2.62x 考點 線性回歸方程 題點 求線性回歸方程 答案 A 解析 由題中數據得=6.5,=28.5, ∴===≈2.62, =-≈28.5-2.626.5=11.47, ∴y與x的線性回歸方程是=2.62x+11.47,故選A. 二、填空題 8.若一個樣本的總偏差平方和為80,殘差平方和為60,則相關指數R2為________. 考點 殘差分析與相關指數 題點 殘差及相關指數的運算 答案 0.25 解析 R2=1-=0.25. 9.已知樣本數據點(xi,yi)(i=1,2,3,…,n)在某一條直線上,則相關系數r的值為________. 考點 線性相關系數 題點 線性相關系數的概念及計算 答案 1 解析 由題意知r=1. 10.關于隨機誤差產生的原因分析正確的有________.(填序號) ①用線性回歸模型來近似真實模型所引起的誤差; ②忽略某些因素的影響所產生的誤差; ③對樣本數據觀測時產生的誤差; ④計算錯誤所產生的誤差. 考點 回歸分析 題點 回歸分析的概念和意義 答案?、佗冖? 解析 理解線性回歸模型y=bx+a+e中隨機誤差e的含義是解決此問題的關鍵,隨機誤差可能由于觀測工具及技術產生,也可能因忽略某些因素而產生,也可以是回歸模型產生,但不是計算錯誤.故隨機誤差產生的原因分析正確的是①②③. 三、解答題 11.已知x,y之間的一組數據如下表: x 0 1 2 3 y 1 3 5 7 (1)分別計算:,,x1y1+x2y2+x3y3+x4y4,x+x+x+x; (2)已知變量x與y線性相關,求出回歸方程. 考點 線性回歸方程 題點 求線性回歸方程 解 (1)==1.5,==4, x1y1+x2y2+x3y3+x4y4=01+13+25+37=34, x+x+x+x=02+12+22+32=14. (2)==2, =-=4-21.5=1, 故=2x+1. 12.某服裝批發(fā)市場1-5月份的服裝銷售量x與利潤y的統(tǒng)計數據如下表: 月份 1 2 3 4 5 銷售量x(萬件) 3 6 4 7 8 利潤y(萬元) 19 34 26 41 46 (1)從這五個月的利潤中任選2個,分別記為m,n,求事件“m,n均不小于30”的概率; (2)已知銷售量x與利潤y大致滿足線性相關關系,請根據前4個月的數據,求出y關于x的線性回歸方程=x+; (3)若由線性回歸方程得到的利潤的估計數據與真實數據的誤差不超過2萬元,則認為得到的利潤的估計數據是理想的.請用表格中第5個月的數據檢驗由(2)中回歸方程所得的第5個月的利潤的估計數據是否理想? 參考公式:=,=-. 考點 線性回歸分析 題點 回歸直線的應用 解 (1)所有的基本事件為(19,34),(19,26),(19,41),(19,46),(34,26),(34,41),(34,46),(26,41),(26,46),(41,46),共10個. 記“m,n均不小于30”為事件A,則事件A包含的基本事件為(34,41),(34,46),(41,46),共3個. 所以P(A)=. (2)由前4個月的數據可得, =5,=30,iyi=652,=110. 所以===5.2, =30-5.25=4, 所以線性回歸方程為=5.2x+4, (3)由題意得,當x=8時, =45.6,|45.6-46|=0.4<2; 所以利用(2)中的回歸方程所得的第5個月的利潤估計數據是理想的. 13.在一段時間內,某種商品的價格x元和需求量y件之間的一組數據為: x 14 16 18 20 22 y 12 10 7 5 3 求出y對x的線性回歸方程,并說明擬合效果的程度. 考點 殘差分析與相關指數 題點 殘差及相關指數的應用 解 =(14+16+18+20+22)=18, =(12+10+7+5+3)=7.4. =142+162+182+202+222=1 660, iyi=1412+1610+187+205+223=620, 可得回歸系數===-1.15, 所以=7.4+1.1518=28.1, 所以線性回歸方程為=-1.15x+28.1. 列出殘差表: yi-i 0 0.3 -0.4 -0.1 0.2 yi- 4.6 2.6 -0.4 -2.4 -4.4 則(yi-i)2=0.3,(yi-)2=53.2. R2=1-≈0.994. 所以回歸模型的擬合效果很好. 四、探究與拓展 14.某公司的廣告費支出x(萬元)與銷售額y(萬元)之間有下表所示的對應數據,由資料顯示y對x呈線性相關關系,根據下表提供的數據得到回歸方程=x+中的=6.5, x 2 4 5 6 8 y 30 40 60 50 70 預測銷售額為115萬元時,約需________萬元廣告費. 考點 線性回歸分析 題點 回歸直線的應用 答案 15 解析 因為=(2+4+5+6+8)=5, =(30+40+60+50+70)=50, 所以50=6.55+,則=17.5, 所以當y=115時,6.5x=115-17.5,得x=15, 即約需廣告費為15萬元. 15.某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此作了四次試驗,得到的數據如下: 零件的個數x(個) 2 3 4 5 加工的時間y(小時) 2.5 3 4 4.5 (1)在給定的坐標系中畫出表中數據的散點圖; (2)求出y關于x的線性回歸方程=x+,并在坐標系中畫出回歸直線; (3)試預測加工10個零件需要多少時間? 考點 線性回歸方程 題點 求線性回歸方程 解 (1)散點圖如圖. (2)由表中數據得iyi=52.5, =3.5,=3.5,=54, 所以===0.7, 所以=-=3.5-0.73.5=1.05. 所以=0.7x+1.05. 回歸直線如圖中所示. (3)將x=10代入線性回歸方程,得=0.710+1.05=8.05, 所以預測加工10個零件需要8.05小時.- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 2018-2019學年高中數學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2 2018 2019 學年 高中數學 統(tǒng)計 案例 1.1 回歸 分析 基本 思想 及其
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.hcyjhs8.com/p-3909016.html