秋霞电影网午夜鲁丝片无码,真人h视频免费观看视频,囯产av无码片毛片一级,免费夜色私人影院在线观看,亚洲美女综合香蕉片,亚洲aⅴ天堂av在线电影猫咪,日韩三级片网址入口

多重線性回歸與多元逐步回歸-統(tǒng)計(jì)學(xué)

上傳人:仙*** 文檔編號(hào):253242553 上傳時(shí)間:2024-12-09 格式:PPT 頁數(shù):90 大小:982.50KB
收藏 版權(quán)申訴 舉報(bào) 下載
多重線性回歸與多元逐步回歸-統(tǒng)計(jì)學(xué)_第1頁
第1頁 / 共90頁
多重線性回歸與多元逐步回歸-統(tǒng)計(jì)學(xué)_第2頁
第2頁 / 共90頁
多重線性回歸與多元逐步回歸-統(tǒng)計(jì)學(xué)_第3頁
第3頁 / 共90頁

下載文檔到電腦,查找使用更方便

10 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《多重線性回歸與多元逐步回歸-統(tǒng)計(jì)學(xué)》由會(huì)員分享,可在線閱讀,更多相關(guān)《多重線性回歸與多元逐步回歸-統(tǒng)計(jì)學(xué)(90頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級(jí),,第三級(jí),,第四級(jí),,第五級(jí),,,,*,多重線性回歸,流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系,內(nèi) 容,多重線性回歸,,回歸分析中自變量的選擇,,多因素線性回歸的應(yīng)用及注意事項(xiàng),,,復(fù) 習(xí),線性回歸分析是研究,一個(gè)變量,和,另外一些變量,間,線性關(guān)系,的統(tǒng)計(jì)分析方法。,在回歸分析中,最簡(jiǎn)單的情形是模型中只包含兩個(gè)有,“,依存關(guān)系,”,的變量,,一個(gè)變量,(反應(yīng)變量)隨,另一個(gè)變量,(自變量)的變化而變化,且呈直線變化趨勢(shì),稱之為,簡(jiǎn)單線性回歸。,,給定,X,的數(shù)值,,,Y,,的數(shù)值取在一個(gè)平均值,,(,?,y|x,),附近,,對(duì)應(yīng)于不同的,X,值,,

2、,Y,,的,平均值座落在一條直線上,,,----,回歸直線,.,,,?,y|x,,和,X,的關(guān)系可用一個(gè)線性方程描寫,.,簡(jiǎn)單線性回歸方程,總體,,,,樣本,,,,“,Y hat,”,表示估計(jì)值,給定,x,時(shí),y,的,總體均數(shù),的,估計(jì)值,。,直線回歸方程的求解:最小二乘原理,Y,X,,,,,,,,,,,,,,,,,,,,,,,,,,,,回歸系數(shù)及其計(jì)算,找一條直線使殘差平方和最小,,,,,,利用微積分知識(shí),,,容易得到,,,,,,,這條線一定過兩個(gè)點(diǎn),和,線性回歸分析的前提條件,線性,(,L,inear),,反應(yīng)變量,Y,與自變量,X,呈線性變化趨勢(shì),,獨(dú)立,(,I,ndependent),

3、,任意兩個(gè)觀察值相互獨(dú)立,一個(gè)個(gè)體的取值不受其他個(gè)體的影響,,給定,X,時(shí),,Y,正態(tài)分布,(,N,ormal),,給定,X,取值時(shí),,Y,的取值服從正態(tài)分布,,等方差,(,E,qual variance),,指對(duì)應(yīng)于不同的,X,值,,Y,值的總體變異相同,直線回歸應(yīng)用條件,LINE,示意圖,,,,,,回歸方程有統(tǒng)計(jì)學(xué)意義嗎,,建立樣本直線回歸方程,只是完成了統(tǒng)計(jì)分析中兩變量關(guān)系的統(tǒng)計(jì)描述,這種關(guān)系是否有統(tǒng)計(jì)學(xué)意義,還需要進(jìn)一步進(jìn)行假設(shè)檢驗(yàn)。,,檢驗(yàn)回歸模型是否成立:方差分析,,檢驗(yàn)總體回歸系數(shù),β,是否為零:,t,檢驗(yàn),例,1:,,某研究者研究大氣污染物一氧化氮(,NO,)的濃度(,ppm,

4、)與汽車流量(千輛)、氣溫(℃)、空氣濕度(,%,)、風(fēng)速(,m/s,)等因素的關(guān)系,結(jié)果見表,1,:,單位時(shí)間內(nèi)過往的汽車數(shù)(千輛)、氣溫(℃)、空氣濕度(,%,)、風(fēng)速(,m/s,)這四個(gè)因素是否都對(duì)空氣中一氧化氮(,NO,)的濃度(,ppm,)有影響?,,如何定量地描述這些因素對(duì)一氧化氮濃度的影響?,,哪個(gè)因素對(duì)一氧化氮濃度的影響最大?哪個(gè)因素的影響最???,,如果利用這些影響因素去預(yù)測(cè)空氣中一氧化氮的濃度,如何預(yù)測(cè)?效果如何?,第一節(jié) 多重線性回歸,多重,線性回歸,(,multiple,linear regression),,因變量,:,一個(gè),,,Y,,自變量,:,多個(gè),,,X,1,,

5、X,2,,X,3,,…,,,Xp,,方程:,,,概 念,多元,線性回歸,(,multi- variate,linear regression),,簡(jiǎn)稱,多元,回歸,(,multi- variate,regression):,,因變量,:,多個(gè),,,Y,1,,,Y,2 ,,…,,自變量,:,多個(gè),, X1, X2, X3,,…,方程:,,多重線性回歸方程,多重線性回歸方程是簡(jiǎn)單線性回歸方程的擴(kuò)展,,,其中 表示當(dāng)所有,自變量為,0,時(shí)反應(yīng)變量,Y,的總體平均值,。 為變量,X,i,,,的,總體偏回歸系數(shù),(,partial regression coefficient,),,表示當(dāng)方程

6、中其他自變量保持常量時(shí),自變量,Xi,每增加(或減少)一個(gè)計(jì)量單位,,,反應(yīng)變量,Y,平均變化 個(gè)單位。,,,,樣本回歸方程,,,,反應(yīng)變量,Y,的總體平均值,的估計(jì)值。,b,0,的估計(jì)。,為常數(shù)項(xiàng),又稱為截距,是總體參數(shù),b,i,為自變量,X,i,,的偏回歸系數(shù),,,是總體參數(shù) 的,估計(jì)值。,,如果要建立由車流量( )和風(fēng)速( )預(yù)測(cè)一氧化氮濃度(,Y,)的線性回歸方程,模型可以寫成:,,,,,表示在車流量不變的情況下,風(fēng)速每增加一個(gè)單位(,1m/s,),,,估計(jì)空氣中一氧化氮的濃度平均改變,個(gè)單位(,ppm,)。,表,13-1,,多重線性回歸分析數(shù)據(jù)格式,,前提條件(,LINE,

7、),多重線性,回歸分析步驟,求回歸方程,-----,最小二乘原則,,假設(shè)檢驗(yàn),-----,檢驗(yàn)回歸方程是否具有統(tǒng)計(jì)學(xué)意義,模型有意義的前提下,再分別對(duì),各偏回歸系數(shù),進(jìn)行假設(shè)檢驗(yàn),。,,(3),變量選擇,-----,以盡量少的自變量,,,達(dá)到較好地解釋,Y,的目的,,,基本原理,:,,尋找一套適宜的偏回歸系數(shù)( ),建立多重線性回歸方程,使得反應(yīng)變量的觀測(cè)值 與回歸方程的估計(jì)值,回歸系數(shù)的估計(jì),求回歸方程,采用,最小二乘法,,(least squared method),來估計(jì)偏回歸系數(shù),,之間的殘差平方和最小。,SPSS,實(shí)現(xiàn)方法:,Analyze--

8、-Regression---Linear---,,y,選入,Dependent,,x,1,、,x,2,、,X,3,...X,P,選入,Independent,,Method---,Enter,,Stepwise,,,Backward,,,,Forward,---ok,,當(dāng)建立樣本回歸方程后,首先要考察這個(gè)回歸方程是否有意義?即在, , , , 中,,,是否至少存在一個(gè)自變量與,Y,的總體均數(shù)呈線性關(guān)系?,,回歸方程的效果如何?也即是這四個(gè)自變量能夠解釋反應(yīng)變量的變異的百分比是多少?,,四個(gè)自變量是否都對(duì)反應(yīng)變量有影響?即各個(gè)偏回歸系數(shù)( )所對(duì)應(yīng)的總體偏回歸系數(shù)(

9、 )是否等于,0,?,考慮:,,,,,,,,回歸的目的,:,估計(jì),,H,0,成立時(shí),,,只能用,Y,的均數(shù) 來估計(jì),,殘差,: ,,自由度,=,,H,1,成立時(shí),,,給定 可以用 來估計(jì),,殘差,:,,,自由度,=,,,殘差減少了,,統(tǒng)計(jì)推斷,這個(gè)回歸方程有統(tǒng)計(jì)學(xué)意義嗎,?,,,,,,,,,,,,,----,這是回歸模型的貢獻(xiàn),,,自由度,=,,,方差分析的基本思想,總變異,:把反應(yīng)變量的觀察值的離均差平方和記為 ,它反映了沒有利用自變量的信息時(shí)的觀察值的變異性,即沒有考慮車流量、氣溫、氣濕和風(fēng)速等因素的情況下一氧化氮濃度的變異的

10、大小,其自由度記為,(,n,為樣本量)。,,根據(jù)回歸方程計(jì)算得到的預(yù)測(cè)值 與實(shí)際觀察值,,之間的差異稱為殘差,記殘差的離均差平方和為,,,它反映了的變異中不能由回歸解釋的部分,其自由度記為,,,,,P,為自變量個(gè)數(shù)。,,,,把 與 之差記為回歸平方和 ,它反應(yīng)了回歸模型的貢獻(xiàn),即車流量、氣溫、氣濕和風(fēng)速等因素對(duì)一氧化氮濃度的影響,,,其自由度記為 。,,,,,,,,,表,13-2,方差分析表,,表,13-3,,檢驗(yàn)回歸方程整體意義的方差分析表,,,,,,變異來源,自由度,,,,,回歸,4,0.064,0.016,17.59,<.001,殘差,19,0.017,0.

11、001,,,總,23,0.081,,,,,表中,值小于,0.001,,按照,0.05,的檢驗(yàn)水準(zhǔn),可以拒絕,認(rèn)為所建立的回歸方程是有意義的。用這四個(gè)自變量構(gòu),,成的回歸方程解釋空氣中一氧化氮濃度的變化是有意義的。,回歸模型好壞的評(píng)價(jià),1)擬合的回歸方程在總體上有統(tǒng)計(jì)學(xué)意義,,2) 決定系數(shù)R,2,,R,2,=1-SS殘/SS總= SS模/SS總,,,,它表示在因變量y的總變異中可由回歸方程所解釋部分的比例。,,0

12、

13、%的變異,可以,,認(rèn)為回歸的效果較好,。,復(fù)相關(guān)系數(shù),,(coefficient of multiple correlation),又稱多重相關(guān)系數(shù),,,,,回歸系數(shù)的假設(shè)檢驗(yàn),,由于存在抽樣誤差,即使總體偏回歸系數(shù)為零,也可能得到樣本偏回歸系數(shù)不為零的情形,因此需要對(duì)偏回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn),以推斷總體偏回歸系數(shù)是否為零,。,,,,檢驗(yàn)統(tǒng)計(jì)量為,,其中, 是第 個(gè)偏回歸系數(shù)的標(biāo)準(zhǔn)誤,,車流量、氣溫、風(fēng)速對(duì)一氧化氮濃度的影響有統(tǒng)計(jì)學(xué)意義( ),,但是氣濕的影響沒有統(tǒng)計(jì)學(xué)意義( )。,)。,,,標(biāo)準(zhǔn)偏回歸系數(shù),Standardized partial regression

14、coefficient,所有變量標(biāo)準(zhǔn)化后做回歸,,,所得系數(shù)稱為標(biāo)準(zhǔn)偏回歸系數(shù),.,,注意:,,,一般回歸系數(shù),有單位,用來解釋各自變量對(duì)應(yīng)變量的影響,表示在其它自變量保持不變時(shí), 增加或減少一個(gè)單位時(shí),Y,的平均變化量。 不能用各 來比較各 對(duì) 的影響大小。,,,標(biāo)準(zhǔn)化回歸系數(shù),無單位,用來比較各自變量對(duì)應(yīng)變量的影響大小, 越大, 對(duì) 的影響越大。,第二節(jié) 回歸分析中變量的選擇,并不是事先考慮的所有的自變量對(duì)反應(yīng)變量的影響都有統(tǒng)計(jì)學(xué)意義。,,在許多研究中,多因素線性回歸分析的目的是建立一個(gè)預(yù)測(cè)效果最優(yōu)的回歸模型,需要對(duì)自變量進(jìn)行篩選:,,將對(duì)反應(yīng)變量沒有影響的自

15、變量從模型中剔除,將對(duì)反應(yīng)變量的作用有意義的自變量納入模型當(dāng)中。,殘差平方和( )縮小或確定系數(shù)( )增大,,,,越小越好!,越大越好!,,然而,,,,只要增加自變量個(gè)數(shù),,,這個(gè)量就會(huì)減小,!?,自變量篩選的統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn),殘差的均方( )縮小或調(diào)整確定系數(shù)( )增大,,,,,自變量篩選的統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn),AIC,統(tǒng)計(jì)量,AIC,值達(dá)到最小,該模型為最佳模型,,AIC,準(zhǔn)則,自變量篩選的統(tǒng)計(jì)學(xué)標(biāo)準(zhǔn),自變量篩選的方法,最優(yōu)子集回歸分析法:,,,p,個(gè)變量有,2,p,-,1,個(gè)方程,,逐步回歸分析:,,向前引入法,(,forward selection,),,向后剔除法,(,

16、backward selection,),,逐步引入-剔除法,(,stepwise selection,),,,(一)最優(yōu)子集回歸法,求出所有自變量可能組合子集的回歸方程的模型(共有,2,p,-,1,個(gè)),按一定準(zhǔn)則選擇最優(yōu)模型,常用的準(zhǔn)則有:,,① 校正決定系數(shù)或殘差的均方(考慮了自變量的個(gè)數(shù)),,②,AIC(Akaike`s Information Criterion),準(zhǔn)則;,AIC,越小越好,,最優(yōu)子集法的局限性,,,如果自變量個(gè)數(shù)為,4,,則所有的回歸有,2,4,-,1,=,15,個(gè);當(dāng)自變量數(shù)個(gè)數(shù)為,10,時(shí),所有可能的回歸為,2,10,-,1,=,1023,個(gè);,……,..,;當(dāng)

17、自變量數(shù)個(gè)數(shù)為,50,時(shí),所有可能的回歸為,2,50,-,1≈10,15,個(gè)。,,,前進(jìn)法(,forward selection,),,后退法(,backward elimination,),,逐步回歸法(,stepwise regression,)。,它們的共同特點(diǎn)是每一步只引入或剔除一個(gè)自變量。決定其取舍則基于對(duì),偏回歸平方和,的,F,檢驗(yàn),它表示在原有回歸方程基礎(chǔ)上引入或剔除某一自變量后所增加或減少的那部分回歸平方和,.,(二)逐步回歸分析,(,1,)前進(jìn)法,,自變量從無到有、從少到多,,將偏回歸平方和最大且能使回歸系數(shù)檢驗(yàn)拒絕者入選為第一個(gè)自變量;規(guī)定一個(gè)界值,,,接著將余下的變量中偏

18、回歸平方和最大并使檢驗(yàn)拒絕者選為第二個(gè)自變量;,……,,如此不斷引入新的自變量,直到再不能拒絕時(shí)為止。,,局限性:只進(jìn)不出,后續(xù)變量的引入可能會(huì)使先進(jìn)入方程的自變量變得不重要。,(,2,)后退法,,先將全部自變量放入方程,然后逐步剔除,,首先對(duì)全部候選變量作總的回歸,每次剔除一個(gè)偏回歸平方和最小而使回歸系數(shù)的檢驗(yàn)不能拒絕者。,,直到再不能剔除時(shí)為止 。,,,,局限性:只出不進(jìn),,自變量高度相關(guān)時(shí),可能得不出正確的結(jié)果;開始時(shí)剔除的變量即使后來變得有顯著性也不能再進(jìn)入方程 。,(,3,)逐步回歸法,,雙向篩選(實(shí)際應(yīng)用最多):,在向前引入的每一步之后都要考慮從已引入方程的變量中剔除相形見絀者,,

19、引入,有意義的變量(前進(jìn)法),,剔除,無意義的變量(后退法),先規(guī)定兩個(gè)閾值,P,引入,和,P,剔除,(,P,引入,<,P,剔除,),,當(dāng)候選變量中最大,P,值≤,P,引入,時(shí),引入相應(yīng)變量;已進(jìn)入方程的變量最小,P,值≥,P,剔除,時(shí),剔除相應(yīng)變量。如此交替進(jìn)行直到無引入和無剔除為止(計(jì)算復(fù)雜),,,,,,多重線性回歸的應(yīng)用,(,1,)定量地建立一個(gè)反應(yīng)變量與多個(gè)解釋變量之間的線性關(guān)系。例如,建立肺活量的大小與身高、體重、年齡和性別之間的線性關(guān)系。,,(,2,)篩選危險(xiǎn)因素。例如,篩選高血壓的危險(xiǎn)因素。,,(,3,)通過較易測(cè)量的變量估計(jì)不易測(cè)量的變量。例如,建立嬰兒體表面積關(guān)于身高、體重、

20、月齡的多因素線性回歸方程,可以通過容易測(cè)量的身高、體重、月齡等變量估計(jì)不易測(cè)量的體表面積。,,(,4,)通過解釋變量預(yù)測(cè)反應(yīng)變量。例如,通過風(fēng)速、汽車流量、氣溫等指標(biāo)預(yù)測(cè)空氣中一氧化氮的濃度。,,(,5,)通過反應(yīng)變量控制解釋變量。例如,在氣溫、風(fēng)速不變的情況下,通過控制汽車流量來實(shí)現(xiàn)空氣中一氧化氮濃度不超過一定的水平。,多重線性回歸的應(yīng)用,多重線性回歸應(yīng)用時(shí)的注意事項(xiàng),,1,.樣本含量,,2,.方程“最優(yōu)”問題,,3,.關(guān)于逐步回歸,,4,.多重共線性,,5.,啞變量設(shè)定,,6.,變量間的交互作用,,7.,殘差分析,多重共線性是指在進(jìn)行多元回歸分析時(shí),自變量間存在較強(qiáng)的線性相關(guān)關(guān)系。共線關(guān)系

21、的存在,可使得,估計(jì)系數(shù)方差,加大,系數(shù)估計(jì)不穩(wěn),結(jié)果分析困難。因此在多因素線性回歸分析時(shí),特別是當(dāng)回歸結(jié)果難以用專業(yè)知識(shí)解釋時(shí),要進(jìn)行,共線性診斷,,找出存在共線性且不重要的那些自變量,剔出方程,另行回歸分析。,,對(duì)于存在共線性的資料,可以利用共線性診斷有選擇的保留自變量以消除共線性;或者采用嶺回歸、主成分回歸等回歸分析方法以避免共線性指標(biāo)對(duì)結(jié)果的影響。剔除某個(gè)造成共線性的自變量,重建回歸方程;合并自變量;采用逐步回歸方法。,,4,.多重共線性,,多重共線性的表現(xiàn)在實(shí)際應(yīng)用中主要表現(xiàn)為:,,(,1,)模型擬合效果很好,但偏回歸系數(shù)幾乎都,無統(tǒng)計(jì)學(xué)意義,;,,(,2,)偏回歸系數(shù)估計(jì)值的,方差

22、,很大;,,(,3,)偏回歸系數(shù)估計(jì)值,不穩(wěn)定,,隨著樣本含量的增減各偏回歸系數(shù)發(fā)生較大變化或當(dāng)一個(gè)自變量被引入或剔除時(shí)其余變量偏回歸系數(shù)有很大變化;,,(,4,)偏回歸系數(shù)估計(jì)值的大小與符號(hào)可能與事先期望的不一致或,與經(jīng)驗(yàn)相悖,,結(jié)果難以解釋,,出現(xiàn)以上表現(xiàn),提示存在多重共線性問題,應(yīng)進(jìn)行多重共線性診斷。,,方差膨脹因子,VIF,(2),容忍度(,tolerance,),,,以每個(gè)自變量作為應(yīng)變量,對(duì)其他自變量進(jìn)行回歸分析時(shí)得到的殘差比例,大小用,1-R,2,來表示,該指標(biāo)越小,則說明該自變量被其余變量預(yù)測(cè)的越精確,共線性可能越嚴(yán)重。如果自變量的容忍度小于,0.1,,則可能存在共線性問題。,

23、5,啞變量的設(shè)定,2,分類,可用一個(gè)(,0,,,1,)變量。如性別,,k,分類,,k-1,個(gè)(,0,,,1,)變量,如血型。,,多重線性回歸分析有時(shí)先將有序變量或無序多分類變量轉(zhuǎn)換成為多個(gè)二分類變量之后,才能將它們引入回歸模型。,,,將有序變量或無序多分類變量轉(zhuǎn)換成為多個(gè)二分類變量的過程常被稱為“啞元化(,dummying,)”,,,得到的多個(gè)二分類變量稱為“啞變量(,dummy variable,)”。,,,一般情況下,若某定性變量有,k,個(gè)水平,就需要引入,k-1,個(gè)二值的啞變量。,,血型是一個(gè)無序多分類變量,它的取,“,值,”,是,A,、,B,、,AB,、,O,四種,,,可以用,3,個(gè)二

24、分類變量來描述。令,,,表,11-5,用二分類啞變量描述血型,,,,,,,,,血型,變量,,,,,,,,1,0,0,,0,1,0,,0,0,1,,0,0,0,,(,1,)無序多分類變量 定量,,數(shù)據(jù)格式,回歸方程,,建立回歸方程,,,b,1,,:,相當(dāng),A,型相對(duì)于,O,型的差別,,b,2,,:相當(dāng),B,型相對(duì)于,O,型的差別,,b,3,,:相當(dāng),AB,型相對(duì)于,O,型的差別,,,,(,2,)等級(jí),,定量。,,,一般是將等級(jí)從弱到強(qiáng)轉(zhuǎn)換為 (或,,)如文化程度分為小學(xué)、中學(xué)、大學(xué)、大學(xué)以上四個(gè)等級(jí)。,,Y,為經(jīng)濟(jì)收入。,,,,解釋:,b(b,1,

25、),反映,X,(,X,1,),增加,1,個(gè)單位,,,增加,b,個(gè)單位(如:,500,元)。 表示中學(xué)文化者較小學(xué)文化者收入多,500,,,,大學(xué)較中學(xué)多,500,,余類推。,b,1,,,b,2,,,b,3,分別反映中學(xué)、大學(xué)、大學(xué)以上相對(duì)于小學(xué)文化程度者經(jīng)濟(jì)收入差別的大小,,也可將,K,個(gè)等級(jí)轉(zhuǎn)換為,K-1,個(gè)(,0,,,1,)變量,,為了檢驗(yàn)兩個(gè)自變量是否具有交互作用,,,,普遍的做法是在方程中加入它們的乘積項(xiàng)。,6.,變量間的交互作用,例,2,,某項(xiàng)研究調(diào)查了,3334,名有心臟疾患的婦女,了解血清高密度脂蛋白膽固醇(,HDL cholesterol,,,mg/dl,)與體質(zhì)指數(shù)(

26、,body mass index, BMI, kg/m2,)的關(guān)系,考慮到是否患糖尿病(,DIABETES,)也是影響,HDL,水平的因素,因此建立了一個(gè)以體質(zhì)指數(shù)、是否患糖尿病為自變量,,HDL,為反應(yīng)變量的線性回歸方程,結(jié)果如表,13-4,所示。,表,13-4,以體質(zhì)指數(shù)、是否患糖尿病為自變量的線性回歸方程,,變量,b,SE,t,P,95%CI,,BMI,-0.391,0.017,-22.531,0.000,-0.426,-0.357,DIABETES,-4.783,0.092,-52.207,0.000,-4.962,-4.603,CONSTANT,67.551,0.363,185.84

27、7,0.000,66.839,68.264,F=2441.323, P<0.001; R,2,=0.594, adjR,2,=0.594, Root MSE=2.02,模型假定HDL的平均水平隨BMI的變化而變化的規(guī)律在糖尿病婦女和非糖尿病組之間,,是相同的,表現(xiàn)為相同的偏回歸系數(shù) -0.391,,,在多重線性回歸模型中引入一個(gè)新的自變量(,DMBMI,),定義為,BMI,和,DIABETES,的乘積,這個(gè)乘積項(xiàng)描述的是兩個(gè)自變量與反應(yīng)變量之間的關(guān)系。由于兩個(gè)自變量已經(jīng)在模型中,乘積項(xiàng)就可以解釋為交互作用。,表,13-5,以體質(zhì)指數(shù)、是否患糖尿病為自變量,包含交互作用項(xiàng)的線性回歸結(jié)果,,Var

28、iable,b,SE,t,P,95%CI,,DIABETES,-11.340,0.965,-11.755,<0.001,-13.231,-9.448,BMI,-0.735,0.053,-13.822,<0.001,-0.839,-0.631,DMBMI,0.278,0.041,6.828,<0.001,0.198,0.358,CONSTANT,75.544,1.225,61.672,<0.001,73.142,77.945,F=1665.379, P=0.000; R,2,=0.600, adjR,2,=0.600, Root MSE=2.01,,,所以,對(duì)于非糖尿病人,有,,,對(duì)于患糖尿病的

29、婦女,有,,,,反映了患糖尿病的婦女,HDL,與,BMI,的關(guān)系,,反映了非糖尿病患者,HDL,與,BMI,的關(guān)系,刻畫了糖尿病組和非糖尿病組的婦女HDL與BMI回歸關(guān)系的差異。,,,7.,殘差分析,,殘差定義為( )。通常使用殘差圖,(residual plot),作為一種直觀有效的非正式檢查方法。繪制殘差與反應(yīng)變量的預(yù)測(cè)值的散點(diǎn)圖考察模型是否滿足線性和方差齊性,.,,,如果散點(diǎn)隨機(jī)地分布在以為中心的、與橫軸平行的的帶狀區(qū)域內(nèi),如圖(,a,)所示,就可以認(rèn)為基本滿足線性和等方差的假定條件。,,圖(,b,)、(,c,)的散點(diǎn)呈現(xiàn)曲線趨勢(shì),提示資料不滿足線性的假定。,,圖(,d,)、(,e

30、,)、(,f,)顯示殘差隨 的變化而變化,提示資料不滿足方差齊的前提條件。,,圖(,g,)、(,h,)顯示殘差不僅隨 的變化而變化,而且散點(diǎn)呈現(xiàn)曲線趨勢(shì),提示資料不滿足線性和方差齊性的前提條件。,,,二、多元相關(guān)分析,(,multiple correlation analysis),,研究兩個(gè)變量之間的關(guān)系時(shí),所求出的相關(guān)系數(shù)為簡(jiǎn)單相關(guān)系數(shù)。當(dāng)存在,3,個(gè)(或以上)變量時(shí),且彼此間有聯(lián)系,就需要作多元相關(guān)分析,。,,,,,,,83,,(,1,)數(shù)據(jù)形式,,,設(shè)研究問題中有,p,個(gè)指標(biāo)變量,x1,、,x2,、,…,、,xp,,,n,個(gè)觀察對(duì)象,其數(shù)據(jù)結(jié)構(gòu)見表,1,。,,表,1,多元偏相關(guān)分

31、析數(shù)據(jù)結(jié)構(gòu),,編號(hào),X1 X2,…,. XP,,1 x11 x21,…,x1p,,2 x12 x22,…,x2p,,3 x13 x23,…,x3p,,,…,,…,,…,,…,,…,,,n x1n x2n,…,xnp,,,,84,(,2,)偏相關(guān)系數(shù),,(,partial correlation coefficient),,,研究兩個(gè)變量之間的關(guān)系時(shí),所求出的相關(guān)系數(shù)為簡(jiǎn)單相關(guān)系數(shù)。當(dāng)存在,3,個(gè)(或以上)變量時(shí),當(dāng)把其中兩個(gè)變量以外的其他變量對(duì)它們的影響都扣除掉(或平衡掉)以后,求得的相關(guān)系數(shù)為,偏相關(guān)系數(shù)。,,,,,,,85,,一般

32、地,,,設(shè)有三個(gè)變量,X1 ,X2,和,X3 ,,扣除,X3,的線性效應(yīng)后,X1,和,X2,的偏相關(guān)系數(shù)記為,r,12,3,,,扣除,X1,的線性效應(yīng)后,X2,和,X3,的偏相關(guān)系數(shù)記為,r,23,1,,,…,,,其絕對(duì)值介于,0,與,1,之間,可正可負(fù)。,,計(jì)算公式為:,,,,,其中分別代表,3,個(gè)變量的下標(biāo)。,,,86,[,例,1],隨機(jī)抽查測(cè)得,9,名少年的身高,,,體重和胸圍值見表,2,。試問身高與胸圍的相互關(guān)系怎樣,?,,,表,2 9,名少年的身高,,,體重和胸圍值,,例號(hào) 體重,X1,胸圍,X2,身高,x3,,,1 14.0 53

33、.5 95.5,,2 13.0 52.0 92.0,,3 12.5 53.5 89.0,,4 53.5 82.0 168.0,,5 11.0 48.0 91.0,,6 11.5 47.0 91.0,,7 12.5 50.0 91.0,,8

34、 55.0 83.0 156.0,,9 51.0 79.0 163.0,,,87,若用簡(jiǎn)單相關(guān):,,r23=0.98293, P=0.0001,,說明身高與胸圍呈高度正相關(guān),身高是隨胸圍增加而增加的。,,88,,身高是隨胸圍增加而增加這一結(jié)果與實(shí)際是,相矛盾的。,,,理論上說,身高與胸圍無關(guān)的。,,造成這一矛盾的主要原因是在考慮胸圍與身高的關(guān)系時(shí),,,忽略了體重這一因素的影響。,,如果需要真正表示這兩個(gè)變量的相關(guān)關(guān)系,,,那么在必須除去其它變量的影響下,,,計(jì)算它們的偏相關(guān)系數(shù)。,89,,如:扣除,X1,計(jì)算,X2,與,X3,之間的偏相關(guān)系數(shù)。,,,,,得到:,r23,1=-0.25559, P=0.5412,,,說明如果沒有體重的影響,,,即假如兩個(gè)人的體重相同,,,則其中身高者,,,相對(duì)較瘦,(,胸圍小,),,身矮者,,,相對(duì)較胖,(,胸圍大,),。,,,P,值說明身高與胸圍的關(guān)系無統(tǒng)計(jì)學(xué)意義, 這與實(shí)際情況相符合,.,,操作過程,:,,,Analyze---correlate---partial---X2,與,X3,選入,variables----X1,選入,controlling----OK,,90,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  sobing.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!