生物統(tǒng)計(jì)學(xué)復(fù)習(xí)課
《生物統(tǒng)計(jì)學(xué)復(fù)習(xí)課》由會員分享,可在線閱讀,更多相關(guān)《生物統(tǒng)計(jì)學(xué)復(fù)習(xí)課(55頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、會計(jì)學(xué)1生物統(tǒng)計(jì)學(xué)復(fù)習(xí)課生物統(tǒng)計(jì)學(xué)復(fù)習(xí)課反映客觀反映客觀現(xiàn)象的數(shù)現(xiàn)象的數(shù)據(jù)據(jù) 總體內(nèi)在的總體內(nèi)在的數(shù)量規(guī)律性數(shù)量規(guī)律性推斷統(tǒng)計(jì)推斷統(tǒng)計(jì) (利用樣本信息和概率(利用樣本信息和概率論對總體的數(shù)量特征進(jìn)論對總體的數(shù)量特征進(jìn)行估計(jì)和檢驗(yàn)等)行估計(jì)和檢驗(yàn)等) 概率論概率論 (包括分布理論、大數(shù)定律(包括分布理論、大數(shù)定律和中心極限定理等)和中心極限定理等) 描述統(tǒng)計(jì)描述統(tǒng)計(jì) (統(tǒng)計(jì)數(shù)據(jù)的搜集、整(統(tǒng)計(jì)數(shù)據(jù)的搜集、整理、顯示和分析等)理、顯示和分析等)總體數(shù)據(jù) 樣本數(shù)據(jù) 描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系 通過某事物的一部分(樣本),來估計(jì)事物的全部(總體)特征JJJJJJJJJJ二、均值和
2、方差二、均值和方差 :第:第i個觀察值或變數(shù)個觀察值或變數(shù) n:觀察值或變數(shù)的個數(shù):觀察值或變數(shù)的個數(shù) :求和符號(:求和符號(sigma)計(jì)算公式:計(jì)算公式:1ixxnix標(biāo)準(zhǔn)差和方差標(biāo)準(zhǔn)差和方差總體方差和總體標(biāo)準(zhǔn)差總體方差和總體標(biāo)準(zhǔn)差22()xn2()xn22()1xxsn2()1xxsn樣本方差和樣本標(biāo)準(zhǔn)差樣本方差和樣本標(biāo)準(zhǔn)差三、概率與概率分布三、概率與概率分布概率分布-幾個概念 概率函數(shù)概率函數(shù)(probability function) 隨機(jī)變量取某一特定值的概率函數(shù)(離散型隨機(jī)變量) 二項(xiàng)分布(對立事件)和泊松分布(出現(xiàn)概率較小,樣本容量大) 概率密度函數(shù)概率密度函數(shù)(probab
3、ility density function) 隨機(jī)變量取某一特定值的密度函數(shù)(連續(xù)型隨機(jī)變量) 概率分布函數(shù)概率分布函數(shù)(probability distribution function) 隨機(jī)變量取值小于或等于某特定值的概率離散型隨機(jī)變量的概率分布概率分布圖概率分布圖概率分布函數(shù)累積函數(shù)密度函數(shù)連續(xù)型隨機(jī)變量的密度函數(shù)及概率分布函數(shù)x=某一特定值時,P=013 若若n n,二項(xiàng)分布連接線表現(xiàn)為一個光滑的曲線。 這一曲線稱之為正態(tài)分布曲線正態(tài)分布曲線或正態(tài)概率曲線正態(tài)概率曲線。其概率密度函數(shù)為:記做:N( , 2)21()21( )2xf xe14標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)u變換變換標(biāo)準(zhǔn)正
4、態(tài)標(biāo)準(zhǔn)正態(tài)分布分布u u服從均數(shù)為服從均數(shù)為0 0、標(biāo)準(zhǔn)差為、標(biāo)準(zhǔn)差為1 1的正態(tài)分布的正態(tài)分布xu16原總體原總體樣本樣本1樣本樣本2樣本樣本n1x2x2x新總體新總體n 統(tǒng)計(jì)量統(tǒng)計(jì)量 如果從容量為N的總體抽樣(放回),若每次抽取容量為n的樣本,那么一共可以得到Nn個樣本。 每個樣本可以計(jì)算一個平均數(shù),如果將這些平均數(shù)集合起來便構(gòu)成一個新總體。 由于每次隨機(jī)抽樣所得的平均數(shù)可能會存在差異,所以由平均數(shù)構(gòu)成的新總體也應(yīng)該有其分布,這種分布稱為平均數(shù)的平均數(shù)的抽樣分布抽樣分布。樣本均值的抽樣分布樣本均值的抽樣分布1、樣本平均數(shù)的期望值、樣本平均數(shù)的期望值 由于不同的樣本可得到不同的樣本均值,因此
5、,考察樣本均值的期望就顯得非常重要。 用 表示樣本均值的期望值, 表示總體均值,可證明在簡單隨機(jī)抽樣中。x()E xXX2. 2.樣本平均數(shù)的標(biāo)準(zhǔn)差樣本平均數(shù)的標(biāo)準(zhǔn)差x稱為標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤。22xxnnt分布分布 當(dāng)總體標(biāo)準(zhǔn)差未知時,且樣本數(shù)小于30時, 以樣本標(biāo)準(zhǔn)差S代替所得到的統(tǒng)計(jì)量 記為t。在計(jì)算時,由于采用S來代替,使得t 變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布() /xxS/xtsn服從自由度為n-1的t分布2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t0時,分布密度函數(shù)取得最大值3、與標(biāo)準(zhǔn)正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平.df越小這種趨勢越明顯.df越大,t分
6、布越趨近于標(biāo)準(zhǔn)正態(tài)分布.當(dāng)n 30時,t分布與標(biāo)準(zhǔn)正態(tài)分布的區(qū)別很?。籲 100時,t分布基本與標(biāo)準(zhǔn)正態(tài)分布相同;n時,t分布與標(biāo)準(zhǔn)正態(tài)分布完全一致正態(tài)分布曲線與t分布曲線的比較t分布的特征分布的特征1、t分布受自由度df=n-1的制約,每一個自由度都有一條t分布密度曲線分布分布 設(shè)從一正態(tài)總體 中隨機(jī)抽取樣本容量為n,m的兩個獨(dú)立樣本,其樣本的方差為 ,則定義 兩者的比值為F :2( ,)N 2212,ss2122sFs服從自由度為n-1,m-1的F分布 F分布特征分布特征1)F分布的平均數(shù)1,F(xiàn)的取值區(qū)間為0,+)2)F分布曲線的形狀僅決定于df1和df2.在df1l或2時,F分布曲線呈嚴(yán)
7、重傾斜的反向J型,當(dāng)df1=3時轉(zhuǎn)為左偏曲線(在平均值的左邊)不同自由度下的F分布曲線四、統(tǒng)計(jì)推斷假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)估計(jì)參數(shù)估計(jì)原理:概率很小的事件在一次抽樣試驗(yàn)中實(shí)際是幾乎不可能發(fā)生的。 =0.05/0.01如何進(jìn)行檢驗(yàn):如何進(jìn)行檢驗(yàn):樣本樣本平均數(shù)平均數(shù)總體總體均數(shù)均數(shù)推斷推斷樣本樣本隨機(jī)抽樣隨機(jī)抽樣總體總體1 1 、提出假設(shè)、提出假設(shè)無效假設(shè)無效假設(shè)/零假設(shè)零假設(shè)/檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)備擇假設(shè)備擇假設(shè)/對應(yīng)假設(shè)對應(yīng)假設(shè)2 2 、 確定顯著水平確定顯著水平0.05顯著水平*極顯著水平*能否定能否定H0的的人為人為規(guī)定的規(guī)定的概率概率標(biāo)準(zhǔn)稱為顯著水平,記作標(biāo)準(zhǔn)稱為顯著水平,記作 。 統(tǒng)計(jì)學(xué)中,
8、一般認(rèn)為概率小于統(tǒng)計(jì)學(xué)中,一般認(rèn)為概率小于0.05或或0.01的事件為的事件為小概率事件小概率事件,所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗(yàn)所以在小概率原理基礎(chǔ)上建立的假設(shè)檢驗(yàn)也常取也常取 =0.05和和 =0.01兩個顯著水平兩個顯著水平 。P1.581)=20.0571=0.1142 根據(jù)研究設(shè)計(jì)的類型和統(tǒng)計(jì)推斷的目的選根據(jù)研究設(shè)計(jì)的類型和統(tǒng)計(jì)推斷的目的選擇使用不同的檢驗(yàn)方法。擇使用不同的檢驗(yàn)方法。本例:服從本例:服從N( x, x2)分布。分布。例:1260 x40624022nx4、作出推斷結(jié)論:是否接受假設(shè)PP30時,可用樣本方差s2來代替 總體方差2 ,仍用u檢驗(yàn)法。3、總體方差2未知
9、,且n30且n230時,用u u檢驗(yàn)法。檢驗(yàn)法。2、兩個總體方差12 和22未知,且兩個樣本都是小樣本,即n130且n230時,用t t檢驗(yàn)法檢驗(yàn)法。所謂方差的同質(zhì)性,就是指各個總體的所謂方差的同質(zhì)性,就是指各個總體的方差是相同的。方差是相同的。方差的同質(zhì)性檢驗(yàn)就是要從各樣本的方方差的同質(zhì)性檢驗(yàn)就是要從各樣本的方差來推斷其總體方差是否相同差來推斷其總體方差是否相同方差的同質(zhì)性檢驗(yàn)五、方差分析t t 檢驗(yàn)可以判斷兩組數(shù)據(jù)平均數(shù)間的差異顯著性檢驗(yàn)可以判斷兩組數(shù)據(jù)平均數(shù)間的差異顯著性對多個處理進(jìn)行平均數(shù)差異顯著性檢驗(yàn)時,采用對多個處理進(jìn)行平均數(shù)差異顯著性檢驗(yàn)時,采用t t檢驗(yàn)檢驗(yàn)法的缺點(diǎn):法的缺點(diǎn):
10、方差:又叫均方,是標(biāo)準(zhǔn)差的平方,是表示變異的量。方差:又叫均方,是標(biāo)準(zhǔn)差的平方,是表示變異的量。確定各種原因在總變異中所占的重要程度。確定各種原因在總變異中所占的重要程度。處理效應(yīng)處理效應(yīng)試驗(yàn)誤差試驗(yàn)誤差相差不大,說明試驗(yàn)處理對指標(biāo)影響不大。相差不大,說明試驗(yàn)處理對指標(biāo)影響不大。相差較大,即處理效應(yīng)比試驗(yàn)誤差大得多,相差較大,即處理效應(yīng)比試驗(yàn)誤差大得多,說明試驗(yàn)處理影響是很大的,不可忽視。說明試驗(yàn)處理影響是很大的,不可忽視。xij = + i +ij (i=1,2,3(i=1,2,3,k,k;j=1,2,3j=1,2,3,n),n) 總體平均數(shù)總體平均數(shù)i 處理效應(yīng)處理效應(yīng)ij 試驗(yàn)誤差試驗(yàn)誤
11、差xij 是在第是在第 i 次處理下的第次處理下的第 j 次觀測值次觀測值 要明確要明確不同處理平均數(shù)兩兩間差異的顯著性不同處理平均數(shù)兩兩間差異的顯著性,每個處理的平均數(shù)都要與其他的處理進(jìn)行比較,每個處理的平均數(shù)都要與其他的處理進(jìn)行比較,這種差異顯著性的檢驗(yàn)就叫這種差異顯著性的檢驗(yàn)就叫多重比較多重比較。即:統(tǒng)計(jì)上把多個平均數(shù)兩兩間的相互比較稱為即:統(tǒng)計(jì)上把多個平均數(shù)兩兩間的相互比較稱為多重比較。多重比較。概念概念五、多重比較五、多重比較不同離子不同離子對木聚糖對木聚糖酶活性酶活性的影響的影響(mg/ml)(mg/ml)0.000.250.500.751.001.250.000.060.120.
12、180.240.300.000.401.201.602.000.000.400.600.801.001.20Na+K+ Cu2+ Mn2+水平水平實(shí)驗(yàn)指標(biāo)實(shí)驗(yàn)指標(biāo)因素因素*對對多因素試驗(yàn)多因素試驗(yàn)而言,而言,處理就是指水平與水平的組合處理就是指水平與水平的組合定義定義:是指對:是指對試驗(yàn)指標(biāo)試驗(yàn)指標(biāo)同時受到兩個試驗(yàn)同時受到兩個試驗(yàn)因素因素作用的試驗(yàn)資料的方差分析。作用的試驗(yàn)資料的方差分析。二因素都是固定因素二因素都是固定因素二因素均為隨機(jī)因素二因素均為隨機(jī)因素固定模型固定模型隨機(jī)模型隨機(jī)模型混合模型混合模型一個因素是固定因素,一個因素是固定因素,一個因素是隨機(jī)因素一個因素是隨機(jī)因素二因素方差分
13、析二因素方差分析三種模型在計(jì)算上類似,但在對待檢驗(yàn)及結(jié)果解釋時有三種模型在計(jì)算上類似,但在對待檢驗(yàn)及結(jié)果解釋時有所不同所不同。主效應(yīng)和互作主效應(yīng)和互作主效應(yīng)主效應(yīng)(main effectmain effect):各試驗(yàn)因素的相對獨(dú)立作用(不同飼料的各試驗(yàn)因素的相對獨(dú)立作用(不同飼料的增重差異,不同品種玉米產(chǎn)量不同)增重差異,不同品種玉米產(chǎn)量不同)互作、交互互作、交互(interactioninteraction):某一因素在另一因素的不同水平上所產(chǎn)生某一因素在另一因素的不同水平上所產(chǎn)生的效應(yīng)不同。的效應(yīng)不同。方差分析的基本假定正態(tài)性正態(tài)性可加性可加性方差同質(zhì)性方差同質(zhì)性二因素方差分析二因素方差
14、分析六、回歸與相關(guān)的概念相相關(guān)關(guān)變變量量因果關(guān)系因果關(guān)系平行關(guān)系平行關(guān)系回歸分析回歸分析(regression analysis)(regression analysis)相關(guān)分析相關(guān)分析(correlation analysis)(correlation analysis)一個變量的變化一個變量的變化受到受到另一另一個變量或幾個變量的個變量或幾個變量的制約制約兩個以上變量之間兩個以上變量之間共同受共同受到到另外因素的另外因素的影響影響(一)、直線回歸的變異來源(x,y)實(shí)際值與估計(jì)值之差,剩余或殘差。估計(jì)值與均值之差,它與回歸系數(shù)的大小有關(guān)。yy yyyy yyy yabxyy因變量因變量
15、y y的平方和,總平方和,的平方和,總平方和,SSSST T或或SSSS總總回歸平方和回歸平方和 U/SSU/SSR R離回歸平方和離回歸平方和 Q/SSQ/SSE E222()()()y yyyyy變異分解兩個變量是否存在線性關(guān)系,采用兩個變量是否存在線性關(guān)系,采用F F檢驗(yàn)法進(jìn)行。檢驗(yàn)法進(jìn)行。也以采用也以采用t t檢驗(yàn)法進(jìn)行(需分別檢驗(yàn)檢驗(yàn)法進(jìn)行(需分別檢驗(yàn)a a、b b值)。值)。若若x x與與y y間間不存在直線關(guān)系不存在直線關(guān)系,則總體回歸系數(shù),則總體回歸系數(shù)=0;=0;若若x x與與y y間間存在直線關(guān)系存在直線關(guān)系,則總體回歸系數(shù),則總體回歸系數(shù)00. . F F值較大時,說明方
16、程的變值較大時,說明方程的變異主要有回歸平方和(異主要有回歸平方和(U U)造成,方程成立。造成,方程成立。t t檢驗(yàn)法檢驗(yàn)法F F檢驗(yàn)法檢驗(yàn)法回歸方差回歸方差離回歸方差離回歸方差= F= F直線回歸的直線回歸的適應(yīng)范圍適應(yīng)范圍一般以自變量的一般以自變量的取值為限取值為限。直線回歸注意問題在自變量范圍內(nèi)求出的估計(jì)值,一般稱為內(nèi)在自變量范圍內(nèi)求出的估計(jì)值,一般稱為內(nèi)插插(interpolation);超過自變量取值范圍所計(jì)算超過自變量取值范圍所計(jì)算出的估計(jì)值,稱為外延出的估計(jì)值,稱為外延(extrapolation)。若無充分理由證明超過自變量取值范圍還是若無充分理由證明超過自變量取值范圍還是直
17、線,應(yīng)該避免外延。直線,應(yīng)該避免外延。yyyxyxxySSUSSbSPSSSPSSSPSSSSSPryyyySSQSSQSSSSUr12決定系數(shù)coefficient of determination反映客觀反映客觀現(xiàn)象的數(shù)現(xiàn)象的數(shù)據(jù)據(jù) 總體內(nèi)在的總體內(nèi)在的數(shù)量規(guī)律性數(shù)量規(guī)律性推斷統(tǒng)計(jì)推斷統(tǒng)計(jì) (利用樣本信息和概率(利用樣本信息和概率論對總體的數(shù)量特征進(jìn)論對總體的數(shù)量特征進(jìn)行估計(jì)和檢驗(yàn)等)行估計(jì)和檢驗(yàn)等) 概率論概率論 (包括分布理論、大數(shù)定律(包括分布理論、大數(shù)定律和中心極限定理等)和中心極限定理等) 描述統(tǒng)計(jì)描述統(tǒng)計(jì) (統(tǒng)計(jì)數(shù)據(jù)的搜集、整(統(tǒng)計(jì)數(shù)據(jù)的搜集、整理、顯示和分析等)理、顯示和分析
18、等)總體數(shù)據(jù) 樣本數(shù)據(jù) 描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系 標(biāo)準(zhǔn)差和方差標(biāo)準(zhǔn)差和方差總體方差和總體標(biāo)準(zhǔn)差總體方差和總體標(biāo)準(zhǔn)差22()xn2()xn22()1xxsn2()1xxsn樣本方差和樣本標(biāo)準(zhǔn)差樣本方差和樣本標(biāo)準(zhǔn)差離散型隨機(jī)變量的概率分布概率分布圖概率分布圖1、樣本平均數(shù)的期望值、樣本平均數(shù)的期望值 由于不同的樣本可得到不同的樣本均值,因此,考察樣本均值的期望就顯得非常重要。 用 表示樣本均值的期望值, 表示總體均值,可證明在簡單隨機(jī)抽樣中。x()E xXX2. 2.樣本平均數(shù)的標(biāo)準(zhǔn)差樣本平均數(shù)的標(biāo)準(zhǔn)差x稱為標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤。22xxnn四、統(tǒng)計(jì)推斷假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)估計(jì)參數(shù)估計(jì)原理:概率很小的事件在一次抽樣試驗(yàn)中實(shí)際是幾乎不可能發(fā)生的。 =0.05/0.01分到兩個組中的數(shù)據(jù),沒有關(guān)系,相互獨(dú)立。將性質(zhì)相同的兩個樣本(供試單位)配偶成對,每一對除隨機(jī)地給予不同處理外,其他試驗(yàn)條件應(yīng)盡量一致,排除實(shí)驗(yàn)單位不一致對實(shí)驗(yàn)結(jié)果的影響。所謂方差的同質(zhì)性,就是指各個總體的所謂方差的同質(zhì)性,就是指各個總體的方差是相同的。方差是相同的。方差的同質(zhì)性檢驗(yàn)就是要從各樣本的方方差的同質(zhì)性檢驗(yàn)就是要從各樣本的方差來推斷其總體方差是否相同差來推斷其總體方差是否相同方差的同質(zhì)性檢驗(yàn)
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年防凍教育安全教育班會全文PPT
- 2025年寒假安全教育班會全文PPT
- 初中2025年冬季防溺水安全教育全文PPT
- 初中臘八節(jié)2024年專題PPT
- 主播直播培訓(xùn)提升人氣的方法正確的直播方式如何留住游客
- XX地區(qū)機(jī)關(guān)工委2024年度年終黨建工作總結(jié)述職匯報(bào)
- 心肺復(fù)蘇培訓(xùn)(心臟驟停的臨床表現(xiàn)與診斷)
- 我的大學(xué)生活介紹
- XX單位2024年終專題組織生活會理論學(xué)習(xí)理論學(xué)習(xí)強(qiáng)黨性凝心聚力建新功
- 2024年XX單位個人述職述廉報(bào)告
- 一文解讀2025中央經(jīng)濟(jì)工作會議精神(使社會信心有效提振經(jīng)濟(jì)明顯回升)
- 2025職業(yè)生涯規(guī)劃報(bào)告自我評估職業(yè)探索目標(biāo)設(shè)定發(fā)展策略
- 2024年度XX縣縣委書記個人述職報(bào)告及2025年工作計(jì)劃
- 寒假計(jì)劃中學(xué)生寒假計(jì)劃安排表(規(guī)劃好寒假的每個階段)
- 中央經(jīng)濟(jì)工作會議九大看點(diǎn)學(xué)思想強(qiáng)黨性重實(shí)踐建新功