《標(biāo)準(zhǔn)偏差計算ppt課件》由會員分享,可在線閱讀,更多相關(guān)《標(biāo)準(zhǔn)偏差計算ppt課件(50頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第三章 平均數(shù)、標(biāo)準(zhǔn)差與變異系數(shù),第一節(jié) 平均數(shù),1,平均數(shù)是統(tǒng)計學(xué)中最常用的統(tǒng)計量,用來表明資料中各觀測值相對集中較多的中心位置。平均數(shù)主要包括有: 算術(shù)平均數(shù)(arithmetic mean) 中位數(shù)(median) 眾數(shù)(mode) 幾何平均數(shù)(geometric mean) 調(diào)和平均數(shù)(harmonic mean),2,一、算術(shù)平均數(shù) 算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù),記為。 算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計算。 (一)直接法 主要用于樣本含量n30以下、未經(jīng)分組資料平均數(shù)
2、的計算。,3,設(shè)某一資料包含n個觀測值: x1、x2、、xn, 則樣本平均數(shù)可通過下式計算: 其中,為總和符號; 表示從第一個觀測值x1累加到第n個觀測值xn。當(dāng) 在意義上已明確時,可簡寫為x,(3-1)式可改寫為:,,,,4,【例3.1】 某種公牛站測得10頭成年公牛的體重分別為500、520、535、560、585、600、480、510、505、490(kg),求其平均數(shù)。 由于 x=500+520+535+560+58 +600+480+510+505+49
3、=5285, n=10,,,5,得: 即10頭種公牛平均體重為528.5 kg。 (二)加權(quán)法 對于樣本含量 n30 以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計算平均數(shù),計算公式為:,,,6,式中: 第i組的組中值; 第i組的次數(shù); 分組數(shù) 第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占比重大小的數(shù)量,因此將fi 稱為是xi的“權(quán)”,加權(quán)法也由此而得名。 【例3.2】 將100頭長白母豬的仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。,,,,,7,表31 100頭長白母豬仔豬一月窩重次數(shù)分布表,8,利用(32
4、)式得: 即這100頭長白母豬仔豬一月齡平均窩重為45.2kg。 計算若干個來自同一總體的樣本平均數(shù)的平均數(shù)時,如果樣本含量不等,也應(yīng)采用加權(quán)法計算。,,9,【例3.3】 某牛群有黑白花奶牛 1500頭,其平均體重為750 kg ,而另一牛群有黑白花奶牛1200頭,平均體重為725 kg,如果將這兩個牛群混合在一起,其混合后平均體重為多少? 此例兩個牛群所包含的牛的頭數(shù)不等,要計算兩個牛群混合后的平均體重,應(yīng)以兩個牛群牛的頭數(shù)為權(quán),求兩個牛群平均體重的加權(quán)平均數(shù),即,10,即兩個牛群混合后平均體重為738.89 kg。 (三)平均數(shù)的基本性質(zhì) 1、樣本各觀測值與平均數(shù)之差的和
5、為零,即離均差之和等于零。 或簡寫成,,,,11,2、樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。 (xi- )2 < (xi- a)2 (常數(shù)a ) 或簡寫為: < 對于總體而言,通常用表示總體平均數(shù),有限總體的平均數(shù)為:,,,,,,12,式中,N表示總體所包含的個體數(shù)。 當(dāng)一個統(tǒng)計量的數(shù)學(xué)期望等于所估計的總體參數(shù)時,則稱此統(tǒng)計量為該總體參數(shù)的無偏估計量。 統(tǒng)計學(xué)中常用樣本平均數(shù)( )作為總體平均數(shù)()的估計量,并已證明樣本平均數(shù)是總體平均數(shù)的無偏估計量。,,13,二、中位數(shù) 將資料內(nèi)所有觀測值從小到大依次排列,位于中間的
6、那個觀測值,稱為中位數(shù),記為Md。 當(dāng)觀測值的個數(shù)是偶數(shù)時,則以中間兩個觀測值的平均數(shù)作為中位數(shù)。當(dāng)所獲得的數(shù)據(jù)資料呈偏態(tài)分布時,中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。 中位數(shù)的計算方法因資料是否分組而有所不同。,14,(一)未分組資料中位數(shù)的計算方法 對于未分組資料,先將各觀測值由小到大依次排列。,15,1、當(dāng)觀測值個數(shù)n為奇數(shù)時,(n+1)/2位置的觀測值,即x(n+1)/2為中位數(shù): Md= 2、當(dāng)觀測值個數(shù)為 偶 數(shù) 時 , n/2和(n/2+1)位置的兩個觀測值之和的1/2為中位數(shù),即:,,,16,【例3.4】 觀察得9只西農(nóng)莎能奶山羊的妊娠天數(shù)為 144 、 14
7、5、 147、 149、150、151、153、156、157,求其中位數(shù)。 此例 n=9,為奇數(shù),則: Md= =150(天) 即西農(nóng)莎能奶山羊妊娠天數(shù)的中位數(shù)為150天。,,17,【例3.5】 某犬場發(fā)生犬瘟熱,觀察得10只仔犬發(fā)現(xiàn)癥狀到死亡分別為7、8、8、9、11、12、12、13、14、14天,求其中位數(shù)。 此例n=10,為偶數(shù),則: 即10只仔犬從發(fā)現(xiàn)癥狀到死亡天數(shù)的中位數(shù)為11.5天。 (二)已分組資料中位數(shù)的計算方法,,18,若資料已分組,編制成次數(shù)分布表,則可利用次數(shù)分布表來計算中位數(shù),其計算公式為:
8、 式中:L 中位數(shù)所在組的下限; i 組距; f 中位數(shù)所在組的次數(shù); n 總次數(shù); c 小于中數(shù)所在組的累加次數(shù)。,,19,【例3.6】 某奶牛場68頭健康母牛從分娩到第一次發(fā)情間隔時間 整理成次數(shù)分布表如表 32 所示,求中位數(shù)。 表32 68頭母牛從分娩到第一次發(fā)情間隔時間 次數(shù)分布表,20,由表32可見:i=15,n=68,因而中位數(shù)只能在累加頭數(shù)為36所對應(yīng)的“5771”這一組,于是可確定L=57,f=20,c=16,代入公式(35)得:
9、即奶牛頭胎分娩到第一次發(fā)情間隔時間的中位數(shù)為70.5天。,,21,三、幾何平均數(shù) n 個觀測值相乘之積開 n 次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用于畜牧業(yè)、水產(chǎn)業(yè)的生產(chǎn)動態(tài)分析,畜禽疾病及藥物效價的統(tǒng)計分析 。 如畜禽 、水產(chǎn)養(yǎng)殖的 增長率,抗體的滴度,藥物的效價,畜禽疾病的潛伏期等,用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水平。其計算公式如下:,,22,為了計算方便,可將各觀測值取對數(shù)后相加除以n,得lgG,再求lgG的反對數(shù),即得G值,即 【例3.7】 某波爾山羊群19972000年各年度的存欄數(shù)見表33,試求其年平均增長率。,,23,表33
10、 某波爾山羊群各年度存欄數(shù)與增長率,24,利用(37)式求年平均增長率 G= =lg-1(-0.368-0.3980.602) =lg-1(-0.456)=0.3501 即年平均增長率為0.3501或35.01%。,,25,四、眾 數(shù) 資料 中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。 如表2-3 所列 的 50枚受精種蛋出雛天數(shù)次數(shù)分布中,以22出現(xiàn)的次數(shù)最多,則該資料的眾數(shù)為22天。 又如 【例3.6】 所 列 出 的 次數(shù)分布表中,5771這一組次數(shù)最多,其組中值為64天,則該資料的眾數(shù)為64天。,26,五、調(diào)和平均數(shù)
11、資料中各觀測值倒數(shù)的 算術(shù)平均數(shù) 的倒數(shù),稱為調(diào)和平均數(shù),記為H,即 調(diào)和平均數(shù)主要用于反映畜群不同階段的平均增長率或畜群不同規(guī)模的平均規(guī)模。,,27,【例3.8】 某保種牛群不同世代牛群保種的規(guī)模分別為:0世代200頭,1世代220頭,2世代210頭; 3世代190頭,4世代210頭,試求其平均規(guī)模。 利用(39)式求平均規(guī)模: 即保種群平均規(guī)模為208.33頭。,,28,對于同一資料: 算術(shù)平均數(shù)幾何平均數(shù)調(diào)和平均數(shù) 上述五種平均數(shù),最常用的
12、是算術(shù)平均數(shù)。,29,第二節(jié) 標(biāo)準(zhǔn)差,一、標(biāo)準(zhǔn)差的意義 用平均數(shù)作為樣本的代表,其代表性的強弱受樣本資料中各觀測值變異程度的影響。僅用平均數(shù)對一個資料的特征作統(tǒng)計描述是不全面的,還需引入一個表示資料中觀測值變異程度大小的統(tǒng)計量。,30,全距(極差)是表示資料中各觀測值變異程度大小最簡便的統(tǒng)計量。但是全距只利用了資料中的最大值和最小值,并不能準(zhǔn)確表達資料中各觀測值的變異程度,比較粗略。當(dāng)資料很多而又要迅速對資料的變異程度作出判斷時,可以利用全距這個統(tǒng)計量。,31,為 了 準(zhǔn) 確 地 表示樣本內(nèi)各個觀測值的變異程度 ,人們 首 先會考慮到以平均數(shù)為標(biāo)準(zhǔn),求出各個觀測值與平均數(shù)的離差,( )
13、,稱為離均差。 雖然離均差能表示一個觀測值偏離平均數(shù)的性質(zhì)和程度,但因為離均差有正、有負(fù) ,離均差之和 為零,即( ) = 0 ,因 而 不 能 用離均差之和( )來 表 示 資料中所有觀測值的總偏離程度。,,32,為了解決離均差有正 、有負(fù),離均差之和為零的問 題 , 可先求 離 均 差的絕 對 值 并 將 各 離 均 差 絕對 值 之 和 除以 觀 測 值 個 數(shù) n 求 得 平 均 絕 對 離差,即| |/n。雖然平均絕對離差可以表示資料中各觀測值的變異程度 ,但由于平均絕對離差包含絕對值符號 ,使用很不方便,在統(tǒng)計學(xué)中未被采用。,33,我們還可以采用將離均差平方的辦法來解決
14、離均差有正、有負(fù),離均差之和為零的問題。 先將各 個離 均差平方,即 ( )2 ,再求 離均差平方和 , 即 ,簡稱平方和,記為SS; 由 于 離差平方和 常 隨 樣 本 大 小 而 改 變 ,為 了 消 除 樣 本大小 的 影 響 , 用平方和 除 以 樣 本 大 小, 即 ,求出離均差平方和的平均數(shù) ;,,,,34,為了使所得的統(tǒng)計量是相應(yīng)總體參數(shù)的無 偏估計量,統(tǒng)計學(xué)證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量n,而用自由度 n-1, 于是,我們 采 用統(tǒng)計量 表示資料的變異程度。 統(tǒng)計量 稱 為 均 方 ( mean square縮寫為MS)
15、,又稱樣本方差,記為S2,即 S2=,,,,35,相應(yīng)的總體參數(shù)叫 總體方差 ,記為2。對于有限總體而言,2的計算公式為:,36,由于 樣本方差 帶有原觀測單位的 平方單位,在僅表示一個資料中各觀測值的變異程度而不作其它分析時 , 常需要與平均數(shù)配合使用 ,這 時應(yīng) 將平方單位還原,即應(yīng)求出樣本方差的平方根。統(tǒng)計學(xué)上把樣本方差 S2 的平方根叫做樣本標(biāo)準(zhǔn) 差,記為S,即:,,,,37,由于 所以上式可改寫為:,,,,,,38,相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為。對于有限總體而言,的計算公式為: 在統(tǒng)計學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計總體標(biāo)準(zhǔn)差。,,39,二、標(biāo)準(zhǔn)差的計算
16、方法 (一)直接法 對于未分組或小樣本資料 , 可直接利用(311)或(3-12)式來計算標(biāo)準(zhǔn)差。,40,【例3.9】 計算10只遼寧絨山羊產(chǎn)絨量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的標(biāo)準(zhǔn)差。 此例n=10,經(jīng)計算得:x=5400,x2=2955000,代入(312)式得: 即10只遼寧絨山羊產(chǎn)絨量的 標(biāo)準(zhǔn)差 為65.828g。,,41,(二)加權(quán)法 對于已制成次數(shù)分布表的大樣本資料,可利用次數(shù)分布表,采用加權(quán)法計算標(biāo)準(zhǔn)差。計算公式為: 式中,f為各組次數(shù);x為各組的組中
17、值;f = n為總次數(shù)。,,42,【例3.10】 利用某純系蛋雞200枚蛋重資料的次數(shù)分布表(見表3-4)計算標(biāo)準(zhǔn)差。 將表3-4中的f、fx、 代入(314)式得: 即某 純 系 蛋 雞200枚 蛋 重的標(biāo)準(zhǔn)差為3.5524g。,,43,表34 某純系蛋雞200枚蛋重資料次數(shù)分布 及標(biāo)準(zhǔn)差計算表,44,三、標(biāo)準(zhǔn)差的特性 (一)標(biāo)準(zhǔn)差的大小,受資料中每個觀測值的影響,如觀測值間變異大,求得的標(biāo)準(zhǔn)差也大,反之則小。 (二)在計算標(biāo)準(zhǔn)差時,在各觀測值加上或減去一個常數(shù),其數(shù)值不變。 (三)當(dāng)每個觀測值乘以
18、或除以一個常數(shù)a,則所得的標(biāo)準(zhǔn)差是原來標(biāo)準(zhǔn)差的a倍或1/a倍。,45,(四)在資料服從正態(tài)分布的條件下,資料中約有68.26%的觀測值在平均數(shù)左右一倍標(biāo)準(zhǔn)差( S)范圍內(nèi);約有95.43%的觀測值在平均數(shù)左右兩倍標(biāo)準(zhǔn)差( 2S)范圍內(nèi);約有99.73%的觀測值在平均數(shù)左右三倍標(biāo)準(zhǔn)差( 3S) 范 圍內(nèi)。也就是說全距近似地等于6倍標(biāo)準(zhǔn)差,可用(全距/6)來粗略估計標(biāo)準(zhǔn)差。,,46,第三節(jié) 變異系數(shù),變異系數(shù)是衡量資料中各觀測值變異 程度的另一個統(tǒng)計量 。 標(biāo) 準(zhǔn)差與平均數(shù)的比值稱為 變異系數(shù),記為CV。 變異系數(shù)可以消除單位 和 (或)平 均數(shù)不同對兩個或多個資料變異程度比較的影響。,47,變異系數(shù)的計算公式為: 【例3.11】 已知某良種豬場長白成年母豬平均體重為 190kg, 標(biāo)準(zhǔn)差為10.5kg,而大約克成年母豬平均體重為196kg,標(biāo)準(zhǔn)差為8.5kg,試問兩個品種的成年母豬,那一個體重變異程度大。,,48,由于,長白成年母豬體重的變異系數(shù): 大約克成年母豬體重的變異系數(shù): 所以,長白成年母豬體重的變異程度大于大約克成年母豬。,,,49,注意,變異系數(shù)的大小,同時受平均數(shù)和標(biāo)準(zhǔn)差兩個統(tǒng)計量的影響,因而在利用變異系數(shù)表示資料的變異程度時,最好將平均數(shù)和標(biāo)準(zhǔn)差也列出。,50,