《標(biāo)準(zhǔn)偏差計(jì)算》由會(huì)員分享,可在線閱讀,更多相關(guān)《標(biāo)準(zhǔn)偏差計(jì)算(50頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、 平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,用來表明資料中各觀測值相對集中較多的中心位置。平均數(shù)主要包括有: 算術(shù)平均數(shù)(arithmetic mean) 中位數(shù)(median) 眾數(shù)(mode) 幾何平均數(shù)(geometric mean) 調(diào)和平均數(shù)(harmonic mean) 一、算術(shù)平均數(shù) 算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個(gè)數(shù)所得的商,簡稱平均數(shù)或均數(shù),記為。 算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計(jì)算。 (一)直接法 主要用于樣本含量n30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。 設(shè)某一資料包含n個(gè)觀測值: x1、x2、xn, 則樣本平均數(shù)可通過下式計(jì)算: 其中,為總和符號(hào)
2、; 表示從第一個(gè)觀測值x 1累加到第n個(gè)觀測值xn。當(dāng) 在意義上已明確時(shí),可簡寫為x,(3-1)式可改寫為: nxn xxxx ni in 121 ni ix1nxx 【例3.1】 某種公牛站測得10頭成年公牛的體重分別為500、520、535、560、585、600、480、510、505、490(kg),求其平均數(shù)。 由于 x=500+520+535+560+58 +600+480+510+505+49 =5285, n=10 得: 即10頭種公牛平均體重為528.5 kg。 (二)加權(quán)法 對于樣本含量 n30 以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù),計(jì)算公式為:
3、 .5(kg)528105285 nxx ffxfxffff xfxfxfx ki iki iik kk 1121 2211 式中: 第i組的組中值; 第i組的次數(shù); 分組數(shù) 第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占比重大小的數(shù)量,因此將fi 稱為是xi的“權(quán)”,加權(quán)法也由此而得名。 【例3.2】 將100頭長白母豬的仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。ixifk 表31 100頭長白母豬仔豬一月窩重次數(shù)分布表 利用(32)式得: 即這100頭長白母豬仔豬一月齡平均窩重為45.2kg。 計(jì)算若干個(gè)來自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,
4、也應(yīng)采用加權(quán)法計(jì)算。 )(2.451004520 kgffxx 【例3.3】 某牛群有黑白花奶牛 1500頭,其平均體重為750 kg ,而另一牛群有黑白花奶牛1200頭,平均體重為725 kg,如果將這兩個(gè)牛群混合在一起,其混合后平均體重為多少? 此例兩個(gè)牛群所包含的牛的頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后的平均體重,應(yīng)以兩個(gè)牛群牛的頭數(shù)為權(quán),求兩個(gè)牛群平均體重的加權(quán)平均數(shù),即 即兩個(gè)牛群混合后平均體重為738.89 kg。 (三)平均數(shù)的基本性質(zhì) 1、樣本各觀測值與平均數(shù)之差的和為零,即離均差之和等于零。 或簡寫成)(89.7382700 12007251500750 kgffxx 0)( 1
5、xxni i 0)( xx 2、樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。 (xi- )2 (xi- a)2 (常數(shù)a ) 或簡寫為: 幾何平均數(shù)調(diào)和平均數(shù) 上述五種平均數(shù),最常用的是算術(shù)平均數(shù)。 一、標(biāo)準(zhǔn)差的意義 用平均數(shù)作為樣本的代表,其代表性的強(qiáng)弱受樣本資料中各觀測值變異程度的影響。僅用平均數(shù)對一個(gè)資料的特征作統(tǒng)計(jì)描述是不全面的,還需引入一個(gè)表示資料中觀測值變異程度大小的統(tǒng)計(jì)量。 全距(極差)是表示資料中各觀測值變異程度大小最簡便的統(tǒng)計(jì)量。但是全距只利用了資料中的最大值和最小值,并不能準(zhǔn)確表達(dá)資料中各觀測值的變異程度,比較粗略。當(dāng)資料很多而又要迅速對資料的變異程度作出
6、判斷時(shí),可以利用全距這個(gè)統(tǒng)計(jì)量。 為 了 準(zhǔn) 確 地 表示樣本內(nèi)各個(gè)觀測值的變異程度 ,人們 首 先會(huì)考慮到以平均數(shù)為標(biāo)準(zhǔn),求出各個(gè)觀測值與平均數(shù)的離差,( ) ,稱為離均差。 雖然離均差能表示一個(gè)觀測值偏離平均數(shù)的性質(zhì)和程度,但因?yàn)殡x均差有正、有負(fù) ,離均差之和 為零,即( ) = 0 ,因 而 不 能 用離均差之和( )來 表 示 資料中所有觀測值的總偏離程度。 xx xx xx 為了解決離均差有正 、有負(fù),離均差之和為零的問 題 , 可先求 離 均 差的絕 對 值 并 將 各 離 均 差 絕對 值 之 和 除以 觀 測 值 個(gè) 數(shù) n 求 得 平 均 絕 對 離差,即| |/n。雖然平均
7、絕對離差可以表示資料中各觀測值的變異程度 ,但由于平均絕對離差包含絕對值符號(hào) ,使用很不方便,在統(tǒng)計(jì)學(xué)中未被采用。xx 我們還可以采用將離均差平方的辦法來解決離均差有正、有負(fù),離均差之和為零的問題。 先將各 個(gè)離 均差平方,即 ( )2 ,再求 離均差平方和 , 即 ,簡稱平方和,記為SS; 由 于 離差平方和 常 隨 樣 本 大 小 而 改 變 ,為 了 消 除 樣 本大小 的 影 響 , 用平方和 除 以 樣 本 大 小, 即 ,求出離均差平方和的平均數(shù) ;xx2)( xx nxx /)( 2 為了使所得的統(tǒng)計(jì)量是相應(yīng)總體參數(shù)的無 偏估計(jì)量,統(tǒng)計(jì)學(xué)證明,在求離均差平方和的平均數(shù)時(shí),分母不用
8、樣本含量n,而用自由度 n-1, 于是,我們 采 用統(tǒng)計(jì)量 表示資料的變異程度。 統(tǒng)計(jì)量 稱 為 均 方 ( mean square縮寫為MS),又稱樣本方差,記為S 2,即 S2= 1/)( 2 nxx 1/)( 2 nxx 1/)( 2 nxx 相應(yīng)的總體參數(shù)叫 總體方差 ,記為2。對于有限總體而言,2的計(jì)算公式為: Nxx /)( 22 由于 樣本方差 帶有原觀測單位的 平方單位,在僅表示一個(gè)資料中各觀測值的變異程度而不作其它分析時(shí) , 常需要與平均數(shù)配合使用 ,這 時(shí)應(yīng) 將平方單位還原,即應(yīng)求出樣本方差的平方根。統(tǒng)計(jì)學(xué)上把樣本方差 S2 的平方根叫做樣本標(biāo)準(zhǔn) 差,記為S,即: 1 )(
9、 2 n xxS 由于 所以上式可改寫為: )2()( 222 xxxxxx 22 2 xnxxx 222 )()(2 nxnnxx nxx 2 2 )( 1 2)(2 nxS nx 相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為。對于有限總體而言,的計(jì)算公式為: 在統(tǒng)計(jì)學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計(jì)總體標(biāo)準(zhǔn)差。 Nx /)( 2 二、標(biāo)準(zhǔn)差的計(jì)算方法 (一)直接法 對于未分組或小樣本資料 , 可直接利用(311)或(3-12)式來計(jì)算標(biāo)準(zhǔn)差。 【例3.9】 計(jì)算10只遼寧絨山羊產(chǎn)絨量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的標(biāo)準(zhǔn)差。 此例
10、n=10,經(jīng)計(jì)算得:x=5400,x2=2955000,代入(312)式得: 即10只遼寧絨山羊產(chǎn)絨量的 標(biāo)準(zhǔn)差 為65.828g。828.65110 10/540029550001 /)( 222 n nxxS (二)加權(quán)法 對于已制成次數(shù)分布表的大樣本資料,可利用次數(shù)分布表,采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差。計(jì)算公式為: 式中,f為各組次數(shù);x為各組的組中值;f = n為總次數(shù)。 1 /)(1)( 222 f ffxfxf xxfS 【例3.10】 利用某純系蛋雞200枚蛋重資料的次數(shù)分布表(見表3-4)計(jì)算標(biāo)準(zhǔn)差。 將表3-4中的f、fx、 代入(314)式得: 即某 純 系 蛋 雞200枚 蛋 重
11、的標(biāo)準(zhǔn)差為3.5524g。5524.31200 200/1.1070511.5755071 /)( 222 f ffxfxS 2fx 表34 某純系蛋雞200枚蛋重資料次數(shù)分布 及標(biāo)準(zhǔn)差計(jì)算表 三、標(biāo)準(zhǔn)差的特性 (一)標(biāo)準(zhǔn)差的大小,受資料中每個(gè)觀測值的影響,如觀測值間變異大,求得的標(biāo)準(zhǔn)差也大,反之則小。 (二)在計(jì)算標(biāo)準(zhǔn)差時(shí),在各觀測值加上或減去一個(gè)常數(shù),其數(shù)值不變。 (三)當(dāng)每個(gè)觀測值乘以或除以一個(gè)常數(shù)a,則所得的標(biāo)準(zhǔn)差是原來標(biāo)準(zhǔn)差的a倍或1/a倍。 (四)在資料服從正態(tài)分布的條件下,資料中約有68.26%的觀測值在平均數(shù)左右一倍標(biāo)準(zhǔn)差( S)范圍內(nèi);約有95.43%的觀測值在平均數(shù)左右兩倍
12、標(biāo)準(zhǔn)差( 2S)范圍內(nèi);約有99.73%的觀測值在平均數(shù)左右三倍標(biāo)準(zhǔn)差( 3S) 范 圍內(nèi)。也就是說全距近似地等于6倍標(biāo)準(zhǔn)差,可用(全距/6)來粗略估計(jì)標(biāo)準(zhǔn)差。 x xx 變異系數(shù)是衡量資料中各觀測值變異 程度的另一個(gè)統(tǒng)計(jì)量 。 標(biāo) 準(zhǔn)差與平均數(shù)的比值稱為 變異系數(shù),記為CV。 變異系數(shù)可以消除單位 和 (或)平 均數(shù)不同對兩個(gè)或多個(gè)資料變異程度比較的影響。 變異系數(shù)的計(jì)算公式為: 【例3.11】 已知某良種豬場長白成年母豬平均體重為 190kg, 標(biāo)準(zhǔn)差為10.5kg,而大約克成年母豬平均體重為196kg,標(biāo)準(zhǔn)差為8.5kg,試問兩個(gè)品種的成年母豬,那一個(gè)體重變異程度大。 %100 xSVC 由于,長白成年母豬體重的變異系數(shù): 大約克成年母豬體重的變異系數(shù): 所以,長白成年母豬體重的變異程度大于大約克成年母豬。 %53.5%1001905.10 VC %34.4%1001965.8 VC 注意,變異系數(shù)的大小,同時(shí)受平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)統(tǒng)計(jì)量的影響,因而在利用變異系數(shù)表示資料的變異程度時(shí),最好將平均數(shù)和標(biāo)準(zhǔn)差也列出。