抽樣調(diào)查-多階段抽樣培訓課件
《抽樣調(diào)查-多階段抽樣培訓課件》由會員分享,可在線閱讀,更多相關(guān)《抽樣調(diào)查-多階段抽樣培訓課件(47頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、返回8.1 引 言 前面提到的整群抽樣雖然前面提到的整群抽樣雖然有很多優(yōu)點,但是由于群內(nèi)單有很多優(yōu)點,但是由于群內(nèi)單元通常具有相似性(表現(xiàn)為群元通常具有相似性(表現(xiàn)為群內(nèi)相關(guān)系數(shù)大于零)。尤其是內(nèi)相關(guān)系數(shù)大于零)。尤其是當群比較大時,人們自然會想當群比較大時,人們自然會想到?jīng)]有必要對群內(nèi)所有單元都到?jīng)]有必要對群內(nèi)所有單元都進行調(diào)查,而只要對群內(nèi)單元進行調(diào)查,而只要對群內(nèi)單元進行再抽樣,對被抽中的單元進行再抽樣,對被抽中的單元進行調(diào)查,這就是常用的多階進行調(diào)查,這就是常用的多階段抽樣。段抽樣。返回一、多階段抽樣的定義 先在總體單元(初級單元)中抽出樣本單先在總體單元(初級單元)中抽出樣本單元,并
2、不對這個樣本單元中的所有下一級單元元,并不對這個樣本單元中的所有下一級單元(二級單元)都進行調(diào)查,而是在其中再抽出若(二級單元)都進行調(diào)查,而是在其中再抽出若干個二級單元并進行調(diào)查。干個二級單元并進行調(diào)查。這種抽樣方法稱為二階段抽樣。同樣的道這種抽樣方法稱為二階段抽樣。同樣的道理,還可以有三階段抽樣、四階段抽樣等。對于理,還可以有三階段抽樣、四階段抽樣等。對于二階段以上的抽樣,二階段以上的抽樣,統(tǒng)稱為統(tǒng)稱為多階段抽樣多階段抽樣。返回二、多階段抽樣的優(yōu)點(1)(1)多階段抽樣保持了整群抽樣的樣本比較集中、多階段抽樣保持了整群抽樣的樣本比較集中、便于調(diào)查、節(jié)約費用等優(yōu)點。便于調(diào)查、節(jié)約費用等優(yōu)點。
3、(2)(2)多階段抽樣不需要編制所有小單元的樣本框。多階段抽樣不需要編制所有小單元的樣本框。三、抽選方法與推斷原理 多階段抽樣時,每一個階段的抽樣可以相同,也多階段抽樣時,每一個階段的抽樣可以相同,也可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣結(jié)合使用。多階段抽樣時,抽樣是分步進行的,因此,結(jié)合使用。多階段抽樣時,抽樣是分步進行的,因此,討論估計量的均值及其方差時,需要分階段進行這要討論估計量的均值及其方差時,需要分階段進行這要用到下面的性質(zhì)用到下面的性質(zhì)。返回性質(zhì)1 對于兩階段抽樣,有式中,式中,為在固定初級單元時對第二階抽樣求均為在固定初級單
4、元時對第二階抽樣求均值和方差;值和方差;為對第一階抽樣求均值和方差。為對第一階抽樣求均值和方差。性質(zhì)性質(zhì)1 1可以推廣到多階段抽樣的情形,例如可以推廣到多階段抽樣的情形,例如對于三階段抽樣,有對于三階段抽樣,有返回8.2 初級單元大小相等的二階抽樣第一階段在總體第一階段在總體N N個初級單元中,以簡單隨機個初級單元中,以簡單隨機抽樣抽取抽樣抽取n n個初級單元,第二階段在被抽中的初級個初級單元,第二階段在被抽中的初級單元包含的單元包含的M M個二級單元中,以簡單隨機抽樣抽取個二級單元中,以簡單隨機抽樣抽取m m個二級單元,即最終接受調(diào)查的單元個二級單元,即最終接受調(diào)查的單元。例如:某個新開發(fā)的
5、小區(qū)擁有相同戶型的例如:某個新開發(fā)的小區(qū)擁有相同戶型的1515個個單元的樓盤,居民已經(jīng)陸續(xù)搬入新居,每個單元住單元的樓盤,居民已經(jīng)陸續(xù)搬入新居,每個單元住有有1212戶居民,為調(diào)查居民家庭裝修情況,準備從戶居民,為調(diào)查居民家庭裝修情況,準備從180180戶居民戶中抽取戶居民戶中抽取2020戶進行調(diào)查。如下表:戶進行調(diào)查。如下表:返回編號單 元 房 號123456789101112131415一棟A座一棟B座一棟C座二棟A座二棟B座二棟C座三棟A座三棟B座三棟C座四棟A座四棟B座四棟C座五棟A座五棟B座五棟C座 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8
6、 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9
7、10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 返回表中紅字為抽中的房號。這時,初級單元有15個,每個初級單元擁有二級單元12個。首先將單元從1到15編號,在15單元中隨機抽取5個單元,分別是1,6,9,12,13號;然后在被抽中的單元中,進行第二次抽樣,即分別在12戶居民戶中隨機抽取4戶。一、符號說明初級單元和初級單元擁有的二級單元個數(shù):N,M第一階段和第二階段抽樣的樣本量:n ,m 第i個初級單元中的第j個二級單元的觀測值:樣本中第i個初級單元中的第j個二級單元的觀測值:返回第一階段和第二階段的抽樣比:第i個初
8、級 單 元 按二級單元的平均 值:按二級單元的平均值:初級單元間的方差:返回初級單元內(nèi)的方差:由 的表達式可知,若記則有即 是 的平均值。同理有返回二、估計量及其性質(zhì)(一)總體均值的估計性質(zhì)2 對于初級單元大小相等的二階抽樣,如果兩個階段都是簡單隨機抽樣,且對每個初級單元,第二階抽樣是相互獨立進行的,則對總體均值 的無偏估計為:其方差為:的無偏估計為:返回【例8.1】欲調(diào)查4月份100家企業(yè)的某項指標,首先從100家企業(yè)中抽取了一個有板有5家樣本企業(yè)的簡單隨機樣本,調(diào)查人員對5家企業(yè)分別在調(diào)查月內(nèi)隨機抽取3天作為調(diào)查日,要求樣本企業(yè)只填寫這3天的流水帳。調(diào)查的結(jié)果如下。樣 本 企 業(yè)第一日第二
9、日第三日12345573851486259416053556450634954要求根據(jù)這些數(shù)據(jù)推算不100家企業(yè)該指標的總量,并給出估計的95%置信區(qū)間。返回解 將企業(yè)作為初級單元,將每一天看著二級單元。調(diào)查月內(nèi)擁有30天(即擁有30個二級單元)。首先在初級單元中抽取一個n=5的簡單隨機樣本再對每個樣本的二級單元分別獨立抽取一個m=3的簡單隨機樣本由題意,N=100,M=30,n=5,m=3首先計算樣本初級單元的均值 、方差 :返回樣 本 企 業(yè)123456043585057133939719于是得到:返回 置信度為置信度為95%95%的置信區(qū)間為:的置信區(qū)間為:1608001.9692161
10、608001.969216在上面的方差估計式中,第一項是主要的,第二項在上面的方差估計式中,第一項是主要的,第二項要小得多要小得多!返回(二)對總體比例的估計 如果要估計總體中具有所研究特征的二級單元數(shù)占全體全體二級單元數(shù)的比例,則式中,為第i個初級單元中具有所研究特征的二級單元數(shù),則對P的估計為:式中,為第i個初級單元中具有所研究特征的二級單元數(shù)。返回性質(zhì)3 對于二階抽樣,如果兩個階段都是簡單隨機抽樣,則有估計量 的方差為:的無偏估計為:式中,返回【例8.2】欲調(diào)查某個新小區(qū)居民家庭裝潢聘請裝潢公司的比例。我們在15個單元中隨機抽取了5個單元,在這5個單元分別隨機抽取了4戶居民進行調(diào)查,對這
11、20戶的調(diào)查結(jié)果如下表:樣本單元第一戶第二戶第三戶第四戶一棟A座二棟C座三棟C座四棟C座五棟B座是否否否是是是否否否否否否否否否否是否否要求根據(jù)這些數(shù)據(jù)推算居民家庭裝潢聘請裝潢公司的比例。返回解:記聘請裝潢公司的居民戶為“1”,否則記為“0”。這里,N=15,M=12,n=5,m=4 ,因此,其方差的估計為:P的置信區(qū)間為:返回8.3 初級單元大小不等的二階抽樣 一般而言,初級單元的大小是不相等的,如果按初級單元的大小分層后,層內(nèi)初級單元的大小差別仍很大,則需用本節(jié)介紹的方法來處理二階抽樣的問題。當初級單元大小不等時,一般采用不等概抽樣。一、符號說明總體中初級單元個數(shù)及第一階抽取的樣本量:N,
12、n第i個初級單元中二級單元數(shù):第i個初級單元中第二階抽樣的樣本量:第i個初級單元中第j個二級單元的觀測值:樣本中第i個初級單元中第j個二級單元的觀測值:返回第一階和第二階的抽樣比:二級單元個數(shù):指標總和:第i個初級單元指標總和:第i個初級單元按二級單元的平均值:返回按二級單元的平均值:初級單元間的方差:第i個初級單元二級單元間的方差:返回二、估計量及其性質(zhì)(一)對初級單元進行簡單隨機抽樣如果二階抽樣中每個階段都采用簡單隨機抽樣,并且每個初級單元中二級單元的抽樣是相互獨立的,則對總體總和的估計可以采用簡單估計,也可以考慮采用比率估計。1.簡單估計量 對總體總和的簡單估計為:根據(jù)性質(zhì)1,不僅可以證
13、明這個估計量是無偏的,并且它的方差為:返回的一個無偏估計為:式中,返回2.比率估計量 由于初級單元的大小 不同,往往造成初級單元的觀測值 差異很大,使得估計量方差 的第一項很大,從而估計量的方差也就變得很大。這時,可以考慮將初級單元的大小 作為輔助變量,采用比率估計量對總體總和進行估計。對總體總和的估計量為:返回 這是一個有偏估計量,但隨著樣本量的增加,其偏倚將趨于零。其近似均方誤差為:返回的樣本估計為:式中,返回(二)對初級單元進行放回不等概抽樣利用第五章的方法,事先規(guī)定每個初級單元被抽中的概率 對被抽中的初級單元,再抽取個二級單元。對總體總和的估計通常是構(gòu)造初級單元指標總量的無偏估計 ,然
14、后利用第五章介紹的Hansen-HuRwitz估計量對總體總量Y進行估計。由于 是 的無偏估計,由性質(zhì)1,可以證明是Y的無偏估計。且 的方差為:返回的一個無偏估計為:注意上述對第二階抽樣并沒有做出特別的規(guī)定,而且估計量的方差估計式與第二階抽樣的方式無關(guān)。在實際工作中,如果初級單元大小不相等,通常人們喜歡在第一階抽樣時按放回的與二級單元數(shù)成比例的不等概抽樣;第二階抽樣則采用簡單隨機抽樣,且每個樣本初級單元的樣本量都相等,此時,估計量的形式非常簡單。返回 【例8.3】某小區(qū)擁有10座高層建筑,每座高層建筑擁有的樓層數(shù)如下表:高層建筑ABCDEFGHIJ樓層1212161510161018 16 2
15、0 用二階抽樣方法抽出10個樓層進行調(diào)查,第一階抽樣為放回的、按與每座建筑擁有的樓層數(shù)成比例的不等概抽樣抽取5座建筑,第二階按簡單隨機抽樣對每座建筑抽取兩層。對10個樓層居民人數(shù)的調(diào)查結(jié)果如下表:一階樣本序號12345居民數(shù)18,1215,1819,1316,1016,11返回解:已知 n=5,m=2,注意到這個樣本是自加權(quán)的,根據(jù)P181公式(8.29),得估計量的方差為:=9776.625估計量的標準差為:返回(三)對初級單元進行不放回不等概抽樣 不放回不等概抽樣的效率比放回的效率高,因此,有時人們也會傾向于用不放回不等概抽樣來抽取初級單元。這時可利用第五章介紹的不放回不等概抽樣的結(jié)果對總
16、體總量進行推算。當然估計量的推算比較復(fù)雜。對總體總量Y的估計可以采用Horvitz-Thompson(赫魏茲-湯普森)估計。返回8.4 其他問題一、總樣本量及最優(yōu)樣本量的配置 對于二階抽樣,應(yīng)該抽多少二級單元,即確定n m為多少,一般可采用兩種方法:1.根據(jù)調(diào)查費用,確定可以調(diào)查的樣本量。2.根據(jù)簡單隨機抽樣時應(yīng)抽樣本量,再乘以設(shè)計 效應(yīng)deff獲得。由于影響精度的主要原因是初級單元之間的差異,所以多抽一些初級單元,少抽一些二級單元較好。但往往初級單元的調(diào)查費用比二級單元要高。返回考慮費用函數(shù)為最簡單的一種形式:式中,為與樣本量無關(guān)的固定費用,如公司的辦公費、場租費等;為每調(diào)查一個初級單元的費
17、用;為每調(diào)查一個二級單元的費用。則 m 的最優(yōu)值為:式中,實際使用時,m 應(yīng)為整數(shù),但計算出的 往往不是整數(shù),令 為的 整數(shù)部分,則m的取值規(guī)則為:返回 求出m之后,根據(jù)總費用函數(shù),就可以確定n,從而確定最優(yōu)抽樣比 和返回二、三階及多階抽樣(一)各級單元大小相等的多階段抽樣 如果總體擁有N個初級單元,每個初級單元擁有M個二級單元,每個二級單元又擁有K個三級單元,各階的樣本量分別為 n,m,k,每個階段都按簡單隨機抽樣,則三級單元總體均值的估計為:其方差為:方差的無偏估計為:返回 由于方差的主要項為第一項,其次為第二項,第三項幾乎可以忽略。所以對于更高階的抽樣,估計量的方差計算一般只計算到第二階
18、至第三階就可以了。(二)各級單元大小不相等時的多階段抽樣(略)返回(三)多階抽樣的實例 某調(diào)查公司接受了一項關(guān)于全國城市成年居民人均奶制品消費支出及每天至少喝一杯鮮奶人數(shù)的比例情況的調(diào)查。確定抽樣范圍為全國地級及以上城市中的成年居民。成年居民指年滿18周歲以上的居民。第一步:確定抽樣方式。調(diào)查公司決定采用多階段抽樣方法進行方案設(shè)計,調(diào)查的最小單元為成年居民。確定調(diào)查的各個階段為城市、街道、居委會、居民戶,在居民中利用而維隨機表抽取成年居民。第二步:確定樣本量及各階段樣本量的分配。按簡單隨機抽樣,在95%置信度下,絕對誤差為5%取使方差達到最大的比例P=0.5,則全國樣本量為:返回 根據(jù)以往調(diào)查
19、經(jīng)驗,估計回答率為b=80%,因此調(diào)整樣本量為:多階段抽樣的效率比簡單隨機抽樣的效率低,這里取設(shè)計效率為deff=3.2,則在全國范圍內(nèi)應(yīng)調(diào)查的樣本量為:各階段的樣本量配置為:初級單元:20個城市;二級單元:80個街道,每個樣本市內(nèi)抽4個街道;返回三級單元:160個居委會,每個樣本街道內(nèi)抽2個居委會;四級單元:1600個居民戶,每個樣本居委會內(nèi)抽10個居 民戶。在樣本居民戶內(nèi),隨機抽取一名成年 居民。第三步:確定抽樣的操作方法。第一階段 在全國城市中按與人口數(shù)成比例的放回的不等概抽樣,即PPS抽樣。第二、三階段 分別按人口數(shù)成比例的不等概等距抽樣。以第二階段為例,在某個被抽中的城市中,將其所屬
20、的街道編號,搜集各街道的人口數(shù),賦予每個街道與人口相同的代碼數(shù);根據(jù)該市總?cè)丝跀?shù)除以樣本量4,然后對代碼進行隨機起點的第距抽樣,則被抽中代碼所在的街道為樣本街道。返回第四階段 分別在每個居委會中,按等距抽樣抽出10個居民戶。即根據(jù)居委會擁有的居民戶數(shù)除以樣本量10得到抽樣間距,然后隨機起點等距抽樣。在每個樣本居民戶,調(diào)查員按二維隨機表抽取一名成年居民。二維隨機表的使用如下:1.隨機號的確定。2.選出被訪者。返回序號姓名性別年齡1234567891011121肖明男531111111111112汪紅女522112121212213肖曉波男233211322131234肖曉玲女2141322314
21、324155412341235426631524351462771436252574388457126375319951438276528101035941728694111161510498327612127294116183105返回第四步:總體估計 記各樣本城市的80位樣本居民中,奶制品消費總支出為 ,則各樣本城市人均奶制品消費支出為:返回 全國1600名居民組成的樣本中,奶制品消費總支出為 則成年居民人均奶制品消費支出為:方差估計為:對總體比例的推算可以借用對均值的推算公式。記各樣本城市的80位樣本居民中,每天至少喝一杯鮮奶的人數(shù)為,則各樣本城市每天至少喝一杯鮮奶的人數(shù)比例為:返回全國
22、1600名居民組成的樣本中,每天至少喝一杯鮮奶的總?cè)藬?shù)為 ,則成年居民中每天至少喝一杯鮮奶的人數(shù)的比例為:p的方差的估計為:式中,返回 本章小結(jié)本章小結(jié)(1)(1)對于大規(guī)模的抽樣對于大規(guī)模的抽樣調(diào)查項目調(diào)查項目,通常采用多通常采用多階段抽樣方法階段抽樣方法;(2)(2)多階段抽樣方法多階段抽樣方法可以可以看做對樣本群內(nèi)的單元進看做對樣本群內(nèi)的單元進行再抽樣的一種方法行再抽樣的一種方法;(3)(3)一般來說一般來說,多階段抽樣多階段抽樣的前幾階采用的前幾階采用PPS抽樣抽樣,最最后一階采用等概率抽樣后一階采用等概率抽樣.返回本章作業(yè)本章作業(yè)(1 1)熟悉本章附錄的證明;)熟悉本章附錄的證明;(2 2)思考書后習題)思考書后習題1,1,習題習題2 2;(3 3)在作業(yè)本上完成書后)在作業(yè)本上完成書后習題習題3-3-習題習題5 5。(第八章結(jié)束)返回演講完畢,謝謝觀看!
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 市教育局冬季運動會安全工作預(yù)案
- 2024年秋季《思想道德與法治》大作業(yè)及答案3套試卷
- 2024年教師年度考核表個人工作總結(jié)(可編輯)
- 2024年xx村兩委涉案資金退還保證書
- 2024年憲法宣傳周活動總結(jié)+在機關(guān)“弘揚憲法精神推動發(fā)改工作高質(zhì)量發(fā)展”專題宣講報告會上的講話
- 2024年XX村合作社年報總結(jié)
- 2024-2025年秋季第一學期初中歷史上冊教研組工作總結(jié)
- 2024年小學高級教師年終工作總結(jié)匯報
- 2024-2025年秋季第一學期初中物理上冊教研組工作總結(jié)
- 2024年xx鎮(zhèn)交通年度總結(jié)
- 2024-2025年秋季第一學期小學語文教師工作總結(jié)
- 2024年XX村陳規(guī)陋習整治報告
- 2025年學校元旦迎新盛典活動策劃方案
- 2024年學校周邊安全隱患自查報告
- 2024年XX鎮(zhèn)農(nóng)村規(guī)劃管控述職報告