首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
基于双重抽样框的二阶段抽样调查方法研究   总被引:2,自引:0,他引:2  
由于被调查对象的频繁变动,单一抽样框很难覆盖所有的目标单位。为了克服单一抽样框覆盖不完全的缺陷,在各阶段抽样调查采用双重(或多重)抽样框是一种有效的办法。对双重抽样框下的二阶段抽样估计方法进行了研究,得出简单随机抽样下的总体总值估计及其估计量方差,并利用拉格朗日函数求出双重抽样框重叠部分的最优抽样权重系数及各抽样阶段不同子域的样本容量,分析结果可为实际部门在双重抽样框下进行二阶段抽样调查提供相关的理论基础。  相似文献   

2.
贺建风 《统计研究》2012,29(10):105-112
多重抽样框可以解决单一抽样框难以完整覆盖流动性目标总体的难题,连续性抽样调查则可以获取变量的时序观测数据,对总体现象进行追踪调查。本文将多重抽样框调查与连续性抽样调查两种方法结合在一起进行研究,深入分析基于多重抽样框的连续性抽样估计方法。文章首先设计了连续性调查环境下总体结构变动表;然后,在简单随机抽样假定下的轮换样本调查情形开展研究,设计了14种参数缩减方法对构建的似然函数进行估计求解,并给出了估计量的迭代计算过程;最后,对本文的研究内容进行了总结与展望。  相似文献   

3.
贺建风 《统计研究》2018,35(4):104-116
在现代抽样调查中,校准估计方法能够通过有效利用辅助信息来提高估计量的精度,多重抽样框抽样调查则不仅可以解决单一抽样框覆盖不全的问题,还可以节约抽样设计阶段的成本。本文将这两种现代抽样估计与设计方法进行结合,将校准估计方法引入到基于多重抽样框的抽样调查体系中,在实现节约调查成本的同时,还能够提高估计量的精度。文章首先按照分离抽样框与组合抽样框估计方法的分类思路,对传统多重抽样框估计方法进行系统梳理;然后在最短距离法校准估计的分析框架下,按照调查时所能掌握辅助信息的具体情况,给出了两类多重抽样框估计情形下的各种不同形式的校准估计量;随后数值分析的比较结果也表明在多重抽样框中校准估计量的估计效率明显优于传统估计量;最后对本文研究进行总结的基础上,给出了我国抽样实践中应用这套先进抽样估计方法体系的展望。  相似文献   

4.
为了探究多阶段抽样情形下双重抽样框调查的估计量设计,文章对双重抽样框下的二阶段抽样估计方法进行了研究,得出了简单随机抽样下的总体总值估计及其估计量方差,对于更高阶段的抽样估计量设计,可以在二阶段的基础上扩展。文章所得的分析结果可为实际部门在双重抽样框下进行二阶段(或者多阶段)抽样调查提供相关的理论基础。  相似文献   

5.
在抽样调查中,总体分为目标总体和抽样总体。所谓目标总体是研究的对象,亦即通过抽样调查所要得到信息的总体3而抽样总体是从中抽取样本的总体,也就是抽样框,对目标总体进行推断的信息取自于抽样总体。理想的抽样框的标准是能够实现目标总体与抽样总体的一致。然而在实践中由于  相似文献   

6.
抽样框的维护问题是连续抽样调查中不可忽略的问题,尤其是在对变化较快的总体进行抽样调查时,能否较好的实现抽样框的更新将是影响抽样调查的结果能否反映总体的关键问题。相对于传统的抽样方法,永久随机数法抽样技术有很多优良的,性质,可以有效地实现抽样框的更新就是其优势之一。本文从永久随机数法抽  相似文献   

7.
当前所获取的大数据并非都是总体数据,通常未能完全覆盖总体,因其多源异构的特性,致使传统的数据分析方法受阻。文章将抽样调查方法引入到大数据中,对大数据背景下应用多重抽样框的必要性进行剖析,并主要针对大数据中数据多源异构的难点,将每个来源数据作为一个抽样框进行处理,提出了大数据中多重抽样框的构建。进而根据大数据的数据特征进行分类,针对不同情况确定是否需要进行分阶段抽样设计,并提出运用SF估计量对基于多重抽样框的总体进行估计,此估计量较为符合大数据中多重抽样估计的需求,并能对总体有较好的估计。  相似文献   

8.
抽样调查工作中无回答情形不可避免,双重抽样框下亦如此,因此需要对双重抽样框下抽样调查项目无回答造成的估计量偏差进行纠偏校正。首先通过二重抽样获取辅助变量的信息,使用其构造比率估计量与比率型指数估计量的组合估计量对双重抽样框下抽样调查中项目无回答数据进行插补,得到对应各部分子总体的均值估计,再用Hartley估计量的形式对总体总值进行估计。通过计算估计量偏差、均方误差及最优权重系数,对比相同条件下完全回答时同类型组合估计量均方误差的相对精度损失与使用单一比率型指数估计量的相对精度损失,随机模拟结果显示损失率较低,插补方法有效。选择合适的辅助变量构造比率估计量和比率型指数估计量的组合估计量做插补值,更充分利用辅助变量和已回答研究变量信息,基于提出的组合估计量于抽样调查工作具有一定的应用价值。  相似文献   

9.
抽样框是用来代表总体 ,从中抽选样本的一个框架。准确、完备的抽样框是开展抽样调查的前提条件。抽样框误差主要来自 :1.遗漏目标总体单位 ;2 .包含非目标总体单位 ;3.上述两种情况并存 ;4 .复合链接 ;5 .抽样框的陈旧 ;6 .辅助信息不正确。可以采取以下方法减少抽样框误差。首先 ,在抽选样本之前 ,要对抽样框加以检查 ,发现可能存在的问题 ,进行识别、处理 ,并采取一定措施加以补救。可以和普查或其他调查资料的总值或行政记录等相比较、分析 ,进而查明是否存在遗漏或去除已注销的单位。可以利用客观现实的相互联系 ,找出平衡关系 ,推算是…  相似文献   

10.
在城市住户抽样调查中,抽样框的设计起着非常重要的作用,抽样框的结构,抽样框内所包含的信息,以及这些信息的质量,将决定调查中抽样设计的类型和估计的方法,而且对抽样估计的精度有直接的影响.文章通过抽样框设计的理论研究,发现城市住户调查抽样框设计存在的缺陷以及造成的抽样误差,对抽样框的设计方法进行改进,提高样本的代表性和抽样调查数据质量.  相似文献   

11.
金勇进  刘展 《统计研究》2016,33(3):11-17
利用大数据进行抽样,很多情况下抽样框的构造比较困难,使得抽取的样本属于非概率样本,难以将传统的抽样推断理论应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,以基于样本匹配的样本选择为例探讨了具体解决方法。  相似文献   

12.
In multi-character surveys, determination of sample sizes for studying various characters poses a difficult problem. In some situations, instead of observing the same units for all the characters it may be desirable to have some units observed for all the characters whereas some extra units for each character are observed separately. Such type of sampling has been defined here as sampling with partial enumeration. In the present investigation the efficiency of sampling with partial enumeration has been examined as compared to the usual two phase sampling for the study of only two characters.  相似文献   

13.
 抽样难是对农民工主流群体研究稀少的原因之一,农民工具有聚集性和流动性,总体不明使得常规抽样方法抽样成本高效率低,适应性区群抽样能更经济高效地获得可进行统计推断的样本。本文以北京市城八区的农民工抽样为例,介绍了适应性区群抽样方法的基本原理、主要操作步骤、权重计算、统计推断,以及在实际操作中应注意的若干问题。  相似文献   

14.
Three sampling designs are considered for estimating the sum of k population means by the sum of the corresponding sample means. These are (a) the optimal design; (b) equal sample sizes from all populations; and (c) sample sizes that render equal variances to all sample means. Designs (b) and (c) are equally inefficient, and may yield a variance up to k times as large as that of (a). Similar results are true when the cost of sampling is introduced, and they depend on the population sampled.  相似文献   

15.
The sampling designs dependent on sample moments of auxiliary variables are well known. Lahiri (Bull Int Stat Inst 33:133–140, 1951) considered a sampling design proportionate to a sample mean of an auxiliary variable. Sing and Srivastava (Biometrika 67(1):205–209, 1980) proposed the sampling design proportionate to a sample variance while Wywiał (J Indian Stat Assoc 37:73–87, 1999) a sampling design proportionate to a sample generalized variance of auxiliary variables. Some other sampling designs dependent on moments of an auxiliary variable were considered e.g. in Wywiał (Some contributions to multivariate methods in, survey sampling. Katowice University of Economics, Katowice, 2003a); Stat Transit 4(5):779–798, 2000) where accuracy of some sampling strategies were compared, too.These sampling designs cannot be useful in the case when there are some censored observations of the auxiliary variable. Moreover, they can be much too sensitive to outliers observations. In these cases the sampling design proportionate to the order statistic of an auxiliary variable can be more useful. That is why such an unequal probability sampling design is proposed here. Its particular cases as well as its conditional version are considered, too. The sampling scheme implementing this sampling design is proposed. The inclusion probabilities of the first and second orders were evaluated. The well known Horvitz–Thompson estimator is taken into account. A ratio estimator dependent on an order statistic is constructed. It is similar to the well known ratio estimator based on the population and sample means. Moreover, it is an unbiased estimator of the population mean when the sample is drawn according to the proposed sampling design dependent on the appropriate order statistic.  相似文献   

16.
Ori Davidov  Chang Yu 《Statistics》2013,47(2):163-173
We provide a method for estimating the sample mean of a continuous outcome in a stratified population using a double sampling scheme. The stratified sample mean is a weighted average of stratum specific means. It is assumed that the fallible and true outcome data are related by a simple linear regression model in each stratum. The optimal stratified double sampling plan, i.e. , the double sampling plan that minimizes the cost of sampling for fixed variances, or alternatively, minimizes the variance for fixed costs, is found and compared to a standard sampling plan. The design parameters are the total sample size and the number of doubly sampled units in each stratum. We show that the optimal double sampling plan is a function of the between-strata and within-strata cost and variance ratios. The efficiency gains, relative to standard sampling plans, under broad set of conditions, are considerable.  相似文献   

17.
 在改革开放的新形势下,我国政府统计部门开展了农村住户等一系列农村统计调查,为解决“三农”问题提供了多方面的数据信息。本文通过分析总结现行农村住户抽样调查方案中存在的各种矛盾和问题,利用国际上前沿的连续性抽样调查方法作为理论基础,分别从农村住户抽样框的构建、连续各期调查样本的抽取、二维平衡轮换模式的设计、连续性抽样估计及其方差估计和连续时间序列数据的调整分析等角度提出一系列改革措施,从而设计出更加科学的调查方案,为及时、准确地搜集和提供关于“三农”问题的数据信息服务。关于其它类型的抽样调查方案亦可按照本文研究的思路类似地加以设计和解决。  相似文献   

18.
宋子轩  冷燮  陈瑶瑶 《统计研究》2012,29(7):96-100
 样本代表性直接牵扯到统计数据质量和统计公布引起的民众反响,目前社会上不乏对政府统计数据的质疑之声,最终影响到政府统计机关的公信力,因此有必要重新审视现行样本代表性的研究。目前相关文献普遍强调不同抽样方式下的样本代表性的相对性内涵,确保样本的代表性仅从抽样方法和样本量两个维度入手,缺乏对既定抽样方法下样本代表性的事后评估体系的探索,以及多样本之间样本代表性优劣的比较方法研究。鉴于此,本文在结合人口普查数据基础上尝试从样本-总体整体分布和内部属性结构两个方面构建样本代表性事后评估的一整套指标和假设检验,进而找到一种多样本代表性比较的依据。最后对浦东新区2010年城镇居民收入调查样本进行了代表性检验的尝试。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号