首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
金勇进  张喆 《统计研究》2014,31(9):79-84
用样本数据推断总体,权数的作用十分重要。使用权数,不仅能将样本还原到总体,还能调整样本结构,使其与总体结构相一致,因此正确的使用权数是我们进行统计推断的基础。本文系统阐述了抽样调查分析中权数的获取过程,以及后期对初始权数调整过程。由于权数是把双刃剑,在提高精度的同时,有可能提高估计量的误差,本文提出了对权数进行评估的方法,研讨如何对权数进行控制,最后根据我国综合社会调查项目(CGSS)的数据进行实证分析,按照所给方法不仅能提高估计精度,而且能够降低抽样推断中的权效应。  相似文献   

2.
吕萍 《统计研究》2017,(1):108-118
随着社会经济的发展,人们越来越多地使用调查数据,尤其是利用复杂调查数据进行研究.复杂调查数据源于复杂抽样设计,是指在抽样调查过程中使用分层、多阶段、整群和不等概率等复杂抽样设计获得调查数据.在数据分析中,若忽视层、群等抽样设计的复杂性,直接利用调查数据按照传统数据分析方法,容易得出错误的结论,尤其是涉及标准误的估计.本文主要介绍复杂抽样设计和复杂调查数据的特征,对抽样信息在复杂抽样数据中的应用进行研究,并以中国家庭追踪调查(ChinaFamily Panel Studies,CFPS)为例详细说明抽样信息在复杂调查中的应用,说明在复杂抽样调查数据中使用抽样信息的重要性.  相似文献   

3.
吕萍 《统计研究》2011,28(2):93-97
 方差估计是抽样调查的重要组成部分,重抽样方法是常用的方差估计方法。重权数方法与重抽样方法类似,也是利用计算机的优势通过重复获得大量不同的子样本的重权数估计目标参数的估计量和方差估计量,是一种稳健、通用、有效的方差估计方法。本文主要介绍重权数在复杂抽样调查的方差计算中的理论和应用。  相似文献   

4.
利用抽样调查数据对总体参数进行推断通常分为两种途径:一种是基于设计的推断体系;另一种是基于模型的推断体系。基于设计的推断以随机化理论为基础,推断依赖于抽样设计,在大样本下估计量具有无偏性和一致性,但在样本量较小或存在非抽样误差等情况下效率较低。基于模型的推断认为有限总体是一个来自无限超总体的随机样本,推断依赖于模型假设,构建超总体模型具有很大的灵活性,有利于充分利用总体辅助信息并提高估计精度,但在模型假定有误或样本的入样过程不具有无信息性时存在估计误差。如何将两种推断途径相结合,在体现样本对总体代表性的同时,保证估计效率和估计量的优良性质,尚待研究。权数在基于设计的推断中起着核心作用,能够反映抽样设计对样本的影响,实现样本对总体的还原。将权数引入基于模型的推断,可以使基于模型推断的结果具有总体代表性,能更好地发挥两种推断体系的组合优势,并削弱模型假定对推断效果的影响。据此,从权数对于模型推断的影响入手,针对因果推断问题,提出将权数同时引入倾向得分模型和预测模型的建模过程,来构造双稳健估计的方法,并通过模拟研究加以验证。最终结果表明,根据文章所提出的方法进行处理效应的估计,能够充分发挥权数的作用,得到更准确、更稳健的估计结果。实证部分采用2017年CGSS调查数据进行分析,进一步说明在基于调查数据进行模型推断时应充分考虑抽样设计的影响,为科研人员进行因果推断以及其他基于调查数据开展的研究提供参考。  相似文献   

5.
权数是影响CPI精度的重要因素之一,通过对基本分类价格指数计算中的权数缺失和高层级价格指数计算中权数滞后的影响进行了理论和实证分析,结果表明,利用将销售量作为权数的"联合比"法对基本分类价格指数进行计算可以大幅提高其精度;高层级价格指数计算所用权数的滞后性同样会降低CPI的精度,且主要存在高估CPI的系统性误差问题。  相似文献   

6.
贺飞燕 《统计研究》2015,(2):109-110
一、研究背景在抽样调查中,我们需要给样本中的每个单元赋予一个权数,通过最终权数和观测值得到观测变量的估计值。加权过程应考虑到并校正覆盖不完整、抽样可变性和无回答的错误。加权进行得越好,估计的方差和偏差就会越小。权数的计算通常有以下三步:抽样权数即设计权数、无回答的调整和校准。其中抽样权数是在设计阶段计算的,无回答的调整是将设计权数通过无回答的补偿来调整,校准是通过已知总体的辅助信  相似文献   

7.
吕萍 《统计研究》2017,(7):118-128
随着国内定量研究方法的开展和大型调查数据的免费公布,研究者不仅使用抽样调查数据对总体分析,还需要对域总体进行分析.本文对调查数据满足域精度推断的域估计问题进行研究.首先,根据实际调查中的域估计问题,指出解决域估计问题最好的方法是事先确定好需要估计的域,并在抽样设计时兼顾域的估计精度.但是,在实际调查中还包含计划外的域,通过对简单随机抽样下的域估计问题的研究,说明非计划域的估计问题的最大难点是域样本量的随机性.然后,针对实际中的抽样调查数据多来源于分层、多阶段、整群和不等概率等复杂抽样设计的问题,指出需要结合复杂抽样设计信息、域样本量的随机性、域样本在总体的误差层和误差群中的分布,对复杂抽样设计下的域估计问题进行研究.最后,以中国家庭追踪调查(China Family Panel Studies,CFPS)为例,对复杂抽样设计下的域估计问题进行案例研究.  相似文献   

8.
大型的抽样调查不仅是多目标的复杂调查,而且在估计总体目标变量的基础上还需要对其中的一些域的目标变量进行估计,所以小域估计和多目标估计问题一直是抽样调查的热点问题.文章主要利用模型校准权数的方法,解决小域中的多目标估计问题,并得到小域的多个目标变量的稳健估计量.  相似文献   

9.
加权调整属于处理无回答的事后调整方法,文章列举了权数调整中计算回答率的两种方式,并从回答率入手,利用统计模拟的方法找出了在MCAR和CDM数据缺失机制下,回答率的不同计算方法和不同取值对估计效果的影响。  相似文献   

10.
 在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现“事后”自加权设计。实现“事后”自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现 是一个比较合适的样本量。这一结论可能为其它大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号