首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于倾向值加权方法,构造了网络调查总体参数的Horvitz-Thompson无偏估计量,并对其方差进行了讨论,分析了利用插补缺失数据后的网络调查样本进行总体参数估计的方差来源,在网络调查总体参数估计方面提出了新的思路和方法。  相似文献   

2.
文章讨论了基于多变量事后分层基础上的多重插补方法,分别就分层方法的选择、样本在各层的分配、插补模型的选择和参数估计进行了分析.  相似文献   

3.
缺失值是调查中普遍存在的问题,对缺失值进行插补是处理缺失值的较好方法.如果变量之间存在相关关系,可以通过正态线形模型利用不存在缺失值的变量对有存在缺失值的变量进行插补.较之单一插补,多重插补更能有效地估计总体方差,因此更多地被使用.文章借助Bootstrap法,让模型的参数和残差来自完全观测的Bootstrap样本的最小平法估计,可进一步准确估计总体方差.通过大量模拟试验,发现Bootstrap多重插补较之单一插补和一般多重插补能构建更宽的置信区间从而有更准确的总体参数覆盖率,这点在数据缺失比重很大时优势更明显.  相似文献   

4.
当对插补所得的“完整数据集”使用标准的完全数据统计方法的时候,往往会低估插补估计量的方差.Bootstrap方法(自助法)是非参数统计中的一种重要的统计方法,是基于原始观测数据进行重复抽样,能充分的利用已知数据,不需要对未知总体进行任何的分布假设或增加新的样本信息,进而再利用现有的统计模型对总体的分布特性进行统计推断.本文首先运用多重插补的方法对缺失数据进行了插补,之后利用Bootstrap方法对插补之后的数据进行了插补统计量的方差估计,结果表明运用Bootstrap方法进行插补统计量的方差估计更科学更准确.  相似文献   

5.
对“三新”企业进行抽样调查是及时掌握和监测“三新”经济发展的重要手段。考虑到这一类调查总体单元变动比较迅速,抽样框信息变动大,无法及时覆盖总体的最新特征,依此抽样框得到的样本数据结构与总体的分布结构差异较大,样本的代表性较低,会对总体数量特征的有效估计产生影响。因此,基于调查总体单元的变动特征,把抽样框中的单元划分为保留单元和转移单元,在此基础上,依据样本单位分层结构的变动,设计了基于“三新”企业分层抽样单元权重动态调整的估计方法。首先,通过事后分层方法挖掘出不同层的单位特征,并预测抽样框各层容量;其次,依据层规模的变动预测对目标变量估计量的权重进行修正;最后,通过自我加权设计构造出总体动态变动后数量特征的复合估计量,并对其进行优良性讨论。在对“三新”企业的模拟数据进行多次重复抽样实验中,相比于固定抽样框下的传统方法,基于分层抽样单元权重动态调整的估计方法具有更高的抽样效率,构造的关于总体数量特征的估计量具有无偏性和有效性。  相似文献   

6.
于力超  金勇进 《统计研究》2018,35(11):93-104
大规模抽样调查多采用复杂抽样设计,得到具有分层嵌套结构的调查数据集,其中不可避免会遇到数据缺失问题,针对分层结构含缺失数据集的插补策略目前鲜有研究。本文将Gibbs算法应用到分层含缺失数据集的多重插补过程中,分别研究了固定效应模型插补法和随机效应模型插补法,进而通过理论推导和数值模拟,在不同组内相关系数、群组规模、数据缺失比例等情形下,从参数估计结果的无偏性和有效性两方面,比较不同方法的插补效果,给出插补模型的选择建议。研究结果表明,采用随机效应模型作为插补模型时,得到的参数估计结果更准确,而固定效应模型作为插补模型操作相对简便,在数据缺失比例较小、组内相关系数较大、群组规模较大等情形下,可以采用固定效应插补模型,否则建议采用随机效应插补模型。  相似文献   

7.
文章通过多重插补方法对不同缺失率和缺失模式的多变量缺失样本进行插补,研究了多重插补误差与缺失率和缺失模式的依赖关系。结果表明,当缺失率为0~15%时,多重插补误差与缺失率呈线性关系;当缺失率大于15%时,两者呈偏离线性关系。多重插补误差与缺失模式的方差均值比呈正相关性,当方差均值比越大时,误差也越大。  相似文献   

8.
文章在响应变量随机缺失下研究非线性均值方差模型的参数估计问题.基于回归插补和随机回归插补两种缺失插补方法以及结合Gauss-Newton迭代计算算法给出该模型中未知参数的极大似然估计.并通过对两个随机模拟例子实际例子的研究分析,结果都表明了所提出的模型与统计方法具有可行性和实用性.  相似文献   

9.
贺建风 《统计研究》2012,29(10):105-112
多重抽样框可以解决单一抽样框难以完整覆盖流动性目标总体的难题,连续性抽样调查则可以获取变量的时序观测数据,对总体现象进行追踪调查。本文将多重抽样框调查与连续性抽样调查两种方法结合在一起进行研究,深入分析基于多重抽样框的连续性抽样估计方法。文章首先设计了连续性调查环境下总体结构变动表;然后,在简单随机抽样假定下的轮换样本调查情形开展研究,设计了14种参数缩减方法对构建的似然函数进行估计求解,并给出了估计量的迭代计算过程;最后,对本文的研究内容进行了总结与展望。  相似文献   

10.
利用抽样调查数据对总体参数进行推断通常分为两种途径:一种是基于设计的推断体系;另一种是基于模型的推断体系。基于设计的推断以随机化理论为基础,推断依赖于抽样设计,在大样本下估计量具有无偏性和一致性,但在样本量较小或存在非抽样误差等情况下效率较低。基于模型的推断认为有限总体是一个来自无限超总体的随机样本,推断依赖于模型假设,构建超总体模型具有很大的灵活性,有利于充分利用总体辅助信息并提高估计精度,但在模型假定有误或样本的入样过程不具有无信息性时存在估计误差。如何将两种推断途径相结合,在体现样本对总体代表性的同时,保证估计效率和估计量的优良性质,尚待研究。权数在基于设计的推断中起着核心作用,能够反映抽样设计对样本的影响,实现样本对总体的还原。将权数引入基于模型的推断,可以使基于模型推断的结果具有总体代表性,能更好地发挥两种推断体系的组合优势,并削弱模型假定对推断效果的影响。据此,从权数对于模型推断的影响入手,针对因果推断问题,提出将权数同时引入倾向得分模型和预测模型的建模过程,来构造双稳健估计的方法,并通过模拟研究加以验证。最终结果表明,根据文章所提出的方法进行处理效应的估计,能够充分发挥权数的作用,得到更准确、更稳健的估计结果。实证部分采用2017年CGSS调查数据进行分析,进一步说明在基于调查数据进行模型推断时应充分考虑抽样设计的影响,为科研人员进行因果推断以及其他基于调查数据开展的研究提供参考。  相似文献   

11.
文章在响应变量随机缺失下,基于分位数回归研究了半参数模型的稳健估计问题。首先基于B样条基函数近似技术,将模型非参数函数的估计问题转化为样条系数向量估计问题;其次,在响应变量随机缺失下,提出了一种新的插补方法,对缺失的响应变量进行多重插补;再次,基于插补后的数据集,构造出新的分位数目标函数,得到模型非参数函数以及参数向量的稳健估计;最后给出了有效算法计算多重插补估计量。通过模拟研究验证了所提方法的有效性和稳健性。  相似文献   

12.
基于链式方程的收入变量 缺失值的多重插补   总被引:2,自引:0,他引:2       下载免费PDF全文
刘凤芹 《统计研究》2009,26(1):71-77
 在经济计量分析中收入变量的缺失值是一个普遍而又较难处理的问题。传统的处理方法往往导致分析结果具有系统偏差。本文提出利用基于链式方程的多重插补方法来处理收入变量的缺失值问题。文章将此方法应用到一个实际数据集,然后通过分析插补后的数据集讨论了此方法的性质,并和其他多重插补方法进行了比较。结果表明:基于链式方程的多重插补能在一定程度上纠正推断结果的系统偏差,并且给出恰当的标准差估计。  相似文献   

13.
彭寿康 《统计研究》2002,2(11):24-27
一、引言Logistic回归模型是对二分类因变量 (因变量y只取两个值 )进行回归分析时经常使用的统计分析方法。与线性回归不同 ,Logistic回归是一种非线性模型 ,因而普遍采用的参数估计方法是最大似然估计法。可以证明 ,在随机样本条件下 ,Logistic模型的最大似然估计具有一致性、渐进有效性和渐进正态性。然而在有些问题的研究中 ,样本抽取并不完全是随机的 ,而是采用分层抽样方法 ,首先将研究总体按属性特征分类 ,然后在各类中随机抽取样本 ,这就需要考虑分层抽样条件下Logistic模型的参数估计问题。对分层…  相似文献   

14.
对分层抽样设计的改进   总被引:2,自引:0,他引:2       下载免费PDF全文
彭念一  陈曜 《统计研究》2001,18(3):51-54
 在社会经济研究中,由于实际条件的限制,往往采用抽样调查的方法获得的现象总体的信息,当总体内部差异比较大时,应首先对总体个单位按有关指标加以分层,然后再从各层中按随机原则抽选一定单位构成样本。分层可以大大提高抽样推断的精度,降低工作量和成本,所以实际工作中分层抽样得到了广泛的应用。 样本分配是分层抽样研究的一个重要方面。影响样本分配的因素主要有:各层方差、各层样本单位数、调查成本等,其中调查成本是与实际工作有密切影响的因素。当存在多个项目场合中调查成本与调查精度之间的函数关系,为实际工作中的多目标决策提供思路。  相似文献   

15.
交叉分层抽样下的总体推估方法探讨卢宗辉在分层抽样中,我国通常只讨论总体按一个标志简单分层的情况,而对总体按两个或两个以上标志交叉分层的情况则讨论甚少,甚至可以说是一片空白。鉴于此,本文拟跟踪国外最新发展,对交叉分层抽样下的总体推估方法进行探讨。一、问...  相似文献   

16.
文章通过对缺失值处理方法分析,提出基于分类的三种缺失值处理方法:分类的均值插补法、分类的多重插补法和分类的K-means方法;该方法先对被调查对象问卷中的满意度关键字段按照分值进行分类,然后在同类中的缺失值用该类的平均值、多重插补值和聚类中心值替代.最后,以某食品公司为研究对象,对顾客满意度测评模型进行带缺失值的实证分析.结果表明:基于分类的三种缺失值处理方法优于均值插补法、多重插补法和K-means方法,为顾客满意度指数测评中的缺失值处理提供了实用方法.  相似文献   

17.
分层抽样中,样本在各层中的不同获取方式会对估计量的精度和试验费用产生一定的影响,而已有的理论方法大多不能在提高精度的同时降低调查费用。为此,将排序抽样与分层抽样方法相结合,提出了辅以排序集样本的分层抽样方案,并得到了总体均值的估计量以及这一估计量的良好性质。这些结果表明,与单一的分层随机抽样相比,这种抽样设计的估计量具有更高的精度,同时也节约了各层抽样调查的费用。  相似文献   

18.
分层抽样是经常使用的一种抽样技 术。采用分层抽时,总体被分为同质但又不相互重叠的若干部分,这些部分被称为子总体或层。 划分子总体的动机大致可分为主动的和被动的两种。所谓主动,又常出于两种考虑:一是为了提高抽样效率,即对于同一个调查总体和同样的调查精度要求,采用不同的抽样方法和估计量所需要的样本量会有很大的差别,样本星小的为抽样效率高,反之,则为抽样效  相似文献   

19.
文章将抽样调查中由于项目无回答所形成的缺失数据作为研究着眼点,从矩阵运算的角度分析了此类缺失数据带来的危害,在此基础上,对缺失数据插补处理方法的基本问题进行了讨论,分析了各种单一插补方法特点及局限性,并介绍了简单随机抽样、分层随机抽样条件下缺失数据多重插补的抽样推断方法,在此基础上,对常用的单一插补和多重插补方法进行了比较,并对简单随机抽样、分层随机抽样条件下缺失数据单一插补与多重插补方法的效率进行了实证研究与比较。  相似文献   

20.
部份样本轮换抽样下的比估计辽宁大学国民经济管理学马树才,韩云虹在实际抽样调查中,当对总体的前期抽取一定容量的样本个体进行调查后,在对总体现期抽样调查时,人们常常将前期抽样的样本个体部分采取轮换的方式进行,以期望提高对总体的现期估计的精度。那么它对总体...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号