首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
处理缺失数据中辅助信息的利用   总被引:2,自引:0,他引:2       下载免费PDF全文
金勇进 《统计研究》1998,15(1):43-45
统计分析中经常会遇到数据缺失的情况。数据缺失的产生背景不同,主要来自于调查中的无回答。此外,由于调查员的疏忽,在调查过程中遗漏了某些调查项,或在对调查数据的检查与处理过程中,发现一些不合逻辑,明显有误,或有意使假的数据,而将其剔除,这些都会造成数据缺失。 缺失数据造成的危害是明显的,它不仅使接受调查的实际单位数目减少,扩大了抽样调查中的估计量方差,而且还会导致估计量偏差,是影响统计数据质量的重要方面。一般而言,对于缺失数据,往往需要进行重新调查,以便将缺失的数据补齐。但有时由于种种原因和条件的限制,或者无法进行重新的补充调查,或者这种补充调查仍然不能解决问题。这时,我们特别关心两个问题:一是需要了解缺失数据造成的影响有多大,即能否对由于数据缺失带来的估计量偏差进行估计;二是如何对缺失数据进行补救。这两个问题都与辅助信息有关,本文拟就这些问题进行分析。  相似文献   

2.
抽样调查工作中无回答情形不可避免,双重抽样框下亦如此,因此需要对双重抽样框下抽样调查项目无回答造成的估计量偏差进行纠偏校正。首先通过二重抽样获取辅助变量的信息,使用其构造比率估计量与比率型指数估计量的组合估计量对双重抽样框下抽样调查中项目无回答数据进行插补,得到对应各部分子总体的均值估计,再用Hartley估计量的形式对总体总值进行估计。通过计算估计量偏差、均方误差及最优权重系数,对比相同条件下完全回答时同类型组合估计量均方误差的相对精度损失与使用单一比率型指数估计量的相对精度损失,随机模拟结果显示损失率较低,插补方法有效。选择合适的辅助变量构造比率估计量和比率型指数估计量的组合估计量做插补值,更充分利用辅助变量和已回答研究变量信息,基于提出的组合估计量于抽样调查工作具有一定的应用价值。  相似文献   

3.
目前抽样调查的优势及取代逐级上报统计方法的必然性已经成为共识 ,人们将解决统计数据失真的全部希望寄托于抽样调查 ,甚至出现“一抽就准”的幻想。因此我们必须对抽样调查的误差有一个清醒的认识 ,打破“一抽就准”的幻想。抽样调查误差来源于两个方面 ,一个是单纯由于不同的随机样本得出不同的估计量而产生的抽样误差 ,它是抽样调查所固有的 ,可控制的误差 ;另一个是执行随机原则或调查方案发生偏差而形成的调查误差 ,这是一种人为因素造成的、模糊的、无法计算和修正的误差。现实中抽样调查数据的准确性可以说主要取决于调查误差。而我…  相似文献   

4.
有时抽样调查的目的要了解许多敏感性问题的真实情况。例如,逃税、行窃、受贿、堕胎、吸毒和性病等政治性或私密性的问题,直接询问常会引起受访者的疑虑,回避回答或故意答错。这种困难可以利用各种随机反应的设计方法来解决。在敏感性问题中通常回避回答的偏误是很难估计的。应用随机反应法可以移去这种偏误。此法既鼓励受访者作出诚实的回答,又能保守私人秘密。本文研究估计总体比率π的一种随机反应的设计方法,将随机反应估计的均方误同常规估计的均方误作比较,并说明其应用。一、前言在统计调查中,许多人不愿意向陌生人吐露私密,…  相似文献   

5.
抽样调查事实上始终受着系统性误差的影响,系统性误差主要是人为因素的影响而产生的,在抽样调查的实践中亦难以避免,它具有难以预测和非随机性等特点,主要包括设计误差、估计量偏差、调查误差、编辑误差。下面分别分析: 一、估计量偏差 严格地讲,这部分系统性偏差,是出于对同一目标量可选择不同的估计量而造成的。偏差形成的原因可分为三种情况: 1、使用了具有有偏性质的估计量而导致偏差出现,其特点是可以计量。实质是对某一目标量使用不同的估计量致使有偏。其研究理论已较成熟。例如,使用非常多的比率估计量和回归估计量,就…  相似文献   

6.
杨喜寿 《统计研究》1989,6(2):44-46
社会敏感问题随机化选答抽样调查方法首先由沃纳在1965年提出。这之后,在方法和原理方面有不少深入的讨论,并较成功地应用于社会敏感问题调查实践。例如在有些国家曾使用这种方法来估计私生子的比数、吸海洛因人的比数、有不正当收入人的比数等。近几年,国内也有文章介绍了这种方法并应用于实际。在抽样调查中,估计量的方差反映了抽样调查的精度。估计量方差的大小是比较不同抽样调查方法好坏的主要依据。目前所见文章介绍的随机化选答方法,关于估计量方差的计算都仅考虑总体容量为无穷的情况。  相似文献   

7.
杨清  吴伟霞 《统计研究》2000,17(6):44-46
统计数据质量问题在我国一直是一个比较严重的问题,影响统计数据质量有多种因素,但在以抽样调查为主要调查方式的情况下,抽样的原始资料的偏误是影响统计数据质量的重要因素。原始资料的偏误,主要是在调查过程的计量差错或得到有偏的回答而引起。在现有的研究成果中,只是对调查过程中可能导致原始资料偏误的各种原因作了分析,提出了一些方法,而对已经调查到手的原始资料的质量鉴别技术研究较少。本文旨在为提高统计数据质量,而对其重要的影响因素之一,原始资料的偏误的判定方法进行探讨并给出为消除这种偏误的影响的方法。对一个具体的样本…  相似文献   

8.
抽样调查中的无回答研究   总被引:1,自引:0,他引:1       下载免费PDF全文
陈如勇 《统计研究》1994,11(2):46-50
抽样调查中的无回答研究陈如勇一、无回答的含义及成因社会科学的抽样调查一般采用以下两种手段收集资料、数据:而对面的实际调查(访谈法)和利用媒介工具进行调查(邮寄问卷、电话访谈等)。在使用这两种类型调查手段的时候,都可能出现被调查者拒绝或不能回答调查者所...  相似文献   

9.
抽样调查中,无回答会造成调查数据的失真,甚致导致抽样调查的失败,因此分析无回答误差产生的原因并讨论对其有效控制的措施具有重要的理论意义和现实意义。文章分析了无回答产生的原因和对调查结果产生的影响,并根据无回答产生的原因和无回答误差的构成,提出了预防措施和调整办法,其目的是降低无回答率,提高调查数的可靠性和有效性。  相似文献   

10.
分层抽样中,样本在各层中的不同获取方式会对估计量的精度和试验费用产生一定的影响,而已有的理论方法大多不能在提高精度的同时降低调查费用。为此,将排序抽样与分层抽样方法相结合,提出了辅以排序集样本的分层抽样方案,并得到了总体均值的估计量以及这一估计量的良好性质。这些结果表明,与单一的分层随机抽样相比,这种抽样设计的估计量具有更高的精度,同时也节约了各层抽样调查的费用。  相似文献   

11.
基于卡尔曼滤波估计的连续性抽样调查研究   总被引:1,自引:0,他引:1       下载免费PDF全文
 针对连续性抽样调查中如何提高连续调查数据准确性的问题,本文引入时间序列分析方法,分别考虑连续性抽样调查中的重复样本和轮换样本等不同情况,建立了连续性抽样调查下的状态空间模型,利用成熟的卡尔曼滤波估计方法给出了总体均值的估计量。由于状态空间模型及卡尔曼滤波估计方法能够充分利用各期连续样本的调查信息,给出了精度更高的估计量,从而能够产生更加准确的连续性时间序列数据。  相似文献   

12.
抽样调查中项目无回答的估算和替代   总被引:1,自引:0,他引:1  
王宝海 《上海统计》2001,(11):22-23
在抽样调查时,往往会遇到无回答情况:一种是单位无回答,另一种是项目无回答。单位无回答是指被调查单位没有接受调查,而项目无回答是指被调查单位接受了调查,但只回答了某些而非全部的问题,或者对某些项目提供的资料是无用的。项目无回答要重新调查获得准确  相似文献   

13.
在抽样调查中,我们总希望能取得所要求的所有样本单位并获得关于所有样本单位特征的记录.然而实际情况并非如此,由于各种原因,我们并不能从所有的样本回答及问卷中的所有问题获得有用的数据,即对一些样本单位未能成功实现计量.我们称这类问题为“无回答”,它反映了调查活动中的一个明显‘缺陷”.下面我们对无回答的原因,无回答产生的统计影响以及减少无回答影响的方法进行一些探讨.  相似文献   

14.
温岭市调查队自1984年建队以来,作为国家抽中调查县,一直承担着国家和省级布置的农产量抽样调查任务,为上级提供了大量的统计调查数据。但是,对于面广量大的调查任务,县级调查人员疲于奔波,调查经费捉襟见肘,村级辅助调查员业务水平难以提高,基础工作质量难以保证,影响着调查数据的时效性与;隹确性。自2003年浙江调查总队开展农作物播种面积(对地调查)抽样调查工作以来,温岭调查队在开展农产量抽样调查工作中,从提高基层基础数据质量和工作效率、节约调查经费开支、有效开展统计调查等方面出发,进行大胆改革实践,综合利用调查网点,采取辅助调查员相对集中使用管理,一人负责多点多项调查的方法,取得了显著效果,现将我们的做法和经验与大家一起探讨。  相似文献   

15.
韩本三等 《统计研究》2015,32(1):102-109
本文提出了带异质线性趋势的动态二元面板模型的极大似然偏误纠正估计量和近似条件Logit估计量。我们给出了通常极大似然估计量偏误的解析形式,并提供了相应的估计方法。小样本实验表明近似条件似然函数可以很好的消除异质性参数的影响,而偏误纠正估计量可以显著的修正极大似然估计量的偏误。最后我们将本文提出的方法应用到现金红利支付模型。  相似文献   

16.
一、辅助信息及其分类 抽样调查是通过对样本的调查达到对总体目标量的估计。在抽样调查中,调查指标的样本信息是估计总体目标量必不可少的信息。通过对样本调查并对所得数据加以整理,获得调查指标在总体中分布的某些特征,由此给出总体目标量的估计。我们把调查指标的样本信息称为基本信息。由于样本是总体的一部分,抽样又是按照一定概率进行的,故样本提供的是不全面的且带有随机干扰的信息,这就是说,基本信息不仅信息量极其有限,而且这极其有限的信息在反映总体特征时常常伴有不可消除的偏差,这就必然使估计量精度受到一定限制。 …  相似文献   

17.
样本中的数据缺失势必会造成估计量精度的损失。为了尽可能减小损失,需要对缺失数据进行必要的弥补性处理。质量评估调查中出现的缺失数据有三种情况:住房单元未调查;个人的一部分人口统计特征遗漏;个人的匹配状态或住处状态悬而未决。对于上面说的数据缺失三种情况中的第三种情况,即由于悬而未决导致的数据缺失,在普查登记调查中也会存在,也要对其进行处理。因此,应用人口普查数据缺失插补方法技术,能解决上述问题。  相似文献   

18.
调查数据无回答在抽样调查中经常出现.无回答项目插补法是处理无回答的最主要方法之一,而辅助变量对提高插补值准确度非常重要.因此,研究调查数据无回答项目的高相关性辅助变量择优回归插补法,先筛选与目标变量间相关系数高的辅助变量,再建立回归插补模型.该方法的辅助变量选择过程简单,插补值准确性高.模拟例子演示了该方法的优良性.  相似文献   

19.
一、导言在已有的文献中,我们一般很难发现有关逃税现象访问调查的研究,究其原因是因为逃税问题对受调查者而言非常敏感使调查无法奏效的缘故。事实上,在这种针对敏感性问题的调查中,如果只是使用常规性的调查方法,受调查者一般不愿配合调查者作出真实的回答,他们要么不提供真实性数据,要么干脆拒绝调查。前者因此而造成“有回答误差”,后者则造成“无回答误差”。两种“误差”的存在使得最终调查结果缺乏基本的说服力,更无法将其推而广之。能否设计出一种与众不同的调查方法,使得受调查者敢于将真实的数据“和盘托出”而不必担心承担任何后…  相似文献   

20.
网络调查和传统纸质调查的差异性研究   总被引:5,自引:0,他引:5  
文章通过大学生消费问卷调查考察了网络调查与传统纸质调查在数据收集方面的差异性.结果表明,在单位无回答方面网络调查劣于纸质调查;但在项目无回答方面,明显优于纸质调查.对不同题目类型、行为问题和态度问题的数据分析结果表明,对两种调查方法来说.被访者对调查问卷的回答没有明显区别,即被访者对自身信息的揭露愿望,不受两种调查方法的影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号