首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 209 毫秒
1.
处理缺失数据中辅助信息的利用   总被引:2,自引:0,他引:2       下载免费PDF全文
金勇进 《统计研究》1998,15(1):43-45
统计分析中经常会遇到数据缺失的情况。数据缺失的产生背景不同,主要来自于调查中的无回答。此外,由于调查员的疏忽,在调查过程中遗漏了某些调查项,或在对调查数据的检查与处理过程中,发现一些不合逻辑,明显有误,或有意使假的数据,而将其剔除,这些都会造成数据缺失。 缺失数据造成的危害是明显的,它不仅使接受调查的实际单位数目减少,扩大了抽样调查中的估计量方差,而且还会导致估计量偏差,是影响统计数据质量的重要方面。一般而言,对于缺失数据,往往需要进行重新调查,以便将缺失的数据补齐。但有时由于种种原因和条件的限制,或者无法进行重新的补充调查,或者这种补充调查仍然不能解决问题。这时,我们特别关心两个问题:一是需要了解缺失数据造成的影响有多大,即能否对由于数据缺失带来的估计量偏差进行估计;二是如何对缺失数据进行补救。这两个问题都与辅助信息有关,本文拟就这些问题进行分析。  相似文献   

2.
计算机技术在统计创新中的应用   总被引:1,自引:0,他引:1  
一、计算机技术对统计数据收集的创新 从数据收集的角度来讲,数据可以分为两类,即原始资料和次级资料. 1、原始资料的收集.原始资料是实际发生的,还没有经过处理的信息.原始资料的收集需要有专门的组织形式和调查方法.传统的统计调查分为普查和非普查两个大类.普查是对一定范围内调查对象普遍的、全面的调责.其范围可以是不同的行政区域、自然区域甚至是全国.由于普查是对全部调离对象进行调查,没有遗漏,也不存在对未调责对象的推算和估计,因此,普查是了解全面情况的基本方法.其他非普查方法,如抽样调查、重点调查和典型调查等调查方法,其共同的特点就是收集总量中的某个小区域的数据,然后对未知总体进行推断.  相似文献   

3.
当身体出现不适时,购买非处方药是公众最为常用的保健方式。目前市场上非处方药有6万多个品种,即使是治疗同一种疾病,也有来自不同生产厂家的多种药品,这些药品在剂量、用法、价格等方面存在很大不同。如何根据自己的经济条件、生活环境、个人习惯等因素来选择适合的药品,是消费者购药时最关心的问题。  相似文献   

4.
网络调查和传统纸质调查的差异性研究   总被引:5,自引:0,他引:5  
文章通过大学生消费问卷调查考察了网络调查与传统纸质调查在数据收集方面的差异性.结果表明,在单位无回答方面网络调查劣于纸质调查;但在项目无回答方面,明显优于纸质调查.对不同题目类型、行为问题和态度问题的数据分析结果表明,对两种调查方法来说.被访者对调查问卷的回答没有明显区别,即被访者对自身信息的揭露愿望,不受两种调查方法的影响.  相似文献   

5.
笔者从2005年第二期《中国统计》第63页中看到,《全国主要经济统计指标》公布表,主要公布了工业、交通、固定资产投资、贸易、财政、金融、证券、物价九个大类、69个项目的数据统计。从每一大类的各项目的统计数据表明,我国经济发展是形势喜人的,这些统计数据对一般统计工作部门以外的人来说,作为这些统计数据是基本够用了。但是作为经济学者、统计分析人员和中高层决策领导、经济战线的管理人员和境外同行来说,这些统计数据是非常不够的。如我们要了解我国2004年每万元工业增加值消耗的能源是多少?每万元工业增加值原材料消耗是多少?工业固…  相似文献   

6.
一、引言 灰色系统理论把社会系统、经济系统、生态系统这些抽象系统称为本征性灰色系统,通常用一系列时间序列、指标序列或空间分布序列来代表这些系统的行为特征数据,如某地区某年的社会人口增长指数、国民经济生产总值、某年某月的地区降水量等等,其中每一个序列中的数据元实际上就是某一个坐标轴上的数据点,多个序列构成了多维空间.对于非本征灰色系统,如受噪音干扰的技术系统、人体系统、电力系统等等,同样其行为特征数据也可以用一系列的数据序列来表示,每个序列中的数据元也都是某一数轴上的一些点.随着灰色系统理论的发展,其应用领域得到了不断的拓宽,尤其是在工程领域中的应用.但其应用仍然是围绕着某个或多个数据序列,数据序列中的数据元素依然还是一维数轴上的一些点.  相似文献   

7.
正主持人导语(中国人民大学应用统计科学研究中心高敏雪教授)测量社会发展的信息化程度,需要相关统计数据的支持。这些数据来自哪里?一方面是针对企业、住户、个人等用户做调查,了解经济活动以及日常生活的信息化程度及其方式,这是从信息使用方取得数据;  相似文献   

8.
在社会调查和市场调查中,经常要调查人们的观点、态度等主观问题,搜集的数据大部分为定性数据(即分类和排序数据).笔者发现对该类数据的分析大多还是局限在频数、频率和交叉汇总分析.而大量调查数据中包含的许多有用信息却得不到利用,这是因为许多统计方法不能直接对定性数据进行分析,因此如何对定性数据作进一步的统计分析,如显著性检验、相关分析、回归分析、多元变量分析等,是调查数据分析中十分必要的内容.  相似文献   

9.
吕萍 《统计研究》2017,(7):118-128
随着国内定量研究方法的开展和大型调查数据的免费公布,研究者不仅使用抽样调查数据对总体分析,还需要对域总体进行分析.本文对调查数据满足域精度推断的域估计问题进行研究.首先,根据实际调查中的域估计问题,指出解决域估计问题最好的方法是事先确定好需要估计的域,并在抽样设计时兼顾域的估计精度.但是,在实际调查中还包含计划外的域,通过对简单随机抽样下的域估计问题的研究,说明非计划域的估计问题的最大难点是域样本量的随机性.然后,针对实际中的抽样调查数据多来源于分层、多阶段、整群和不等概率等复杂抽样设计的问题,指出需要结合复杂抽样设计信息、域样本量的随机性、域样本在总体的误差层和误差群中的分布,对复杂抽样设计下的域估计问题进行研究.最后,以中国家庭追踪调查(China Family Panel Studies,CFPS)为例,对复杂抽样设计下的域估计问题进行案例研究.  相似文献   

10.
王珏 《上海统计》1998,(4):37-38
一、建立企业开放型的综合性统计工作模式是时代的要求首先,建立开放型的综合性统计工作模式是企业生存的需要.随着社会经济和社会分工的不断发展,一个企业要想生存,必须依赖自己的周围环境.企业要想适应周围环境,就必须对周围环境进行调查和分析.从而制定相应的措施和对策,而调查分析离开统计是不行的.统计从某种意义上说,不但是调查研究的重要方法,而且也是分析情况、传递信息的重要手段.没有统计,企业便犹如人失之耳目.上述这些要求对那种单一的、封闭式统计工作模式来说是无能为力的.只有开放型的综合性统计工作模式才能胜任.  相似文献   

11.
在市场经济的社会生产活动中,我们常常需要对许多问题进行决策,例如:对某一地区是否要进行房地产开发;某一产品是否要进行大规模批量生产;某地区是否需要设立一个商店,等等。在对这些问题进行决策的同时,我们往往会发现有许多决策者自己无法控制的随机因素存在,这样我们就会想到先进行一些抽样调查,在调查的基础上再作出决策,因为显然有信息的决策要比没有信息的决策明智而可靠得多。为此本文对同样的决策问题,讨论经由抽样获取有关总体状态额外信息后,如何应用Bayes方法,使这些信息帮助决策者作出更正确的决策。  相似文献   

12.
日前,我们对全镇104家规模企业开展了一次调查,分析了当前企业统计工作存在的问题和原因,并针对这些问题提出建议。 一、企业统计工作存在问题 1.企业领导对统计工作不够重视。多数企业领导认为对一个企业来说,只要会计把账做好,统计数据无关紧要,对统计工作关注不够,统计人员地位不高,待遇不好,人员调动频繁、队伍不稳,妨碍了统计数据的延续性、上报报表的时效性和数据质量的可靠性。  相似文献   

13.
随着医药体制改革的深化,药品市场的放开,药品经营日趋繁荣活跃。但药品市场良莠不齐,假药制售、无证经营等活动严重扰乱了药品市场秩序,损害了群众利益,特别是农村药品市场存在的问题令人担忧。近日,国家统计局四川调查总队对双流县、邛崃市、宜宾县、武胜县、东坡区等县区的农村药品市场进行了走访调查,发现当前农村药品市场主要存在四个方面的问题。部分药品销售人员未经专业培训从调查的情况来看,许多药品销售人员未经专业培训,素质不高,缺乏一些基本的药理知识。双流县有药品经营企业404家,从业人员1200多人。其中,配送店395家,从业人…  相似文献   

14.
一、问题的提出为了适应市场经济发展的需要 ,在统计上 ,抽样调查方法日益得到推广 ,在广东省的应用已从过去的农产量、城市住户调查 ,发展到目前正在实施的农业、小型工业和小型商业企业的抽样调查。我们都知道 ,在抽样设计科学合理的前提下 ,样本单位调查数据质量的好坏直接影响到推算结果的准确性。但是在现实的调查过程中 ,我们发现调查数据失真的情况较为严重。如何提高调查数据的质量 ,是我们需要重点研究的课题之一。为了让大家对小规模企业调查数据的失真程度有一个感性的了解 ,请先看下面的两组数据 :( 1) 4 86 0 ,35 0 0 ,10 0 0 …  相似文献   

15.
引言 近些年来,世界各地统计机构正面临着越来越大的压力,需要提高统计编制效率,特别是节约成本和人力资源.与此同时,减轻调查对象负担的要求也愈加迫切.迫于以上压力,统计人员正想方设法以其他方案替代传统调查方案收集数据.当然,最明显的方案是看其他渠道是否已有可用数据.许多非统计机构以各种形式收集数据,虽然这些数据很少能直接...  相似文献   

16.
在社会经济的调查中有时会涉及一些敏感性问题。例如,巾场工商管理部门要了解个体户漏税的比例有多大;计划生育部门要了解在已婚的育龄妇女中有多少人采取了避孕措施;公安部门要了解吸毒者人数的比例;学校要了解考试中学生作弊的情况等等。对于这类问题,容易引起被调查者的反感,他们或者不提供真实情况或者拒绝回答,从而使调查失败。一般而言,在调查中应尽量避免此类问题,以保证调查资料的质量,但如果研究的课题就是这类敏感问题,在调查中就无法回避。为了获得对这类问题总体比例进行估计的资料,就需要采用随机化回答技术,本文拟对此介绍一下随机化回答技术的应用。  相似文献   

17.
论抽样调查中的域估计   总被引:2,自引:0,他引:2  
抽样调查中经常涉及到域估计的问题.域是对子总体的一种描述,域可以按管理层次或地理区域划分,如各个地区、省、市、县、乡等行政机构;也可以按照调查对象的不同类别划分,如产值中的类值,或按照年龄或性别划分的人群组.抽样调查中不仅要对总体目标量进行估计,在许多情况下也需要对域的目标量进行估计,政府统计中讨论的"抽样调查如何满足多层次需要"实际上就是域估计问题.进行归纳,域估计的方法有两类:直接估计和间接估计.  相似文献   

18.
施国柱 《上海统计》2000,(12):30-32
一、问题的提出笔者一直从事市场调查的实践和研究.在用SPSS、Excel等大型数据处理软件进行调查问卷汇总和分析时,发现它们在分析数据时固然有操作简单、迅速、全面的优点,但在数据报表汇总中总存在着几个问题:第一,由于程序的某一部分不可控制而使汇总结果总存在着一点缺陷;第二,报表格式不灵活,需要大量人工操作,浪费人力和时间;第三,在不同处理过程中传递数据有困难.  相似文献   

19.
在实际应用中,一个数据库系统的数据基本模式(物理模式,概念模式,用户模式)往往是相对不变的,而数据统计模式却可能是经常变化的,这是因为面对变化中的市场,变化中的管理方式和变化中的组织结构,企业决策人员可能经常需要新的某种统计结果,要求应用系统能够快速提供出来.对于已经投入运行的应用系统来说,这往往就意味着要开发新的统计功能.如果有一个能够快速反应的工具,无疑具有重要意义.但是,有关的文献中更多地关注数据的基本模型设计,缺少对统计数据模型设计的论述.这要解决好两个问题:如何定义统计模式和如何生成统计.对第一个问题我们设计了统计数据定义语言S-DDL,对第二个问题通过生成程序代码方式解决.本文介绍了我们对统计数据模式化的研究和统计数据定义语言S-DDL.  相似文献   

20.
为了弄清被试产品的寿命分布,求出各项可靠性指标,常常需要进行删失试验.如何对得到的这些数据进行处理是生存分析需要解决的一个重要问题.本文针对这个问题提出了贝叶斯威布尔生存回归模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号