首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 593 毫秒
1.
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题.本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计.实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析.随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量.这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴.  相似文献   

2.
金勇进  刘展 《统计研究》2016,33(3):11-17
利用大数据进行抽样,很多情况下抽样框的构造比较困难,使得抽取的样本属于非概率样本,难以将传统的抽样推断理论应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,以基于样本匹配的样本选择为例探讨了具体解决方法。  相似文献   

3.
很多全国性大型人口抽样调查项目中的核心技术包括抽样方案设计、样本单元的权数计算等。用样本数据推断总体,权数的作用很关键,尤其是抽样调查越来越难保证做到等概率抽样的情况。为此,采用第四次中国城乡老年人生活状况抽样调查中的具体调查方案和实际调查数据,系统地对抽样过程中的权数进行测算,同时根据权效应对权数进行调整和控制,利用刀切法对相关统计量的标准误差和变异系数进行对比分析,来验证权数控制在提高精度方面的有效性。结合老年人生活状况的调查数据进行实证分析,结果表明,利用刀切法计算权数截取的标准误差比未调整权数的标准误差更有效,得到变量的变异系数更小。  相似文献   

4.
自加权分层多阶段抽样设计具有三大特征:一为除第一阶抽样外其余各阶抽样的样本量均为常数,二为样本量按照各层的最终单元数量在各层比例分配,三为前几阶采用抽样而最后一阶采用放回或不放回的简单随机抽样。根据上述三个特征设计了中国人口变动调查的自加权抽样设计。  相似文献   

5.
卢山 《中国统计》2004,(3):24-25
顾名思义,事后分层方法是在抽样设计中(事先)没有进行分层处理的前提下,在数据处理阶段(事后),利用抽样框信息或者可靠的外部信息,对样本进行事后分层处理,对样本的权数进行调整,以达到提高估计量精度的效果。外部信息可以是各事后层(子总体)的单位数,也可以是各事后层(子总体)单位数占总体单位数的比重等,一般来源于抽样框信息,或者建立抽样框与样本调查期间进行的普查信息等。应用事后分层方法,需要遵循三点基本原则:第一,调查时点样本单位的属性决定该样本单位的推算归属;第二,样本单位的基础权数及其加权调整都决定于该样本单位在抽样框…  相似文献   

6.
文章在考虑环保投资现实情况和抽样调查操作可行性的基础上,提出了环保投资分层三阶段抽样.根据环境污染治理投资额规模进行分层,三阶段均采取随机起点系统抽样或者PPS抽样.在全国样本中的样本量已调查的情况下,根据抽取的全部样本进行事后分层和适当追加样本量,对省级(行业、城市等层次)目标量进行估计,同时满足全国、部分典型行业、部分典型城市、部分省市等多目标要求的环保投资目标量估计.  相似文献   

7.
吕萍 《统计研究》2017,(7):118-128
随着国内定量研究方法的开展和大型调查数据的免费公布,研究者不仅使用抽样调查数据对总体分析,还需要对域总体进行分析.本文对调查数据满足域精度推断的域估计问题进行研究.首先,根据实际调查中的域估计问题,指出解决域估计问题最好的方法是事先确定好需要估计的域,并在抽样设计时兼顾域的估计精度.但是,在实际调查中还包含计划外的域,通过对简单随机抽样下的域估计问题的研究,说明非计划域的估计问题的最大难点是域样本量的随机性.然后,针对实际中的抽样调查数据多来源于分层、多阶段、整群和不等概率等复杂抽样设计的问题,指出需要结合复杂抽样设计信息、域样本量的随机性、域样本在总体的误差层和误差群中的分布,对复杂抽样设计下的域估计问题进行研究.最后,以中国家庭追踪调查(China Family Panel Studies,CFPS)为例,对复杂抽样设计下的域估计问题进行案例研究.  相似文献   

8.
贺飞燕 《统计研究》2015,(2):109-110
一、研究背景在抽样调查中,我们需要给样本中的每个单元赋予一个权数,通过最终权数和观测值得到观测变量的估计值。加权过程应考虑到并校正覆盖不完整、抽样可变性和无回答的错误。加权进行得越好,估计的方差和偏差就会越小。权数的计算通常有以下三步:抽样权数即设计权数、无回答的调整和校准。其中抽样权数是在设计阶段计算的,无回答的调整是将设计权数通过无回答的补偿来调整,校准是通过已知总体的辅助信  相似文献   

9.
 在改革开放的新形势下,我国政府统计部门开展了农村住户等一系列农村统计调查,为解决“三农”问题提供了多方面的数据信息。本文通过分析总结现行农村住户抽样调查方案中存在的各种矛盾和问题,利用国际上前沿的连续性抽样调查方法作为理论基础,分别从农村住户抽样框的构建、连续各期调查样本的抽取、二维平衡轮换模式的设计、连续性抽样估计及其方差估计和连续时间序列数据的调整分析等角度提出一系列改革措施,从而设计出更加科学的调查方案,为及时、准确地搜集和提供关于“三农”问题的数据信息服务。关于其它类型的抽样调查方案亦可按照本文研究的思路类似地加以设计和解决。  相似文献   

10.
如何解决网络访问固定样本调查的统计推断问题,是大数据背景下网络调查面临的严重挑战。针对此问题,提出将网络访问固定样本的调查样本与概率样本结合,利用倾向得分逆加权和加权组调整构造伪权数来估计目标总体,进一步采用基于有放回概率抽样的Vwr方法、基于广义回归估计的Vgreg方法与Jackknife方法来估计方差,并比较不同方法估计的效果。研究表明:无论概率样本的样本量较大还是较小,本研究所提出的总体均值估计方法效果较好,并且在方差估计中Jackknife方法的估计效果最好。  相似文献   

11.
刘平 《统计研究》2004,21(12):58-4
"十一五"国家哲学社会科学研究规划,统计学科专家评审组于2004年9月11~12日在贵阳市召开了"统计学调研暨现代统计学研究"专家座谈会.会议总结了我国统计学科的发展现状,分析了统计学科的发展趋势,基本明确了我国统计学科需要着重研究的领域和方向.  相似文献   

12.
邓冰 《统计研究》2005,22(4):75-2
经济普查是一项国情国力的综合调查 ,调查的对象是从事第二、第三产业的全部法人单位、产业活动单位和个体经营户。与人口普查、工业普查等相比 ,经济普查调查的范围更全、涉及的领域更广。国家投入大量资金、人力、物力进行经济普查 ,得到的最终成果是经济普查数据资料。这些统计数据有 1 0 0 0余项指标 ,可谓非常全面和具体。如何开发应用这些原始数据资料 ,让经济普查数据更好、更方便地满足政府制订经济和社会发展规划的需求 ,服务于社会 ,将是摆在我们面前的一个迫切问题。有关“如何开发与利用经济普查数据”方面的讨论很多 ,有人主张…  相似文献   

13.
中国的基础设施发展与经济增长的实证分析   总被引:9,自引:0,他引:9  
踪家峰  李静 《统计研究》2006,23(7):18-21
一、引言最早对基础设施的认识,仅仅是从海港、码头与地区经济发展的关系来理解的。大部分研究是通过计算单个基础设施项目的总收益和总成本来分析基础设施投资对经济增长的贡献。一直到20世纪80年代。经济学家们才开始构建宏观经济模型并采用新的计量方法来衡量公共基础设施与经济增长之间的联系。1989年,Aschauer首先采用柯布-道格拉斯生产函数和利用美国年度的时间序列来分析公共基础设施资本和私人部门的总产出之间的关系。他发现基础设施存量每增加1个百分点,则能增加私人产出0·39个百分点,而核心基础设施(包括高速公路、机场等)的产…  相似文献   

14.
王小童  高昌林 《统计研究》2009,26(3):97-101
  本文介绍创新调查分析领域比较流行的CDM模型的由来、结构及其在创新调查分析领域的应用,依据全国工业企业创新调查指标对CDM模型进行了改进,尝试建立一个适合进行中国企业创新的微观实证研究的模型框架。  相似文献   

15.
综合评价技术的扩展思路   总被引:23,自引:4,他引:19  
苏为华  陈骥 《统计研究》2006,28(2):32-37
在分析目前综合评价技术单一化现象的基础上,对综合评价问题进行了思考,提出了若干综合评价技术的扩展思路,分别从评价主体,评价方法,评价的层次结构,评价的时间维度,评价的数据表现形式等方面进行了探讨,对群组评价,组合评价,分层评价,动态评价,区间数评等几种扩展技术进行了分析,为综合评价技术成为开放的系统提供了初步设想.  相似文献   

16.
舒元  黄新飞 《统计研究》2006,23(5):64-69
一、引言降低通货膨胀率或者通货收缩(disinflation)可能会带来产出和就业的损失,牺牲率(Sacrificeratio)是指降低通货膨胀率的成本,其具体测量是实际产出的损失变化与趋势通货膨胀率(trendinflation)变化之间的比率,它对于货币政策的制定起着非常重要的作用。是否降低通货膨胀率会产生较大的产出损失?①传统的观点认为如果降低通货膨胀率的速度比较慢,其产生的成本较低,工资水平和价格水平有足够的时间调整以适应收缩的货币政策。Sargent(1983)持相反观点,他认为降低通货膨胀率的速度越快,产生的成本越小,这是由于人们的预期能够及时对当…  相似文献   

17.
从“民工荒”看未来若干年农村劳动力的供求   总被引:6,自引:0,他引:6       下载免费PDF全文
2004年初以来,我国广东、福建、山东、浙江等地出现了“民工荒”,这是我国近二十年“民工潮”之后首次出现“民工荒”现象。“民工荒”现象引起了政府、学术界、媒体的广泛关注和争论,争论主要集中在以下三点:①真假问题之争。有人认为我国农村剩余劳动力仍很充裕,目前有1.5亿农村劳动力准备向非农产业转移,不要将“用工荒”误传为“民工荒”,“民工荒”是一个假问题。②是“民工紧”,不是“民工荒”。③“民工荒”是局部还是全面?这些争论是有意义的。为了回答这些问题,本文利用2000年第五次人口普查资料,给出了2006~2016年我国农村劳动力…  相似文献   

18.
政府统计改革千头万绪,只有抓住主要矛盾才能取得事半功倍的效果。近来,以调查队的整合为标志的统计体制改革取得进展,国家统计、地方统计、部门统计三位一体的格局愈见清晰。在此之时,如能将统计标准化建设放在较为重要的位置,抓住这一统计制度的细微之处做好“文章”,则是通往“内创和谐、外树信誉、优质服务”的快捷之路。一、统计标准和统计标准化标准是衡量事物的准则,统计标准则是统计活动过程中用以衡量统计对象的准则。统计标准的内容其实十分广泛,不只是各种统计分类,统计活动过程中所运用的概念、范畴、目录、编码、表式,特别是统…  相似文献   

19.
 内容提要:通胀环境下成本传导能力将是决定国际间和行业间利润流向的关键因素,本文提出并创建了成本传导能力模型,设计了成本传导能力指数及其变动指数,并实证测算了包含32个行业部门的成本传导能力指数及其变动指数。通过与行业利润对照发现,成本传导能力指数及其变动指数能够较好地反应各行业转嫁成本上涨的能力及其变动情况,是定量研究通胀环境下行业景气的基础性指标。成本传导能力模型的研究结论对我国控制通胀、战略性调整经济结构以及提高我国国际间成本传导能力具有政策意义。  相似文献   

20.
大股东侵害与上市公司资产评估偏差   总被引:11,自引:0,他引:11       下载免费PDF全文
一、问题的提出相对于证券市场上对独立审计问题的研究 ,对资产评估问题的理论和实证研究非常缺乏。陆德民 (1998)以1992年~ 1996年间沪深两市 2 6 2家公司为样本 ,最早尝试对公司上市前资产评估结果及其影响进行分析 ,研究发现公司资产结构、资本结构、证券承销方式、行业等因素对资产评估增值率具有一定的影响。肖时庆 (2 0 0 1)则通过考察资产评估结果与公司未来一定期间的经营性收益的关系 ,试图对公司上市前资产评估的准确性做出判断 ,文章的分析结果没有发现公司资产评估存在整体上的高估或低估行为。上述两项研究都是以公司上市前的…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号