首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
估计量的精度和样本量的确定是抽样设计中所关心的两个主要问题.在一定条件下,对于简单随机抽样,通过对初级样本的Bootstrap抽样可以提高均值估计量的精度.中心极限定理一直是抽样调查中确定样本量的主要理论依据,基本思想就是将标准正态分布作为给定统计量的近似分布.如果利用Bootstrap方法模拟近似分布,同样可以确定样本量.文章结合具体例子对两种方法确定的样本量进行了对比分析.  相似文献   

2.
概化理论又称为方差分量模型,其方差分量估计受限于抽样,不同的抽样样本估计的方差分量可能不一样.为了降低估计的误差,应该重视考察方差分量的变异量(如置信区间).Bootstrap方法是一种有放回的再抽样方法,可用于估计概化理论的方差分量置信区间.文章采用蒙特卡洛模拟技术,比较Bootstrap的PC和BCa方法估计概化理论方差分量置信区间的性能.结果发现:(1)与未校正的方法相比,校正的Bootstrap的PC和BCa方法估计概化理论的方差分量置信区间更为可靠;(2)校正的Bootstrap的BCa方法估计概化理论的方差分量置信区间,要优于校正的Bootstrap的PC方法.  相似文献   

3.
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题.本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计.实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析.随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量.这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴.  相似文献   

4.
小样本实验数据较小,工程上常用Bayes Bootstrap方法来估计小样本的参数问题,文章研究了置信度一定、样本量不同的情况下,用插值法自助扩充了小样本数据的样本量,对Bayes Bootstrap方法提出改进.最后,运用蒙特卡罗方法对具体算例建模仿真,验证改进方法的优越性.  相似文献   

5.
 在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现“事后”自加权设计。实现“事后”自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现 是一个比较合适的样本量。这一结论可能为其它大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。  相似文献   

6.
polya后验方法作为一种无信息贝叶斯估计方法,在有限总体抽样中,通过观测的样本,构造一系列的模拟总体,然后进行统计推断。通过统计模拟研究了polya后验方法估计的一些特点,并和Bootstrap方法进行比较。模拟结果显示:polya后验方法能够很好地估计总体的均值,随着样本量的增大,估计值与真值的差距越来越小。采用polya后验方法构造的置信区间区间长度较小,能够很好地覆盖真值。  相似文献   

7.
Bootstrap方法在非参数核估计中的研究与应用   总被引:1,自引:0,他引:1  
当数据中存在异常值时,Bootstrap样本可能比原有样本舍有更多的"污染",这会影响要进行的统计推断的有效性.文章讨论了在非参数回归N-w估计中,如何利用影响函数(influencefunction)得到重新抽样的概率,使用调整后的非等概率Bootstrap抽样方法得到曲线的拟合,从而达到有效地抵制异常值对回归函数影响的目的.数值模拟的结果表明了这种处理方法的有效性.  相似文献   

8.
常见的放回抽样等方法操作比较简单,但缺点是有效样本量是不确定的,而是取决于抽样的随机结果.文章对PPS抽样和泊松抽样下有效样本量的性质进行了研究,通过数理推导和统计模拟揭示了有效样本量的分布特征,给出了特定条件有效样本量的置信区间.  相似文献   

9.
主成分抽取数量的确定是主成分分析中的关键问题.文章提出一种新的确定方法,首先采用加速系数和最优协调两个数量指标来确定主成分抽取的数量;然后基于Bootstrap再抽样数据采用Horn平行检验来验证主成分数量模型的稳定性.实例研究表明,本文提出的方法,相比特征值大于1、解释的总方差比例和Scree图形等方法,结果更客观、准确和稳定,可广泛应用于主成分分析等相关研究中.  相似文献   

10.
文章基于相对危险度提出了一个与以往不同的假设检验问题,并就此检验问题,在配对设计下用Fisher信息阵方法构建了Score检验统计量,通过Monte Cado方法模拟,发现Score检验有优良的统计性能,因为它很好地控制经验第一类错误率,且经验第一类错误率与给定的显著性水平很接近,是一个理想检验.  相似文献   

11.
当对插补所得的“完整数据集”使用标准的完全数据统计方法的时候,往往会低估插补估计量的方差.Bootstrap方法(自助法)是非参数统计中的一种重要的统计方法,是基于原始观测数据进行重复抽样,能充分的利用已知数据,不需要对未知总体进行任何的分布假设或增加新的样本信息,进而再利用现有的统计模型对总体的分布特性进行统计推断.本文首先运用多重插补的方法对缺失数据进行了插补,之后利用Bootstrap方法对插补之后的数据进行了插补统计量的方差估计,结果表明运用Bootstrap方法进行插补统计量的方差估计更科学更准确.  相似文献   

12.
多阶抽样样本量的最优配置   总被引:2,自引:0,他引:2       下载免费PDF全文
俞纯权 《统计研究》1995,12(3):22-24
多阶抽样样本量的最优配置俞纯权一、问题的提出多阶抽样是抽样调查中一种常用的抽样方法。所谓多阶抽样,就是把总体分成不同级别大的抽样单位中抽样,再在抽中的单位中对级别小的抽样单位抽样,依次进行下去,直到在级别最小的抽样单位即调查单位中完成抽样为止。多阶抽...  相似文献   

13.
 当误差项不服从独立同分布时,利用Moran’s I统计量的渐近检验,无法有效判断空间经济计量滞后模型2SLS估计残差间存在空间关系与否。本文采用两种基于残差的Bootstrap方法,诊断空间经济计量滞后模型残差中的空间相关关系。大量Monte Carlo模拟结果显示,从功效角度看,无论误差项服从独立同分布与否,与渐近检验相比,Bootstrap Moran检验都具有更好的有限样本性质,能够更有效地进行空间相关性检验。尤其是,在样本量较小和空间衔接密度较高情况下,Bootstrap Moran检验的功效显著大于渐近检验。  相似文献   

14.
空间误差分量模型(Spatial Error Components,SEC)传统的空间相关性LM检验存在严重的水平扭曲和较低的检验功效,导致检验统计量失效.文章将Bootstrap方法应用于SEC模型的空间相关性LM检验,提高检验统计量的有效性.Monte Carlo模拟实验表明,Bootstrap LM检验的水平受误差项分布、空间权重矩阵和样本量影响较小,并且远优于渐近LM检验,具有理想的检验水平;渐近LM检验和Bootstrap LM检验的功效均随着空间相关性的增强,及样本量的增大而增大,但Bootstrap LM检验在各种情形下均具有更高的检验功效,尤其是样本量较小时.简言之,Bootstrap LM检验是SEC模型更为优越的空间相关性检验方法.  相似文献   

15.
宋子轩  冷燮  陈瑶瑶 《统计研究》2012,29(7):96-100
 样本代表性直接牵扯到统计数据质量和统计公布引起的民众反响,目前社会上不乏对政府统计数据的质疑之声,最终影响到政府统计机关的公信力,因此有必要重新审视现行样本代表性的研究。目前相关文献普遍强调不同抽样方式下的样本代表性的相对性内涵,确保样本的代表性仅从抽样方法和样本量两个维度入手,缺乏对既定抽样方法下样本代表性的事后评估体系的探索,以及多样本之间样本代表性优劣的比较方法研究。鉴于此,本文在结合人口普查数据基础上尝试从样本-总体整体分布和内部属性结构两个方面构建样本代表性事后评估的一整套指标和假设检验,进而找到一种多样本代表性比较的依据。最后对浦东新区2010年城镇居民收入调查样本进行了代表性检验的尝试。  相似文献   

16.
使用Monte Carlo模拟技术生成多项分布数据,比较四种Bootstrap方法估计概化理论方差分量置信区间的性能,四种Bootstrap方法分别是Bootstrap-PC、Bootstrap-t、Bootstrap-BCa和Bootstrap-ABC方法.结果表明:(1)从整体上看,四种Bootstrap方法估计方差分量置信区间的包含率,校正的Bootstrap方法要优于未校正的Bootstrap方法;(2)校正的Bootstrap-PC和Bootstrap-t方法相当,校正的Bootstrap-BCa与Bootstrap-ABC方法相当,校正的Bootstrap-BCa和Bootstrap-ABC方法要优于校正的Bootstrap-PC和Bootstrap-t方法.  相似文献   

17.
关于样本量计算方法的比较研究   总被引:1,自引:0,他引:1  
在设计抽样方案时样本量的确定是一个重要内容,确定样本量需要综合考虑精度、置信水平、抽样方式、费用等多方面因素.文章首先对费用一定误差最小或误差一定费用最少时的最优样本量进行分析,然后利用简单随机抽样的样本量和设计效应研究复杂抽样的样本量,最后根据社会调查的经验总结出针对不同总体规模和目的的样本容量范围,为抽样设计提供参考依据.  相似文献   

18.
本文引入局部趋势概念,研究数据生成和检验式都含有趋势单位根过程中伪t检验量的分布,结果表明该分布为标准正态分布与第四种DF分布的混合体,并揭示了向这两类分布转化的条件.为摆脱伪t检验量受到特定参数约束而不能用于实证分析的困境,本文提出了Bootstrap检验方法,并从理论上证明该方法可用于水平检验和功效研究,埃奇沃思展开进一步证实该方法能够降低水平扭曲.蒙特卡洛模拟结果显示,Bootstrap检验量具有最高检验正确率,检验功效在一定条件下也能与标准正态分布的检验结果相媲美,说明Bootstrap方法可以用于此类模型的单位根检验.  相似文献   

19.
文章针对正态分布数据,对比Traditional方法、Bootstrap方法和MCMC方法在两侧面交叉设计(p×i×h)和两侧面嵌套设计(p×(i:h))下各个方差分量的估计精度,为实际应用提供参考。使用R软件模拟1000批数据,并在R软件上实现三种方法的方差分量及其变异量估计。结果表明:(1)相较于Traditional方法和MCMC方法,相同条件下,Bootstrap方法估计的方差分量及其变异量结果更为理想;(2)对于两侧面交叉设计和两侧面嵌套设计,在正态分布数据下,建议优先使用Bootstrap方法。  相似文献   

20.
为帮助精算师在不同的数据环境下选择最优的准备金评估方法,美国非寿险精算师协会组织开发了一个产生模拟索赔数据的开源软件系统——损失模拟模型,然而损失模拟模型是否能够按指定参数要求产生模拟数据需要进行检验.文章采用不同的参数估计方法和拟合优度检验方法对模拟索赔次数的分布、索赔额的趋势以及不同险种索赔次数之间的相关结构进行了统计检验,结果表明损失模拟模型对索赔次数的分布、索赔额的趋势能够产生一致的模拟,而对索赔次数数据之间相关结构的模拟存在不稳定性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号