期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

巩红禹《统计与信息论坛》2017,(4):8-15

规下工业抽样调查是社会经济统计调查的重要组成部分,为国民经济核算提供基础数据,而样本代表性直接决定统计推断结果。对企业目录库抽取平衡样本,能够使得样本结构与总体结构相似。平衡样本是指满足如下条件的样本:辅助变量的汉森赫维茨估计等于总体总量真值。平衡抽样设计需要包含丰富辅助信息的完善抽样框,政府统计数据能够为此提供足够的支撑。基于2009年工业企业数据库的实证分析表明,平衡抽样设计对总体总量的估计相对误差很小,特别是估计的均值与总体真值非常接近,近似无偏;与简单随机抽样比较,平衡抽样设计更加有效。相似文献

2.

抽样调查中基于模型推断的思考

巩红禹王丽艳《统计与决策》2012,(13):12-16

基于抽样设计推断与基于模型推断是有限总体推断的两个不同途径。文章针对基于模型的推断方法-最优线性无偏估计(BLUE)进行了讨论,指出在特定的超总体模型下,BLUE与基于抽样设计的估计是一致的。数值分析解释了模型推断的优越性。相似文献

3.

复杂抽样推断方法体系的比较研究

金勇进贺本岚《统计与信息论坛》2011,26(10):3-8

对复杂样本进行推断通常有两种体系,一种是传统的基于随机化理论的统计推断,另一种是基于模型的统计推断。传统的抽样理论以随机化理论为基础,将总体取值视为固定,随机性仅体现在样本的选取上,对总体的推断依赖于抽样设计。该方法在大样本情况下具有稳健估计量,但在小样本、数据缺失等情况下失效。基于模型的抽样推断认为总体是超总体模型中抽取的一个随机样本,对总体的推断取决于模型的建立,但在不可忽略抽样设计下估计量是有偏估计。在对这两类推断方法分析的基础上,提出抽样设计辅助的模型推断,并指出该方法在复杂抽样中具有重要的应用价值。相似文献

4.

有限总体的估计——基于超总体模型

艾小青金勇进《统计教育》2009,(2):3-6

抽样调查下有限总体的估计，一般是基于传统抽样设计，另一种是基于超总体模型，即假定总体取值不是确定的，而是由超总体模型产生的。本文以简单随机抽样和抽样为例，揭示了在不同情况下，如何得到超总体模型下有限总体的估计，并对基于设计和基于模型两种观点进行了比较分析。相似文献

5.

改进样本代表性的多目标追加平衡设计

巩红禹陈雅《统计研究》2018,35(12):113-122

本文主要讨论样本代表性的改进和多目标调查两个问题。一,本文提出了一种新的改进样本代表性多目标抽样方法,增加样本量与调整样本结构相结合的方法-追加样本的平衡设计,即通过追加样本,使得补充的样本与原来的样本组合生成新的平衡样本,相对于初始样本,减少样本与总体的结构性偏差。平衡样本是指辅助变量总量的霍维茨汤普森估计量等于总体总量真值。二,平衡样本通过选择与多个目标参数相关的辅助变量,使得一套样本对不同的目标参数而言都具有良好的代表性,进而完成多目标调查。结合2010年第六次人口分县普查数据,通过选择多个目标参数,对追加样本后的平衡样本作事后评估结果表明,追加平衡设计能够有效改进样本结构,使得样本结构与总体结构相近,降低目标估计的误差;同时也说明平衡抽样设计能够实现多目标调查,提高样本的使用效率。相似文献

6.

混合类型辅助变量下模型校准抽样估计研究

毕画伍业锋《统计研究》2017,(9):120-128

在超总体模型中,一般用于构建模型的辅助变量多为连续型变量,对混合类型辅助变量的模型研究较少.为了同时利用与研究变量相关的连续型和离散型辅助变量的信息,本文提出在模型校准的框架下,利用非参数核回归方法,得到混合类型辅助变量下的模型校准估计量.研究证明,该估计量是渐进设计无偏、设计一致和渐进正态的,并给出了估计量的方差和方差的估计量.数值模拟的结果显示,本文在总体回归函数为线性和非线性的情况下,估计效果均有所提高.此外,通过CLHLS数据的验证也表明该估计量的效果优于仅利用连续型辅助变量的估计量. 相似文献

7.

权数对基于模型推断的影响分析

《统计与信息论坛》2022,(3):3-13

利用抽样调查数据对总体参数进行推断通常分为两种途径：一种是基于设计的推断体系；另一种是基于模型的推断体系。基于设计的推断以随机化理论为基础，推断依赖于抽样设计，在大样本下估计量具有无偏性和一致性，但在样本量较小或存在非抽样误差等情况下效率较低。基于模型的推断认为有限总体是一个来自无限超总体的随机样本，推断依赖于模型假设，构建超总体模型具有很大的灵活性，有利于充分利用总体辅助信息并提高估计精度，但在模型假定有误或样本的入样过程不具有无信息性时存在估计误差。如何将两种推断途径相结合，在体现样本对总体代表性的同时，保证估计效率和估计量的优良性质，尚待研究。权数在基于设计的推断中起着核心作用，能够反映抽样设计对样本的影响，实现样本对总体的还原。将权数引入基于模型的推断，可以使基于模型推断的结果具有总体代表性，能更好地发挥两种推断体系的组合优势，并削弱模型假定对推断效果的影响。据此，从权数对于模型推断的影响入手，针对因果推断问题，提出将权数同时引入倾向得分模型和预测模型的建模过程，来构造双稳健估计的方法，并通过模拟研究加以验证。最终结果表明，根据文章所提出的方法进行处理效应的估计，能够充分发挥权数的作用，得到更准确、更稳健的估计结果。实证部分采用2017年CGSS调查数据进行分析，进一步说明在基于调查数据进行模型推断时应充分考虑抽样设计的影响，为科研人员进行因果推断以及其他基于调查数据开展的研究提供参考。相似文献

8.

大数据背景下网络调查样本的建模推断问题研究——以广义Boosted模型的倾向得分推断为例

刘展潘莹丽《统计研究》2019,36(9):93

随着大数据和网络的不断发展,网络调查越来越广泛,大部分网络调查样本属于非概率样本,难以采用传统的抽样推断理论进行推断,如何解决网络调查样本的推断问题是大数据背景下网络调查发展的迫切需求。本文首次从建模的角度提出了解决该问题的基本思路：一是入样概率的建模推断,可以考虑构建基于机器学习与变量选择的倾向得分模型来估计入样概率推断总体;二是目标变量的建模推断,可以考虑直接对目标变量建立参数、非参数或半参数超总体模型进行估计;三是入样概率与目标变量的双重建模推断,可以考虑进行倾向得分模型与超总体模型的加权估计与混合推断。最后,以基于广义Boosted模型的入样概率建模推断为例演示了具体解决方法。相似文献

9.

经济社会调查中的空间平衡抽样设计

《统计与信息论坛》2018,(11):3-10

在经济社会调查中,总体单元之间的空间相关性普遍存在,对传统抽样设计提出了挑战。针对这一问题,提出了使用经纬度坐标作为空间辅助信息,借助空间平衡抽样算法获取样本的设计思路。该种算法利用总体单元之间的空间距离设计抽样算法更新包含概率,使空间上距离较近的单元倾向于不同时进入样本,从而使样本单元在空间上均匀覆盖。实证研究结果表明,随着样本量连续增加,空间平衡抽样设计的估计量标准差在合理的抽样比范围内总是优于传统抽样设计,能够显著提高估计效率。相似文献

10.

迭代方法在多目标总体抽样调查中的应用

下载免费PDF全文

卢山《统计研究》2005,22(3):53-5

一、问题的提出在抽样调查实践中经常会遇到多目标抽样问题 ,包括多目标变量问题和多目标总体问题。多目标变量问题 ,是指用一套样本估计多个目标变量的总量、均值、比率和比例等估计量时 ,由于各个变量的总体分布不一致 ,导致不同变量的估计量精度 (一般用相对误差表示 )不同 ,而且可能相差很大。在实践中 ,多目标变量问题是一个普遍问题 ,因为任何一项调查都不可能仅仅调查一个指标 (即变量 )。解决多目标变量问题的关键是在抽样设计中选择合适的辅助变量。一般来说 ,在抽样设计中作为分层辅助信息的变量的估计量精度会比其他变量的估计量… 相似文献

11.

基于排序集样本和辅助变量中位数的均值比率估计方法

乔松珊张建军孙成金《统计与信息论坛》2016,(7):11-15

排序集抽样下利用辅助变量中位数构建了总体均值的改进比率估计模型,分析了该比率估计量的偏差和均方误差,并与简单随机抽样下的比率估计比较,证明了改进后的比率估计均方误差更小。以农作物播种面积和产量为研究对象进行实例分析,研究表明,基于排序集样本和辅助变量中位数的比率估计方法可以有效提高估计精度,验证了该构造方法的可行性。相似文献

12.

并发多样本滚雪球抽样的捕获再捕获估计

米子川《统计研究》2015,32(6):99-104

滚雪球抽样是一种非概率抽样方法,一般采用线索触发的方式进行抽样,通过同伴推荐和再推荐来逐次抽取并组织样本。本文引入捕获再捕获抽样估计方法对并发式多样本滚雪球抽样的总体规模进行估计,比较了Peterson、Chapman等的估计方法,提出了以并发式加权线性模型去估计总体规模的基本思路,在本文设计的三种估计量中,共权估计量方差最小,离散性质局部最优。最后,对一个真实的滚雪球抽样调查过程进行了实证分析。相似文献

13.

敏感问题乘法模型的RRT分层三阶段抽样最优样本量设定

周霞《统计与决策》2016,(11):8-12

文章研究数量特征敏感问题的乘法模型在随机应答技术(RRT)分层三阶段抽样方法下的最优样本量的问题.根据RRT分层三阶段抽样方法给出数量特征敏感乘法模型的调查设计方法,计算出总体均数的估计量及其方差.应用拉格朗日乘数法,给出了两种情况下的最优样本量,一是抽样误差限定而调查费用达到最小情况下的最优样本值,二是调查费用限定而抽样误差达到最小情况下的最优样本值.并计算出抽样误差一定时最小的费用及费用一定时最小的抽样误差. 相似文献

14.

分层排序集抽样下的比率估计问题探讨

陈晓旭朱永忠《统计与决策》2017,(20):15-18

分层排序集抽样是指将分层抽样与排序集抽样结合起来,运用分层技术将总体分为多层,再在每层中用排序集抽样获取样本.分层比率估计是利用辅助信息,构造总体均值或总值的估计量,分为联合比率估计和分别比率估计.文章利用此思路得到下分层排序集抽样下总体均值的分别比率估计,并和分层排序集抽样下的联合比率估计、分层随机抽样下的分别比率估计进行比较.结果表明,分层排序集抽样下总体均值的分别比率估计比分层随机抽样下总体均值的分别比率估计效果好,分层排序集抽样下总体均值的联合比率估计比分层排序集抽样下总体均值的分别比率估计效果好. 相似文献

15.

连续性抽样调查中总体均值的估计

高莉菁《统计与决策》2015,(1):87-90

在连续性抽样调查中,利用前期信息和辅助信息可以大大提高估计精度,但是以往的估计量大多假设辅助信息总体均值已知,文章介绍一种在连续性抽样调查中,辅助信息总体均值未知的情况下,通过两阶段抽样,利用轮换样本方法和辅助变量信息,对总体均值进行估计的新的估计方法,并将新提出的估计量与原有的估计量进行比较,发现其精度更高,而且有利于减少调查成本。相似文献

16.

基于半参数方法的模型辅助抽样估计研究

容越彦陈光慧《统计研究》2015,32(12):88-94

在总结现有模型辅助估计方法的基础上,本文通过构造一种半参数超总体模型,同时结合广义差分估计思想提出一种新型的模型辅助估计量。该估计量比传统的非参数和半参数回归估计利用更少、更易得到的辅助信息,即只需利用和广义回归估计相同的辅助信息,但一般会比广义回归估计拥有更高的估计精度。理论证明了该估计量是渐近设计无偏和设计一致的,其渐近设计均方误差为广义差分估计量的方差。模拟结果显示：其至少与广义回归估计一样好;对于线性程度越低的超总体模型,其估计精度比广义回归估计有越明显的提高;就本文模拟而言,光滑参数在0.04～0.12间适当取值时其会取到相对较好的估计效果。相似文献

17.

住户调查中代表性样本的一种探索获取方法——平衡抽样设计

巩红禹金勇进《统计研究》2015,32(9):84-90

住户调查是我国社会经济统计调查体系的重要组成部分,样本代表性直接决定统计数据质量。多阶段抽样中初级单元的方差对估计的影响是主要的,因此本文结合2010年全国第六次人口普查分县数据,采用平衡抽样设计获取初级单元的代表性样本-平衡样本。对代表性样本的事后评估结果表明,样本结构与总体结构吻合,目标估计的误差很小,说明了本文平衡设计的有效性。相似文献

18.

抽样调查中基于模型的稳健预测方法

巩红禹贺本岚王丽艳《统计与决策》2012,(16):4-7

基于模型的推断是抽样技术中推断估计量的一种重要方式。文章研究得出,当比率估计模型或者扩张估计模型偏离总体真实模型时,比率估计和扩张估计往往是有偏的,平衡样本能够消除比率估计和扩张估计的偏倚,使得估计量是偏倚稳健的。相似文献

19.

怎样合理利用辅助变量

刘军郑少智《统计与决策》2004,(6):135-136

一、什么是辅助变量在抽样调查中,把变量按照其作用分为调查变量和辅助变量两种.调查变量指的是要估计的变量,如在农村经济抽样调查中,要估计粮食总产量、农村住房总收入等指标.辅助变量是指为提高调查变量的估计精度,在抽样或估计阶段引入的其他变量,比如,以农村住户作为抽样单位,以住户的粮食播种面积比例为抽取概率,实施PPS抽样,则粮食播种面积就是辅助变量.辅助变量是相对于调查变量而言的,在多目标抽样调查中,如果需要,一个调查变量可以作为另一个调查变量的辅助变量. 相似文献

20.

中国广义回归抽样估计系统的构建及应用

陈光慧《统计研究》2015,32(7):93-99

在抽样理论和应用研究方面,中国一直比较重视抽样方案设计,而忽视抽样估计方法研究。本文在系统总结加拿大等西方国家成功经验的基础上,引入并改进了一套广义回归估计系统,应用在复杂的连续多阶抽样调查中。本文以各类常见的抽样设计为基础,通过模型组和模型水平将现有的超总体模型进行扩展,建立各种类型的回归模型进行模型辅助的广义回归估计,最终形成一套广义回归估计系统,为中国抽样估计的应用研究奠定理论基础。最后,本文以中国农产量的连续多阶抽样调查为例,给出了具体的回归估计程序,从而验证这套系统的实践性和应用价值。相似文献