首页 | 本学科首页   官方微博 | 高级检索  
     检索      

数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法
引用本文:谢佳斌,金勇进,谢邦昌.数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法[J].统计研究,2009,26(4).
作者姓名:谢佳斌  金勇进  谢邦昌
作者单位:1. 中国人民大学统计学院
2. 中国台湾辅仁大学统计信息学系、应用统计所
摘    要:在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题.本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计.实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析.随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量.这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴.

关 键 词:调查数据  抽样权重  数据挖掘  PPWWR再抽样

The Study on Handling Sampling Weights Associated with the Survey Data When Applying Data Mining Methods——Based on the Method of Re-sampling with PPWWR
Xie Jiabin,Jin Yongjin,Xie Bangchang.The Study on Handling Sampling Weights Associated with the Survey Data When Applying Data Mining Methods——Based on the Method of Re-sampling with PPWWR[J].Statistical Research,2009,26(4).
Authors:Xie Jiabin  Jin Yongjin  Xie Bangchang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号