首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
复选题的SPSS数据编码技巧分析   总被引:3,自引:0,他引:3  
文章简要介绍了运用SPSS统计软件对社会科学问卷调查中复选题的数据进行编码的三种技巧:二分编码法、组合编码法和随机编码法,并对各自的优势和不足及适用条件进行分析。最后,结合SPSS11.5软件的统计界面介绍了复选集定义中的步骤和注意事项。  相似文献   

2.
多选题的统计分析及其SPSS实现   总被引:1,自引:0,他引:1  
目前对于多选项问题资料的数据分析多限于频数描述统计,有些统计软件如SPSS也有关于多重应答统计模块,但也仅限于多重应答分类法数据资料和二分类数据资料的频数描述.文章亦采用非参数检验中的Cochran检验来处理多选题中二分类数据资料,对问题进行推断.  相似文献   

3.
多选题又称多重应答(Multiple Response),即针对同一个问题被访者可能回答出多个有效的答案,它是市场调查研究中十分常见的数据形式。对多选题数据的分析除了使用SPSS中的“Multiple Response”命令进行频数分析和交叉分析之外,还可以使用“Data Reduction”命令中的“Optimal Scaling”(最优尺度分析)进行多重对应分析,用以挖掘该数据与其他若干个变量之间的相互关系。  相似文献   

4.
丁宏 《江苏统计》2000,(7):21-23
多元线性回归模型一般要求其分析变量有较高的定量层次 ,而社会科学的大量调查数据却往往属于定类变量。这样在实际分析过程中 ,研究者或者弃用这部分变量造成数据的浪费 ,或者将其简单应用而有可能导致错误结论。本文结合西方社会统计学的最新研究成果 ,借助SPSS统计软件 ,通过虚拟编码、效应编码、对比编码三种方式对定类变量数据进行变换 ,使其在多元线性模型中得到较好的解释结果。  相似文献   

5.
本文通过分析传统统计行业分类编码工作的流程、方法,指出其中隐含的诸多弊端,并以计算机人工智能技术与统计工作的跨领域结合为设计思路,研究提出一种智能行业编码的算法及其实现过程,推动编码工作迈向自动化。  相似文献   

6.
数据的编码、输入是问卷调查中极其不起眼的一个环节,以至于几乎所有的社会研究方法的教材中都只有寥寥几页来介绍它的实施方法,而且彼此大同小异,缺乏足够的操作性。但数据的编码输入却又是一个问卷调查中极其重要的环节,因为它是调查的结果向计算机的二进制数据转变的一个关键环节。如果处理不当不但延长编码输入所需要的时间,而且有可能在这个环节上造成数据错误,降低调查的可信度和有效性。因此,保证高效率、低错误率完成数据的编码和输入工作便是一个调查顺利完成的必要条件。  相似文献   

7.
舒英龙  陈建悦 《浙江统计》2006,(12):36-36,42
普查数据质量是普查工作成败的惟一标准,质量控制贯穿于方案制定、试点、实施到宣传动员的各个环节。数据处理阶段是整个质量控制的重要环节,也是对前几阶段工作质量和成果的检验。第二次全国农业普查将采用光电扫描方式录入数据,光电录入速度快、效率高,是实现高效高质量完成数据处理的保障。但光电录入对前几阶段的质量要求也很高,光电录入的高效是建立在前期调查表无差错、编码规范准确的基础上,如果前期质量控制工作做的不实、审核把关不严,差错多,在光电录入的同时忙于查表改错,出现光电机有效吸纳不足、机器等人或者光电机疲于反复扫…  相似文献   

8.
行政区划代码的编码工作在统计系统中大量存在,人工编码繁琐且缺点明显,针对人工编码工作中存在的不足,本文依托现有的"三经普"、名录库等大数据背景,结合信息化技术,提出了一种可行性较高的计算机自动编码的实现方式。  相似文献   

9.
范新妍等 《统计研究》2021,38(2):99-113
传统信用评分方法主要利用统计分类方法,只能预测借款人是否会发生违约,但不能预测违约发生的时点。治愈率模型是二分类和生存分析的混合模型,不仅可以预测是否会发生违约,而且可以预测违约发生的时点,比传统二分类方法可以提供更多的信息。另外,随着大数据的发展,数据源越来越多,针对相同或者相似任务,可以收集到多个数据集,本文提出了融合多源数据的整合治愈率模型,可以对多个数据集同时建模和估计参数,通过复合惩罚函数进行组间和组内双层变量选择,并通过促进两个子模型回归系数符号相同,提高模型的可解释性。通过数值模拟发现,所提方法在变量选择和参数估计上均有明显优势。最后,将所提方法应用于信用贷款的违约时点预测中,模型表现良好。  相似文献   

10.
居民收入密度函数的核密度估计具有非连续性,因无法通过积分计算特定收入区间的人口规模,故在核密度估计基础上,构建二分递归算法用以测算特定收入群体规模。使用中国健康和营养调查中的中国农村居民人均纯收入的微观调查数据,对中国农村居民收入分布进行核密度估计,并通过二分递归算法测算中国农村贫困发生率,结果显示:考虑到微观数据源和数据内容上的一些差异,计算得到的农村贫困发生率符合国家统计局公布的变动趋势且数值差异不大。因此,在核密度估计下使用二分递归算法计算特定收入群体规模具有有效性。  相似文献   

11.
问卷调查中的嵌套多选题数据如何录入SPSS   总被引:1,自引:0,他引:1  
金敏 《统计与决策》2005,(12):118-119
对问卷调查中的嵌套多选题数据如何从EXCEL格式转录入SPSS格式的操作步骤和具体操作方法进行了分析.  相似文献   

12.
统计人员在使用计算机处理数据的过程中,数据录入是工作量大,出错机会多的一个环节,最常见的错误是将数据多打一位或少打一位数字,若不能及时发现,就可能给汇总结果造成极大误差,给工作带来很大损失。造成这种错误的原因有时是计算机键盘故障引起的,更多的时候是由于录入人员因注意力不集中或数据原稿看不清,也有的是因录入人员的手误造成的。要解决这一问题除了加强机器的日常维护,教育录入人员增强责任心外,根本的办法是在录入程序中设置审核功能,从而及时发现这些错误。  相似文献   

13.
在统计信息化系统普及的今天,统计数据录入成为基层统计人员日常工作的重要组成部分,而随之产生的一些问题,如:录入速度和录入质量问题,录入数据的准确性和及时性问题,录入数据审核问题等。因此,在统计数据的录入过程中,要注意以下几个问题:1、要充分理解并熟练使用工作中录入数据的统计信息系统  相似文献   

14.
孙望书  孙旭 《统计研究》2023,(3):151-160
行业和职业编码是人口普查中行业和职业信息采集与量化分析之间必要的资料整理环节。随着信息技术的快速发展及其在社会管理工作中的广泛应用,人口普查行业和职业编码走上了智能化探索之路。智能化计算机编码极大减少编码工作对人工的依赖,显著降低编码成本,提高数据的时效性,控制编码环节的再生性误差。本文结合国内外相关研究,总结计算机编码的两种基本实现思路,阐述字典编码方法和模型编码方法的原理、技术及其在人口普查编码实践中的应用。我国在前六次人口普查中,行业和职业编码均由人工完成,第七次全国人口普查采用计算机辅助编码技术,初步实现行业和职业编码智能化。未来可以有针对性地借鉴其他国家社会调查编码工作的先进经验,向全面智能化方向迈进,进一步提高计算机编码方式在我国社会精准化管理中的服务水平。  相似文献   

15.
函数性数据的统计分析:思想、方法和应用   总被引:9,自引:0,他引:9       下载免费PDF全文
严明义 《统计研究》2007,24(2):87-94
 摘  要:实际中,越来越多的研究领域所收集到的样本观测数据具有函数性特征,这种函数性数据是融合时间序列和横截面两者的数据,有些甚是曲线或其他函数图像。虽然计量经济学近二十多年来发展的面板数据分析方法,具有很好的应用价值,但是面板数据只是函数性数据的一种特殊类型,且其分析方法太过于依赖模型的线性结构和假设条件等。本文基于函数性数据的普遍特征,介绍一种对其进行分析的全新方法,并率先使用该方法对经济函数性数据进行分析,拓展了函数性数据分析的应用范围。分析结果表明,函数性数据分析方法,较之计量经济学和其他统计方法具有更多的优越性,尤其能够揭示其他方法所不能揭示的数据特征  相似文献   

16.
为解决马田系统多分类算法存在的样本重复训练以及分类准确率下降等问题,文章提出了一种基于改进的类间相似方向数(Number of Inter-class Similarity Direction,NISD)的偏二叉树马田系统多分类算法。该算法利用马氏距离改进类间相似方向数,获得更为科学的样本分类顺序,依此顺序自上而下生成整个偏二叉树,在非叶子节点构造马田系统二分类器,生成最终的分类模型。对于含k个类别的待分类样本,该算法只用训练k-1个二分类器,便可得到马田系统多分类模型,与此同时,层层剥离样本减少了样本的重复训练。UCI数据集实验结果表明,该算法分类效率更高,分类准确率也较高。  相似文献   

17.
1、软件系统的设计1.1根据要求制定统计报表内容包括门、急诊诊疗情况报表、入院诊断情况报表、入院治疗情况报表、手术情况报表、单病种情况报表、主要科室工作量报表 ,以及多种更深层次的统计分析报表。1.2根据系统运行要求选择Win dowsNT 4.0网络系统 ,应用软件采用Foxpro为程序设计语言 ,中文平台为UCDOS系统 ,操作为菜单和人机对话式 ,软件编码库采用ICD - 9国际疾病分类和手术分类编码。2、软件系统的结构和功能根据设计要求 ,设计录入、查询、统计报表、系统维护四个模块 ,具有修改、删除、查询、浏览、打印…  相似文献   

18.
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。  相似文献   

19.
在计算机普及应用的今天,微机数据录入是统计人员日常工作的重要组成部分,而随之也产生了一些问题,如录入速度和录入质量的问题,录入数据的准确性和及时性等。因此,在统计数据微机录人中要注意以下几个问题。 一、要摒弃“微机万能”的想法 许多微机录人员在利用微机录入统计数据时,盲目追求速度,不顾质量。由于统计部门一般都使用上级主管部门统一配发的相应软件,使许多录入人员单纯依靠软件中的自动查错纠错功能,认为即使录入时出现录入差错,软件的纠错和查错功能也能对其予以纠正,同时许多录入员因都具有良好的中文打字的功底…  相似文献   

20.
王全众 《统计研究》2006,23(11):67-68
当因变量为定性数据时,Logistic回归模型经常被使用,其中又以二分类因变量(取值为0或1)的Logistic模型最为常见。其实,Logistic回归模型也可以应用于多分类因变量,即因变量的分类数大于等于3的情况。而且,多分类因变量既可以是序次的(Ordinal),也可以是名义的(Nominal)。当多分类因变量类别之间有序次关系时,一般采用序次(或累积)Logistic回归模型。人们在进行此类回归分析时,往往只注重通过一定的手段选择合适的自变量,以达到预期的拟合效果,却忽视了对因变量取值的研究。由于序次Logistic回归模型其实隐含了对因变量分类的一种假设条件…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号