期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

冯士雍《统计研究》1985,2(4):61-73

四、列联表的分割§4-1 X~2的分解与列联表分割如果一个r×c列联表的变量独立性的假设经检验遭到拒绝,说明所涉及的两个变量之间存在一定的关联。在2×k表情形,这也等价于k个率之间有显著性差异。但以上结论是指表的整体而言的,并不意味着两个变量的所有分类都存在着关联或任意两个率之间都存在显著性差异。完全有可能变量之间的关联性仅存在于某些类别(或某些率)之间。这正如在一相似文献

2.

列联表分析在市场调查中的深入应用

贺前龙王兆雄《浙江统计》2004,(8):33-34,46

列联表分析(CROSSTABS,CROSS-TABULATION,交叉分组列表),又称交互分析、交叉分析.它是对一组观察对象分别观察其分类变量的表现,每种分类变量可以有两种或两种以上的观察结果,目的在于研究分类变量之间的关系.目前,许多调查公司列联表分析都只停留在频数和百分比的直观对比上,而没有进一步的检验和变量控制,这样不仅浪费数据,而且可能得出错误结论.笔者在文中从实践角度对列联表分析进行了系统概述,相信不仅有利于引起有关分析人员加深对列联表分析应用,而且对其他的社会调查研究中列联表分析的应用也有一定的借鉴意义. 相似文献

3.

用Pearson's卡方统计量进行统计检验时应注意的问题 总被引：5，自引：1，他引：4

陆运清《统计与决策》2009,(15)

列联表的卡方检验用于检验两个分类变量的关联程度.文章认为,卡方数值的大小与样本容量有关,在卡方检验中,需要报告关联系数;并且,在实际应用中还需注意卡方检验的条件,在有20%以上的理论次数小于5或有理论次数小于1时不能应用卡方检验;此外,在两个变量都是顺序变量时,两个变量的关联程度用Gamma眦检验比用卡方检验更好. 相似文献

4.

关于单向有序R×C表的统计分析

张宏培《统计与信息论坛》1999,(4)

文章对单向有序R×C列联表,指出了传统的χ2—检验方法不能反映变量之间的统计特征,用其推断两变量之间的关联性是失效的,而采用非参数统计中的秩和检验和CPD分析对单向有序R×C列联表的统计推断是合理的,它们对有序性有分辨能力。文章采用两种方法对六大洲的旅游状况进行差异分析,并排序比较,使统计信息更加丰富。相似文献

5.

问卷设计技术研究--利用MATLAB软件编程生成随机数矩阵抽取样本群的方法

蒋志华陈孝春南天云《中国统计》2004,(5):28-29

问题的提出在问卷设计中,常常会遇到要求被调查者对多个对象(或多种特征、多种性能等)进行若干个问题做出回答的设计技术问题。比如:您县哪些部门为乡镇企业服务的质量较差,差距的程度如何?(每单位选一个,并打上“√”)对上述问题,采用了双向列联表的形式进行设计。这种设计能节省空间,便于比较,简化说明,节省时间;同时,采用双向列联表有利于同一矩阵中多个不同问题之间的相互比较,有利于缩短被调查者思考和回答问题的时间。但是,如果所需设计的对象(或特征、性能)过多,甚至达几十上百种,仍采用这种设计,就会使双向列联表的规模太大,使被调… 相似文献

6.

社会统计分析中的悖论与变换问题

程中兴《统计与决策》2011,(6)

如何解释隐现于列联表中的辛普森悖论,如何区分回归中logit变换与probit变换的内在差异与背后假定,是社会统计分析中两大应用性问题.文章从社会统计对象的独特特征出发,认为辛普森悖论与其说是"悖论".不如说是反映了分类数据的非线性特征,反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题.同理,在回归分析中,由于分类数据的非线性特征,无论logit变换,还是probit变换,实际上只有在0.2～0.8之间才基本呈现线性,在这个范围之外,两个函数都是高度非线性的. 相似文献

7.

列联表分析中的Simpson悖论问题 总被引：1，自引：0，他引：1

程中兴《统计与信息论坛》2011,26(2):9-12

对于分类数据,列联表无疑是最好的统计工具之一,但列联表分析也会带来Simpson悖论问题。从理论上来说,可以通过改变试验结构来消解Simpson悖论,但社会研究数据大多是观测数据,是无法通过试验来控制的,因此Simpson悖论与其说是＂悖论＂,不如说是反映了分类数据的非线性特征,是＂不可压缩＂而压缩的结果,反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。相似文献

8.

对应分析方法在大学毕业生就业因素分析中的应用

其木格《内蒙古统计》2001,(4)

一、对应分析方法对应分析方法是近年来发展起来的一种多元相依变量统计分析技术，它通过分析由定性数据构成的交互汇总表来揭示变量间的联系。当用变量的一系列类别分布图来描述变量之间的联系时，使用这一技术可以揭示同一变量各个类别之间的差异以及不同变量各个类别之间的对应关系。它不仅可以分析定性数据，同时还可以分析非线性关系。当我们分析的变量是定性数据，变量之间又存在非线性关系时，则可以用对应分析来揭示变量之间的联系。对应分析的基本形式是对由两个定性变量构成的交互表进行分析．将定性数据转变为可度量的分值，减… 相似文献

9.

非线性视角下辛普森悖论的统计解释

程中兴《浙江统计》2011,(1):30-31

如何解释隐现于列联表中的辛普森悖论,是社会统计分析中一个重要的应用性问题。本文从全概公式出发,演绎了辛普森悖论的消解过程。认为辛普森悖论与其说是“悖论”,不如说是反映了分类数据的非线性特征,是“不可压缩”而压缩的结果。它反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。相似文献

10.

属性数据的多变量对应分析模型及应用 总被引：1，自引：0，他引：1

米子川《统计与信息论坛》2010,25(7):16-21

属性数据的建模和分析是市场研究活动中最重要的一类应用问题,学术界和市场研究行业一般使用列联表及统计检验的方法进行分析。故将法国统计学家J.P.Beozecri提出的对应分析法导入市场研究实证过程,使问卷调查中常见的多变量属性数据分析建模过程呈现出稳健的统计结论和直观的二维图示,并推广到广义多变量对应分析场合,其结论可靠,有应用创新。相似文献

11.

名义变量列联表的相关统计量分析 总被引：1，自引：0，他引：1

王伏虎赵喜仓《统计与决策》2009,(14)

SPSS为名义变量的列联表分析提供了独立性检验统计量、对称测度统计量和定向测度统计量这3类检验统计量,文章对这些统计量进行了梳理,然后结合实际案例使用SPSS16.0对这些统计量进行了分析. 相似文献

12.

列联表资料检验的几种常见错误辨析 总被引：2，自引：1，他引：1

陆运清《统计与决策》2010,(15)

列联表数据的统计检验常出现错误,主要存在不能根据统计资料的具体特性选择正确的检验方法,不注意统计方法的条件,和统计分析不充分等一些问题.文章通过一些具体实例对双向无序列联表、单向有序列联表和双向有序列联表的统计检验中容易存在的问题进行了分析,并对常用的正确统计方法进行了介绍. 相似文献

13.

边限检验理论及几点讨论 总被引：4，自引：0，他引：4

靳军会邱长溶《统计与信息论坛》2008,23(7):14-19,28

检验经济变量之间长期关系的协整技术要求变量是同阶单整的,这不可避免地涉及一定程度的预检验问题,而预检验问题会增加变量间长期关系分析的不确定性。当不能确定变量的单整类型时,边限检验理论提出了一个可以直接检验一个变量和一组解释变量之间长期关系的新方法。在介绍了边限检验方法中基本的VAR模型和假设及边限检验方法中用到的重要统计量——Wald统计量和T统计量及它们各自的渐近分布形式后,说明了边限检验理论在理论和实际运用当中需要注意的几个问题,最后通过实例分析说明了边限检验理论的运用。相似文献

14.

网络社区发现算法在流动表建模中的设计与应用

孙旭等《统计研究》2019,36(7):119-128

代际流动表可以统计子代与其父代社会地位配对数据的交互频数,反映了社会资源占有的优劣势在父子两代人之间的比较。对财富、阶级、特权等社会基本特征演变的实证考察,均依赖于代际流动表的量化分析。对数线性模型是流动表建模分析的基本工具,通过对列联表单元格频数进行拟合,可以识别流动表行分类与列分类之间的强弱交互效应,刻画父子社会地位间的交互结构。本文利用复杂网络社区发现算法分析父子社会地位的关联结构,针对简约对数线性模型拟合精度不够的问题,提出一种新的建模思路：利用社区发现算法对简约对数线性模型的残差列联表进行关联关系挖掘,将发现的社区效应作为附加参数约束引入原对数线性模型,以改善数据的拟合情况。由于该方法只在原简约对数线性模型中增加了一个参数约束,因此仍可以保证建模结果的简洁性及理论意义,同时社区效应补充了原对数线性模型对经验数据结构的解读。论文用此方法对来源于中国综合社会调查数据的经验代际职业流动表进行建模分析,较好地解释了子代职业阶层与父代职业阶层间的关联模式。相似文献

15.

基于神经网络的微型企业信用评估特征选择及其效果评价

朱毅峰孙亚南《统计与信息论坛》2008,23(4):48-51,66

征信机构采集到的所有微型企业信用信息变量并未都适合进行微型企业资信评估，文章设计了一种BP神经网络对此进行特征选择。该BP神经网络的训练基于前向序贯的特征选择算法，以输出层输出对输入值的灵敏度作为特征选择的依据，网络输出最小灵敏度对应的特征变量。通过设计概率神经网络对得到的结果进行仿真分析，信贷机构因此获得的利润比基于列联表分析的特征选择法高2／3。相似文献

16.

高科技风险企业家非理性决策与人口统计特征关系分析

饶卫闵宗陶魏修建《统计与决策》2011,(19):87-89

文章研究目的在于发现高科技风险家的非理性决策心态与人口统计特征变量间关系,采用列联表和多元线性回归方法分析了年龄、学历、留学经验、家庭结构、创业成功经验、创业前职业与高科技风险企业家非理性决策心态间相关性,结果发现除学历和留学经验外,其它人口统计特征与高科技风险企业家非理性决策心态间存在相关性关系。相似文献

17.

基于随机效应零调整回归模型的保险损失预测

《统计与信息论坛》2015,(12):3-9

在非寿险精算中,对保单的累积损失进行预测是费率厘定的基础。在对累积损失进行预测时通常使用Tweedie回归模型。当损失观察数据中包含大量零索赔的保单时,Tweedie回归模型对零点的拟合容易出现偏差;若用零调整分布代替Tweedie分布,并在模型中引入连续型解释变量的平方函数,可以建立零调整回归模型;如果在零调整回归模型中将水平数较多的分类解释变量作为随机效应处理,可以进一步改善预测结果的合理性。基于一组机动车辆第三者责任保险的损失数据,将不同分布假设下的固定效应模型与随机效应模型进行对比,实证检验了随机效应零调整回归模型在保险损失预测中的优越性。相似文献

18.

分类数据的x~2检验及Logistic回归

王国梁齐雁云于世祥《统计与信息论坛》1996,(Z1)

本文介绍了如何利用统计分析软件ＳＰＳＳ／ＰＣ＋处理定性资料的列联表的ｘ￣２独立性检验以及四格表的Ｌｏｇｉｓｔｉｃ回归相似文献

19.

基于随机化适应性Lasso的高维变量选择

闫懋博田茂再《统计研究》2021,38(1):147-160

Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。相似文献

20.

统计分组与虚拟变量在线性模型中的比较应用

艳平《统计与咨询》2005,(2):22-23

一、统计分组的应用及其在线性模型拟合中的优缺点统计分组是根据事物内在的特点和统计研究的目的,将特定的总体按某种划分标准区分为若干个不同的组成部分的一种统计方法。统计分组的应用相当广泛。对数据按一定的标准分组后,可以发现数据内的潜在的规律性,呈现出不同组别之间的联系与差异,便于找出深藏于表面现象之下的内在本质,比如列联表分析。统计分组也可以应用于模型的建立中。在拟合样本数据进行建立模型时,常常会有一些质的因素(比如职业、性别、战争、季节等等)影响被解释变量,这些质的因素可能会使回归模型中的参数发生变化。在这种情况下,如果对样本数据笼统地用一个模型来拟合就会产生很大的误差。相反,如果将样本数据按引起线性模型的截距或斜率变化的标志分组,再针对每一组分别拟合模型,则可以得到拟合程度更高的模型。相似文献