共查询到20条相似文献,搜索用时 62 毫秒
1.
四、列联表的分割§4-1 X~2的分解与列联表分割 如果一个r×c列联表的变量独立性的假设经检验遭到拒绝,说明所涉及的两个变量之间存在一定的关联。在2×k表情形,这也等价于k个率之间有显著性差异。但以上结论是指表的整体而言的,并不意味着两个变量的所有分类都存在着关联或任意两个率之间都存在显著性差异。完全有可能变量之间的关联性仅存在于某些类别(或某些率)之间。这正如在一 相似文献
2.
一、问题的提出我们在进行属性数据处理时,常常运用列联表反映变量之间的联合分布。当列联表中包含两个变量时,被称作二维列联表;当列联表中包含三个变量时,则被称作三维列联表。三维或高维列联表亦可称作多维列联表。无论是简单的列联表还是复杂的列联表,其中所有频数之间分布 相似文献
3.
用Pearson's卡方统计量进行统计检验时应注意的问题 总被引:5,自引:1,他引:4
列联表的卡方检验用于检验两个分类变量的关联程度.文章认为,卡方数值的大小与样本容量有关,在卡方检验中,需要报告关联系数;并且,在实际应用中还需注意卡方检验的条件,在有20%以上的理论次数小于5或有理论次数小于1时不能应用卡方检验;此外,在两个变量都是顺序变量时,两个变量的关联程度用Gamma眦检验比用卡方检验更好. 相似文献
4.
文章对单向有序R×C列联表,指出了传统的χ2—检验方法不能反映变量之间的统计特征,用其推断两变量之间的关联性是失效的,而采用非参数统计中的秩和检验和CPD分析对单向有序R×C列联表的统计推断是合理的,它们对有序性有分辨能力。文章采用两种方法对六大洲的旅游状况进行差异分析,并排序比较,使统计信息更加丰富。 相似文献
5.
属性数据的多变量对应分析模型及应用 总被引:1,自引:0,他引:1
属性数据的建模和分析是市场研究活动中最重要的一类应用问题,学术界和市场研究行业一般使用列联表及统计检验的方法进行分析。故将法国统计学家J.P.Beozecri提出的对应分析法导入市场研究实证过程,使问卷调查中常见的多变量属性数据分析建模过程呈现出稳健的统计结论和直观的二维图示,并推广到广义多变量对应分析场合,其结论可靠,有应用创新。 相似文献
6.
列联表分析中的Simpson悖论问题 总被引:1,自引:0,他引:1
对于分类数据,列联表无疑是最好的统计工具之一,但列联表分析也会带来Simpson悖论问题。从理论上来说,可以通过改变试验结构来消解Simpson悖论,但社会研究数据大多是观测数据,是无法通过试验来控制的,因此Simpson悖论与其说是"悖论",不如说是反映了分类数据的非线性特征,是"不可压缩"而压缩的结果,反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。 相似文献
7.
如何解释隐现于列联表中的辛普森悖论,如何区分回归中logit变换与probit变换的内在差异与背后假定,是社会统计分析中两大应用性问题.文章从社会统计对象的独特特征出发,认为辛普森悖论与其说是"悖论".不如说是反映了分类数据的非线性特征,反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题.同理,在回归分析中,由于分类数据的非线性特征,无论logit变换,还是probit变换,实际上只有在0.2~0.8之间才基本呈现线性,在这个范围之外,两个函数都是高度非线性的. 相似文献
8.
名义变量列联表的相关统计量分析 总被引:1,自引:0,他引:1
SPSS为名义变量的列联表分析提供了独立性检验统计量、对称测度统计量和定向测度统计量这3类检验统计量,文章对这些统计量进行了梳理,然后结合实际案例使用SPSS16.0对这些统计量进行了分析. 相似文献
9.
列联表资料检验的几种常见错误辨析 总被引:2,自引:1,他引:1
列联表数据的统计检验常出现错误,主要存在不能根据统计资料的具体特性选择正确的检验方法,不注意统计方法的条件,和统计分析不充分等一些问题.文章通过一些具体实例对双向无序列联表、单向有序列联表和双向有序列联表的统计检验中容易存在的问题进行了分析,并对常用的正确统计方法进行了介绍. 相似文献
10.
关于利用因子分析方法对变量分类的探讨 总被引:5,自引:0,他引:5
因子分析是一种将具有错综复杂关系的变量综合成数量较少的几个因子,以再现原始变量与因子之间的相互关系的一种多元统计分析方法.目前学术界对因子分析的应用一般局限于对多元变量群进行降维,从而降低分析问题的复杂性,而至于对变量分类,人们常用的方法是R型聚类分析.但是通过本文的研究却可以发现利用因子分析的方法同样可以达到对变量进行分类的目的,而且利用因子分析对变量分类的方法的理论本质与R型聚类分析是一致的.本文首先介绍了利用因子分析方法对变量分类的基本思想,然后通过实证分析,验证了该方法的可行性和可靠性. 相似文献
11.
列联表卡方检验适用于具有分类特征的样本间的差异性的检验。其用于比较的样本容量的不同取值将直接影响研究结论;把每个样本在各个维度上的"实际观察值"转化为"实际观察值的百分比"进行数据分析也会影响研究结论。本文讨论"样本容量的不同取值"和"样本实际观察值的百分比"对研究结论的影响。 相似文献
12.
代际流动表可以统计子代与其父代社会地位配对数据的交互频数,反映了社会资源占有的优劣势在父子两代人之间的比较。对财富、阶级、特权等社会基本特征演变的实证考察,均依赖于代际流动表的量化分析。对数线性模型是流动表建模分析的基本工具,通过对列联表单元格频数进行拟合,可以识别流动表行分类与列分类之间的强弱交互效应,刻画父子社会地位间的交互结构。本文利用复杂网络社区发现算法分析父子社会地位的关联结构,针对简约对数线性模型拟合精度不够的问题,提出一种新的建模思路:利用社区发现算法对简约对数线性模型的残差列联表进行关联关系挖掘,将发现的社区效应作为附加参数约束引入原对数线性模型,以改善数据的拟合情况。由于该方法只在原简约对数线性模型中增加了一个参数约束,因此仍可以保证建模结果的简洁性及理论意义,同时社区效应补充了原对数线性模型对经验数据结构的解读。论文用此方法对来源于中国综合社会调查数据的经验代际职业流动表进行建模分析,较好地解释了子代职业阶层与父代职业阶层间的关联模式。 相似文献
13.
征信机构采集到的所有微型企业信用信息变量并未都适合进行微型企业资信评估,文章设计了一种BP神经网络对此进行特征选择。该BP神经网络的训练基于前向序贯的特征选择算法,以输出层输出对输入值的灵敏度作为特征选择的依据,网络输出最小灵敏度对应的特征变量。通过设计概率神经网络对得到的结果进行仿真分析,信贷机构因此获得的利润比基于列联表分析的特征选择法高2/3。 相似文献
14.
15.
如何解释隐现于列联表中的辛普森悖论,是社会统计分析中一个重要的应用性问题。本文从全概公式出发,演绎了辛普森悖论的消解过程。认为辛普森悖论与其说是“悖论”,不如说是反映了分类数据的非线性特征,是“不可压缩”而压缩的结果。它反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。 相似文献
16.
针对高维混合效应模型,本文提出了一种双正则化分位回归方法.通过对随机和固定效应系数同时实施L1正则化惩罚,一方面能够对重要解释变量进行挑选,另一方面能够消除个体随机波动带来的偏差.求解参数估计的交替迭代算法不仅破解了要同时确定两个调整参数的难题,而且算法速度快.模拟结果也表明该方法不仅对误差类型有很强的抗干扰能力,同时在模型有不同稀疏程度时均表现良好,尤其是对于解释变量多于样本的高维情况.为了方便在实际问题中选择最优正则化参数,本文还对两种参数选取标准进行了比较研究.最后利用新方法对一个教育方面的数据进行了实证演示,找出了在各个分位点处对学生成绩有影响的重要因素. 相似文献
17.
西部地区间投入产出模型及应用研究 总被引:3,自引:1,他引:2
本文通过编制西部地区间投入产出表(包括资源占用部分),分析西部地区经济的协调发展,研究西部资源因素对经济发展的影响.文章着重介绍了列系数模型的结构和在西部经济分析中的应用;阐述了资源占用参数的计算方法及其在研究资源的制约作用中的应用. 相似文献
18.
线性回归分析作为一种传统的统计分析方法,现已得到广泛的应用和完善.但受其对应变量连续性要求的影响,当应变量为分类变量(常见的是二分类变量,即y取0,1两个值)时,线性回归模型不再适用.人们通常采用Probit模型或Lotist模型对二分类因变量进行回归分析,与线性回归不同,Probit回归是一种非线性回归模型,因而在参数估计时,通常采用极大似然估计,并且在随机样本条件下,Probit模型的极大似然估计具有一致性,渐进有效性和渐进正态性. 相似文献
19.
20.
文章提出了一种灵巧的试验设计法,它能根据工程实际中因素间的交互作用,在正交表中选择恰当的列作为主因素列,使所有交互作用列与主因素列无混杂.此外,在设计过程中分别引入动态规划法和微分进化法对各主因素列进行了均匀性优化,并根据数值实验结果,得出两种方法的优化效果随因素数和因素水平数的变化规律. 相似文献