首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
如何解释隐现于列联表中的辛普森悖论,是社会统计分析中一个重要的应用性问题。本文从全概公式出发,演绎了辛普森悖论的消解过程。认为辛普森悖论与其说是“悖论”,不如说是反映了分类数据的非线性特征,是“不可压缩”而压缩的结果。它反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。  相似文献   

2.
列联表分析中的Simpson悖论问题   总被引:1,自引:0,他引:1  
对于分类数据,列联表无疑是最好的统计工具之一,但列联表分析也会带来Simpson悖论问题。从理论上来说,可以通过改变试验结构来消解Simpson悖论,但社会研究数据大多是观测数据,是无法通过试验来控制的,因此Simpson悖论与其说是"悖论",不如说是反映了分类数据的非线性特征,是"不可压缩"而压缩的结果,反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题。  相似文献   

3.
贺前龙  王兆雄 《浙江统计》2004,(8):33-34,46
列联表分析(CROSSTABS,CROSS-TABULATION,交叉分组列表),又称交互分析、交叉分析.它是对一组观察对象分别观察其分类变量的表现,每种分类变量可以有两种或两种以上的观察结果,目的在于研究分类变量之间的关系.目前,许多调查公司列联表分析都只停留在频数和百分比的直观对比上,而没有进一步的检验和变量控制,这样不仅浪费数据,而且可能得出错误结论.笔者在文中从实践角度对列联表分析进行了系统概述,相信不仅有利于引起有关分析人员加深对列联表分析应用,而且对其他的社会调查研究中列联表分析的应用也有一定的借鉴意义.  相似文献   

4.
孙凤 《统计与决策》2006,(23):22-23
一、问题的提出我们在进行属性数据处理时,常常运用列联表反映变量之间的联合分布。当列联表中包含两个变量时,被称作二维列联表;当列联表中包含三个变量时,则被称作三维列联表。三维或高维列联表亦可称作多维列联表。无论是简单的列联表还是复杂的列联表,其中所有频数之间分布  相似文献   

5.
文章对单向有序R×C列联表,指出了传统的χ2—检验方法不能反映变量之间的统计特征,用其推断两变量之间的关联性是失效的,而采用非参数统计中的秩和检验和CPD分析对单向有序R×C列联表的统计推断是合理的,它们对有序性有分辨能力。文章采用两种方法对六大洲的旅游状况进行差异分析,并排序比较,使统计信息更加丰富。  相似文献   

6.
孙旭等 《统计研究》2019,36(7):119-128
代际流动表可以统计子代与其父代社会地位配对数据的交互频数,反映了社会资源占有的优劣势在父子两代人之间的比较。对财富、阶级、特权等社会基本特征演变的实证考察,均依赖于代际流动表的量化分析。对数线性模型是流动表建模分析的基本工具,通过对列联表单元格频数进行拟合,可以识别流动表行分类与列分类之间的强弱交互效应,刻画父子社会地位间的交互结构。本文利用复杂网络社区发现算法分析父子社会地位的关联结构,针对简约对数线性模型拟合精度不够的问题,提出一种新的建模思路:利用社区发现算法对简约对数线性模型的残差列联表进行关联关系挖掘,将发现的社区效应作为附加参数约束引入原对数线性模型,以改善数据的拟合情况。由于该方法只在原简约对数线性模型中增加了一个参数约束,因此仍可以保证建模结果的简洁性及理论意义,同时社区效应补充了原对数线性模型对经验数据结构的解读。论文用此方法对来源于中国综合社会调查数据的经验代际职业流动表进行建模分析,较好地解释了子代职业阶层与父代职业阶层间的关联模式。  相似文献   

7.
针对辛普森悖论、美国佛罗里达州的凶杀案分析中存在的矛盾以及基尼系数差异等问题进行了研究,研究认为:出现这些问题的根本原因是信息屏蔽造成的,提出用增加数据维数(简称为“增维”)的办法来解决这些问题中存在的信息屏蔽问题;运用增加维数的办法解释一些社会现象,可以使人们更加科学地看待一些问题,及时发现问题的原因,并找到相应的解决办法,为中国社会的科学发展服务。  相似文献   

8.
列联表资料检验的几种常见错误辨析   总被引:2,自引:1,他引:1  
列联表数据的统计检验常出现错误,主要存在不能根据统计资料的具体特性选择正确的检验方法,不注意统计方法的条件,和统计分析不充分等一些问题.文章通过一些具体实例对双向无序列联表、单向有序列联表和双向有序列联表的统计检验中容易存在的问题进行了分析,并对常用的正确统计方法进行了介绍.  相似文献   

9.
冯士雍 《统计研究》1985,2(4):61-73
四、列联表的分割§4-1 X~2的分解与列联表分割 如果一个r×c列联表的变量独立性的假设经检验遭到拒绝,说明所涉及的两个变量之间存在一定的关联。在2×k表情形,这也等价于k个率之间有显著性差异。但以上结论是指表的整体而言的,并不意味着两个变量的所有分类都存在着关联或任意两个率之间都存在显著性差异。完全有可能变量之间的关联性仅存在于某些类别(或某些率)之间。这正如在一  相似文献   

10.
江苏省城镇居民收入差异对消费结构的影响   总被引:2,自引:0,他引:2  
一、panel-data模型 panel-data称为面板数据或平行数据,是把时间序列沿空间方向扩展,或把截面数据沿时间扩展构成的二维结构的数据集合,与单纯的时间序列和截面数据相比,面板数据既能反映各个个体的变化特征,也能反映每个个体沿时间变化的特征.panel-data模型也称面板数据模型,是在面板数据上建立的回归分析模型.panel-data模型的一般表达式为:  相似文献   

11.
林上华  汪国昭 《浙江统计》2005,(2):14-14,17
回归模型是揭示统计指标间数量关系的重要手段,广泛应用于统计预报中,其中非线性模型因其适用性成为研究的热点,通常人们借助各类函数变换建立非线性模型,但在处理不同问题时,采用的变换函数难以统一,因此构造一种普遍的非线性模型方法是十分需要的.  相似文献   

12.
非线性回归模型的线性变换和正交多项式回归   总被引:1,自引:0,他引:1  
在非线性回归模型中,部分模型可以通过数据变换转化为线性模型进行研究,但这种转换有时会引起随机扰动项的变换,改变其假设条件,从而影响模型的准确性.文章引入非线性回归模型的线性变换方法和正交多项式回归方法,重点介绍了正交多项式回归方法;基于R语言软件,通过例子说明了非线性模型线性变换的局限性,并给出了正交多项式回归方法拟合非线性模型的具体应用.  相似文献   

13.
问题的提出在问卷设计中,常常会遇到要求被调查者对多个对象(或多种特征、多种性能等)进行若干个问题做出回答的设计技术问题。比如:您县哪些部门为乡镇企业服务的质量较差,差距的程度如何?(每单位选一个,并打上“√”)对上述问题,采用了双向列联表的形式进行设计。这种设计能节省空间,便于比较,简化说明,节省时间;同时,采用双向列联表有利于同一矩阵中多个不同问题之间的相互比较,有利于缩短被调查者思考和回答问题的时间。但是,如果所需设计的对象(或特征、性能)过多,甚至达几十上百种,仍采用这种设计,就会使双向列联表的规模太大,使被调…  相似文献   

14.
大学生月消费情况调查——以南京邮电大学为例   总被引:2,自引:0,他引:2  
本文通过网络问卷调查的方式,在南京邮电大学内网上进行大学生月消费情况调查,并分别采用描述统计、假设检验(t检验)、列联表分析(拟合优度检验)和回归分析等统计方法对数据进行统计分析,得出:大学生月平均消费为1002元,男生和女生月消费均值相等,男生和女生中非理性消费的比例一致,大学生月支出占家庭月收入的近似比值为0.289。  相似文献   

15.
名义变量列联表的相关统计量分析   总被引:1,自引:0,他引:1  
SPSS为名义变量的列联表分析提供了独立性检验统计量、对称测度统计量和定向测度统计量这3类检验统计量,文章对这些统计量进行了梳理,然后结合实际案例使用SPSS16.0对这些统计量进行了分析.  相似文献   

16.
用Pearson's卡方统计量进行统计检验时应注意的问题   总被引:5,自引:1,他引:4  
列联表的卡方检验用于检验两个分类变量的关联程度.文章认为,卡方数值的大小与样本容量有关,在卡方检验中,需要报告关联系数;并且,在实际应用中还需注意卡方检验的条件,在有20%以上的理论次数小于5或有理论次数小于1时不能应用卡方检验;此外,在两个变量都是顺序变量时,两个变量的关联程度用Gamma眦检验比用卡方检验更好.  相似文献   

17.
Wald检验对于等价的零假设中不同形式的表达式在有限样本的情况下缺乏一致性,而从微分几何的角度来解释这一现象,并发现由于Wald统计量是一个混杂的不恰当的几何量,从而对不同的含参数的等价表达式不具有一致性。同时还展示了芬斯拉(Finsler)测地统计量如何能较为简便的计算出来、它在线性回归模型中的非线性约束条件下如何应用以及两者在什么情况下保持一致,并提出了一种解决Wald检验不一致性的思路。  相似文献   

18.
一、统计分组的应用及其在线性模型拟合中的优缺点统计分组是根据事物内在的特点和统计研究的目的,将特定的总体按某种划分标准区分为若干个不同的组成部分的一种统计方法。统计分组的应用相当广泛。对数据按一定的标准分组后,可以发现数据内的潜在的规律性,呈现出不同组别之间的联系与差异,便于找出深藏于表面现象之下的内在本质,比如列联表分析。统计分组也可以应用于模型的建立中。在拟合样本数据进行建立模型时,常常会有一些质的因素(比如职业、性别、战争、季节等等)影响被解释变量,这些质的因素可能会使回归模型中的参数发生变化。在这种情况下,如果对样本数据笼统地用一个模型来拟合就会产生很大的误差。相反,如果将样本数据按引起线性模型的截距或斜率变化的标志分组,再针对每一组分别拟合模型,则可以得到拟合程度更高的模型。  相似文献   

19.
在社会调查和市场调查中,经常要调查人们的观点、态度等主观问题,搜集的数据大部分为定性数据(即分类和排序数据).笔者发现对该类数据的分析大多还是局限在频数、频率和交叉汇总分析.而大量调查数据中包含的许多有用信息却得不到利用,这是因为许多统计方法不能直接对定性数据进行分析,因此如何对定性数据作进一步的统计分析,如显著性检验、相关分析、回归分析、多元变量分析等,是调查数据分析中十分必要的内容.  相似文献   

20.
文章从模型本身和检验统计量角度分析发现,虚拟自变量回归线性关系显著性检验与对应的单因素方差分析等价,回归系数的显著性检验与两总体均值的比较关系密切.而行、列因素各为2水平的双因素无重复试验方差分析,也能在回归分析中找到等价的检验.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号