首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
由于传统因子分析方法对离群值较敏感,导致计算结果与实际不相符。针对这一现象,本文运用FAST-MCD方法对传统因子分析方法进行改进,构建出因子分析的稳健算法,以克服离群值的影响,并对此方法进行了模拟和实证分析。模拟和实证分析结果均表明:因子旋转前后,当数据中不存在离群值时,传统因子分析与稳健因子分析得到的结果基本保持一致;当数据中存在离群值时,运用传统因子分析得到的结果出现较大变化,而运用稳健因子分析方法得到的结果基本不变,这说明相对于传统因子分析方法,稳健因子分析方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。  相似文献   

2.
时间序列异常值检测是时间序列分析研究中的重要内容,然而,在实际检测中往往存在“遮蔽效应”问题。文章分析了已有研究提出的时间序列TC型异常值检测法的不稳健性,并从两个方面进行改进:第一,建立基于Huber权函数的稳健ARMA模型,得到无干扰AR系数与MA系数;第二,用绝对离差中位数作为残差稳健估计量。通过以上改进得到了TC型异常值稳健检测统计量,并通过模拟对比小样本、中样本、大样本,轻污染、中污染、重污染情形下传统检测法与稳健检测法的检测效力,结果发现:在小样本、轻污染率下,两种检测法相差不大,但随着样本量、污染率的增加,稳健检测法显著优于传统检测法。最后,稳健检测法的优良性在金融市场异常现象检测中得到进一步说明。  相似文献   

3.
时间序列自回归AR模型在建模过程中易受离群值的影响,导致计算结果与实际不相符。针对这一现象,运用FQn统计量对传统自相关函数进行改进,构建出自回归AR模型的稳健估计算法,以克服离群值的影响,并对此方法进行了模拟和实证分析。模拟和实证分析均表明:当时序数据中不存在离群值时,传统估计方法与稳健估计方法得到的结果基本保持一致;当数据中存在离群值时,运用传统估计方法得到的结果出现较大变化,而运用稳健估计方法得到的结果基本不变.这说明相对于传统估计方法,稳健估计方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。  相似文献   

4.
文章分析了已有研究提出的时间序列新息异常值诊断法的不稳健性,并从以下两点对其进行稳健改进:一是构建稳健ARMA模型,确保基于该模型得到的残差不受异常值干扰;二是采用无偏Shamos估计量作为残差标准差σ的稳健估计量。通过以上改进,得到了新息异常值稳健诊断统计量。在模拟样本量分别为50、100、200、500,污染率分别为1%、5%、10%时比较传统诊断法与稳健诊断法的诊断效果,结果发现:传统诊断法受异常值干扰较大,在每种样本量下,随着污染率增加,诊断正确率急速下降,特别是在高污染率(10%)下,已基本无诊断力,而稳健诊断法不受异常值干扰,正确率均为100%。随后将稳健诊断法应用于金融时间序列异常值诊断,诊断结果与实际情况相吻合。  相似文献   

5.
基于稳健MM估计的统计数据质量评估方法   总被引:2,自引:1,他引:1       下载免费PDF全文
卢二坡  黄炳艺 《统计研究》2010,27(12):16-22
 政府统计数据质量是当前各界关注的热点问题,如何采用严谨的诊断方法,对我国统计数据进行科学的评估具有重要的现实意义。稳健回归方法可使求出的回归估计不受异常值的强烈影响,并且能更好的识别异常点。本文首次运用基于稳健MM估计的异常值诊断方法,在生产函数模型的框架下,分别使用两种不同的劳动投入数据,对改革以来我国GDP数据质量进行了评估。结果表明,基于稳健MM估计的异常值诊断方法可有效的解决传统方法容易出现的多个异常点的掩盖现象,改革以来我国的GDP数据是相对可靠的。  相似文献   

6.
时间序列自回归AR模型的Yule-Walker估计法在建模过程中易受离群值的影响,导致计算结果与实际不相符。针对这一现象,基于均值和方差的稳健组合估计量构建了稳健自相关函数,得到了时序AR模型的稳健Yule-Walker估计算法,以克服离群值的影响。并对此方法进行了模拟与金融数据实证检验,模拟和实证检验均表明:当时序数据中不存在离群值时,传统估计方法与稳健估计方法得到的结果基本保持一致;当数据中存在离群值时,运用传统估计方法得到的结果出现较大变化,而运用稳健估计方法得到的结果基本不变。这说明相对于传统估计方法,稳健估计方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。  相似文献   

7.
Cook距离公式常用于回归模型的异常值诊断,但由于公式中的样本方差■对异常值敏感,导致公式缺乏稳健性,使得诊断效果不理想。基于以上问题,文章选取绝对离差中位数作为样本标准差的稳健估计量,得到了样本方差■的稳健估计量,进而构造出稳健Cook距离公式;借鉴传统Cook距离的回归模型异常值诊断理论,将稳健Cook距离公式应用于时间序列异常值诊断,拓展了传统Cook距离公式的异常值诊断领域。通过选取模拟样本量分别为50、100、200,污染率分别为0、1%、5%、10%的ARMA(1,1)序列及金融时间序列进行实例分析,结果发现:(1)在无污染时,稳健Cook距离法与常规Cook距离法的诊断正确率均为100%,两者没有出现"误诊"现象;(2)在样本量、污染率同时增大时,常规Cook距离诊断正确率急剧下降,当污染率达到5%及以上时,已基本无诊断力,而稳健Cook距离法依然能保持较高的诊断力。稳健Cook距离法不仅能应用于时间序列异常值诊断,也能应用于回归分析的异常值诊断。  相似文献   

8.
在分类预测模型的自变量间存在交互效应时,传统Shapley值法的可加性无法满足,造成变量筛选效果变差,导致分类模型的预测精度降低。针对此问题,文章提出使用稳健独立成分分析,从原始数据中估计出具有独立性的数据集并对其进行Shapley值分解,从而提高变量筛选的准确度。统计模拟与实证分析的结果表明,改进后的方法在变量筛选上的表现优于传统Shapley值法。  相似文献   

9.
基于稳健主成分回归的统计数据可靠性评估方法   总被引:1,自引:0,他引:1       下载免费PDF全文
 稳健主成分回归(RPCR)是稳健主成分分析和稳健回归分析结合使用的一种方法,本文首次运用稳健的RPCR及异常值诊断方法,对2008年我国地区经济增长横截面数据可靠性做了评估。评估结果表明:稳健的RPCR方法能更好的克服异常值的影响,使估计结果更加可靠,并能有效的克服经典的主成分回归(CPCR)方法容易出现的多个异常点的掩盖现象;基本可以认为2008年地区经济增长与相关指标数据是匹配的,但部分地区的经济增长数据可能存在可靠性问题。  相似文献   

10.
熊巍等 《统计研究》2020,37(5):104-116
随着计算机技术的迅猛发展,高维成分数据不断涌现并伴有大量近似零值和缺失,数据的高维特性不仅给传统统计方法带来了巨大的挑战,其厚尾特征、复杂的协方差结构也使得理论分析难上加难。于是如何对高维成分数据的近似零值进行稳健的插补,挖掘潜在的内蕴结构成为当今学者研究的焦点。对此,本文结合修正的EM算法,提出基于R型聚类的Lasso-分位回归插补法(SubLQR)对高维成分数据的近似零值问题予以解决。与现有高维近似零值插补方法相比,本文所提出的SubLQR具有如下优势。①稳健全面性:利用Lasso-分位回归方法,不仅可以有效地探测到响应变量的整个条件分布,还能提供更加真实的高维稀疏模式;②有效准确性:采用基于R型聚类的思想进行插补,可以降低计算复杂度,极大提高插补的精度。模拟研究证实,本文提出的SubLQR高效灵活准确,特别在零值、异常值较多的情形更具优势。最后将SubLQR方法应用于罕见病代谢组学研究中,进一步表明本文所提出的方法具有广泛的适用性。  相似文献   

11.
函数型数据本质上是一种复杂数据,其抽样、生成、结构和关联程度都会影响到数据的复杂性和描述性,有些情形甚至连基本的可视化描述都成为难点。在利用函数型数据的主成分得分、图基的数据深度和密度概念的基础上,引入函数型数据的打包图和箱线图,并针对函数型数据的图形分析提出了函数型数据异常值检测的三种方法。与已有的检测方法相比较,所提三种方法更易于识别函数型数据的异常值。  相似文献   

12.
计量经济学中,数据异常的问题一直是人们研究的重点,因为少量的异常值就会对模型拟合产生很大的影响.本文着重讨论了异常值对线性回归模型造成的影响及其检测方法,并通过自由软件R进行了三类异常值的模拟和检测.  相似文献   

13.
熵值法中无量纲化方法优良标准的探讨   总被引:4,自引:0,他引:4  
在综合评价中,基于"差异驱动"原理的熵值法得到了广泛的应用,随之而来的是应用各种无量纲化方法对其进行改进。由于无量纲化方法有其各自的特点和适用范围,因此其各自的改进熵值法不可避免地存在优良性差异。文章通过理论推导与实证分析,对各改进熵值法的优良性进行探讨,最终得到最优的方法——极值熵值法,即极值处理法和熵值法的结合。  相似文献   

14.
综合传统考核方法的主要问题,考察公务员绩效评价的基本原则,比较分析传统数字统计和模糊语言值统计的差异,指出经典方法产生的歧叉,运用模糊数运算,构建基于语言值模糊数的公务员绩效考核方法.  相似文献   

15.
GM(1,1)模型系列背景值优化的内在联系及其改进   总被引:1,自引:0,他引:1  
GM(1,1)模型最主要的缺陷在于其白化方程与灰微分方程无法匹配,传统优化方法往往通过重构其背景值形式达到两者匹配的目的.文章介绍了三种重构的背景值形式,其由原始数据为齐次指数序列推导出,因此可以满足白指数率重合性;指出在原始数据为齐次指数序列时,三种背景值形式完全相同;分析了近似齐次指数序列建模下三种背景值形式的适用性,并对其添加动态修正项以弥补其不足.实例应用结果显示,改进的背景值优化形式提高了预测精度.  相似文献   

16.
为有效解决存在异常数据时传统Fisher判别分析(FDA)方法误判率高的问题,文章提出了一个简单而稳健的FDA方法.该方法首先用最小协方差行列式(MCD)稳健估计技术获得稳健的样本均值和协方差估计;然后再用FDA进行判别分析.为验证方法的有效性,文章将此方法应用于我国上市公司财务困境的预测问题.实证研究表明,在没有异常值的情况下,基于MCD的稳健FDA判别和传统的FDA判别结果基本一致;而在有异常值的情况下,新方法明显优于传统的FDA,不仅可有效抵御异常数据的干扰,而且仍保持较低的误判率.  相似文献   

17.
宋鹏等 《统计研究》2020,37(7):116-128
高维协方差矩阵的估计问题现已成为大数据统计分析中的基本问题,传统方法要求数据满足正态分布假定且未考虑异常值影响,当前已无法满足应用需要,更加稳健的估计方法亟待被提出。针对高维协方差矩阵,一种稳健的基于子样本分组的均值-中位数估计方法被提出且简单易行,然而此方法估计的矩阵并不具备正定稀疏特性。基于此问题,本文引进一种中心正则化算法,弥补了原始方法的缺陷,通过在求解过程中对估计矩阵的非对角元素施加L1范数惩罚,使估计的矩阵具备正定稀疏的特性,显著提高了其应用价值。在数值模拟中,本文所提出的中心正则稳健估计有着更高的估计精度,同时更加贴近真实设定矩阵的稀疏结构。在后续的投资组合实证分析中,与传统样本协方差矩阵估计方法、均值-中位数估计方法和RA-LASSO方法相比,基于中心正则稳健估计构造的最小方差投资组合收益率有着更低的波动表现。  相似文献   

18.
在数据仓库中,传统的缺失值处理方法均存在一定程度缺陷.文章主要论述将统计中的Gibbs抽样仿真概念应用到数据仓库中的缺失值处理中,在满足原有数据条件分布充足的条件下,能够解决传统数据仓库缺失值处理工作量大、数据偏置等问题,并且该方法能够使用excel完成仿真过程,简单易行,可操作性强,能够更为直接和有效的解决现实中的数据仓库中缺失值处理问题.  相似文献   

19.
文章针对投资组合理论中经典的夏普单指数投资组合模型,引入了稳健统计的思想,将稳健回归方法应用到该投资组合模型,降低了证券市场中证券收益率历史数据中因短期内重大利好或利空导致的超高或超低收益率离群值对投资组合决策的影响,并结合我国证券市场的特点,对沪市A股市场进行了实证分析,得到了证券投资组合的有效前沿.  相似文献   

20.
针对传统GM(1,1)模型预测精度不高,并且其背景值优化与求解方法优化各具有片面性的缺点,文章给出了组合优化和分段优化两种改进方法,并结合国内居民消费水平的相关统计数据,利用传统GM(1,1)模型及其优化后的模型与两种方法的误差进行对比,表明改进后的灰色模型精度更高,且预测值与实际值较吻合,说明改进后的灰色预测模型的可行性与可靠性更好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号