共查询到20条相似文献,搜索用时 15 毫秒
1.
概率神经网络在判别分析中的比较优势 总被引:1,自引:0,他引:1
判别分析是多元统计分析的三大支柱之一。传统的判别分析方法,如距离判别法、贝叶斯判别法、费希尔判别法等在判别分析中误判率较高,因此有必要引入概率神经网络(PNN)进行判别分析。文章对传统判别方法的基本思想与假设条件及PNN的建模机制与判别原理进行了介绍;用两个案例比较了常用判别分析与PNN判别分析的效率。 相似文献
2.
高维协方差矩阵的估计问题现已成为大数据统计分析中的基本问题,传统方法要求数据满足正态分布假定且未考虑异常值影响,当前已无法满足应用需要,更加稳健的估计方法亟待被提出。针对高维协方差矩阵,一种稳健的基于子样本分组的均值-中位数估计方法被提出且简单易行,然而此方法估计的矩阵并不具备正定稀疏特性。基于此问题,本文引进一种中心正则化算法,弥补了原始方法的缺陷,通过在求解过程中对估计矩阵的非对角元素施加L1范数惩罚,使估计的矩阵具备正定稀疏的特性,显著提高了其应用价值。在数值模拟中,本文所提出的中心正则稳健估计有着更高的估计精度,同时更加贴近真实设定矩阵的稀疏结构。在后续的投资组合实证分析中,与传统样本协方差矩阵估计方法、均值-中位数估计方法和RA-LASSO方法相比,基于中心正则稳健估计构造的最小方差投资组合收益率有着更低的波动表现。 相似文献
3.
4.
《统计与信息论坛》2019,(6):3-9
时间序列自回归AR模型的Yule-Walker估计法在建模过程中易受离群值的影响,导致计算结果与实际不相符。针对这一现象,基于均值和方差的稳健组合估计量构建了稳健自相关函数,得到了时序AR模型的稳健Yule-Walker估计算法,以克服离群值的影响。并对此方法进行了模拟与金融数据实证检验,模拟和实证检验均表明:当时序数据中不存在离群值时,传统估计方法与稳健估计方法得到的结果基本保持一致;当数据中存在离群值时,运用传统估计方法得到的结果出现较大变化,而运用稳健估计方法得到的结果基本不变。这说明相对于传统估计方法,稳健估计方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。 相似文献
5.
时间序列自回归AR模型在建模过程中易受离群值的影响,导致计算结果与实际不相符。针对这一现象,运用FQn统计量对传统自相关函数进行改进,构建出自回归AR模型的稳健估计算法,以克服离群值的影响,并对此方法进行了模拟和实证分析。模拟和实证分析均表明:当时序数据中不存在离群值时,传统估计方法与稳健估计方法得到的结果基本保持一致;当数据中存在离群值时,运用传统估计方法得到的结果出现较大变化,而运用稳健估计方法得到的结果基本不变.这说明相对于传统估计方法,稳健估计方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。 相似文献
6.
政府统计数据质量是当前各界关注的热点问题,如何采用严谨的诊断方法,对我国统计数据进行科学的评估具有重要的现实意义。稳健回归方法可使求出的回归估计不受异常值的强烈影响,并且能更好的识别异常点。本文首次运用基于稳健MM估计的异常值诊断方法,在生产函数模型的框架下,分别使用两种不同的劳动投入数据,对改革以来我国GDP数据质量进行了评估。结果表明,基于稳健MM估计的异常值诊断方法可有效的解决传统方法容易出现的多个异常点的掩盖现象,改革以来我国的GDP数据是相对可靠的。 相似文献
7.
稳健主成分回归(RPCR)是稳健主成分分析和稳健回归分析结合使用的一种方法,本文首次运用稳健的RPCR及异常值诊断方法,对2008年我国地区经济增长横截面数据可靠性做了评估。评估结果表明:稳健的RPCR方法能更好的克服异常值的影响,使估计结果更加可靠,并能有效的克服经典的主成分回归(CPCR)方法容易出现的多个异常点的掩盖现象;基本可以认为2008年地区经济增长与相关指标数据是匹配的,但部分地区的经济增长数据可能存在可靠性问题。 相似文献
8.
文章克服了传统高维协方差阵估计方法的缺点,将主成分和门限方法相结合,提出了门限主成分正交补(TPO)估计量,该估计量主要通过前K个主成分来刻画高维协方差阵的信息,通过引入合适的门限函数来对矩阵的正交补进行稀疏估计,从而有效的降低了数据的维度并剔除了噪声的影响.模拟和实证研究发现:较严格的因子(SFM)模型而言,门限主成分正交补(TPO)模型明显提高了协方差阵的估计效率,并且将其应用在投资组合时,投资者获得了更高的收益和经济福利. 相似文献
9.
Cook距离公式常用于回归模型的异常值诊断,但由于公式中的样本方差■对异常值敏感,导致公式缺乏稳健性,使得诊断效果不理想。基于以上问题,文章选取绝对离差中位数作为样本标准差的稳健估计量,得到了样本方差■的稳健估计量,进而构造出稳健Cook距离公式;借鉴传统Cook距离的回归模型异常值诊断理论,将稳健Cook距离公式应用于时间序列异常值诊断,拓展了传统Cook距离公式的异常值诊断领域。通过选取模拟样本量分别为50、100、200,污染率分别为0、1%、5%、10%的ARMA(1,1)序列及金融时间序列进行实例分析,结果发现:(1)在无污染时,稳健Cook距离法与常规Cook距离法的诊断正确率均为100%,两者没有出现"误诊"现象;(2)在样本量、污染率同时增大时,常规Cook距离诊断正确率急剧下降,当污染率达到5%及以上时,已基本无诊断力,而稳健Cook距离法依然能保持较高的诊断力。稳健Cook距离法不仅能应用于时间序列异常值诊断,也能应用于回归分析的异常值诊断。 相似文献
10.
文章将单因子协方差阵和样本协方差阵相结合,通过对它们进行最优加权平均,提出了新的协方差阵估计方法——动态加权收缩估计量(DWS).该估计量一方面通过选择最优的权重来平衡协方差阵估计的偏差和误差;另一方面估计的是大维数据的动态协方差阵,在估计过程中考虑了前期信息的影响.通过模拟和实证研究发现:较传统的协方差阵估计方法而言,DWS估计量明显提高了大维协方差阵的估计效率;并且将其应用在投资组合时,投资者获得了更高的收益和经济福利. 相似文献
11.
文章分析了已有研究提出的时间序列新息异常值诊断法的不稳健性,并从以下两点对其进行稳健改进:一是构建稳健ARMA模型,确保基于该模型得到的残差不受异常值干扰;二是采用无偏Shamos估计量作为残差标准差σ的稳健估计量。通过以上改进,得到了新息异常值稳健诊断统计量。在模拟样本量分别为50、100、200、500,污染率分别为1%、5%、10%时比较传统诊断法与稳健诊断法的诊断效果,结果发现:传统诊断法受异常值干扰较大,在每种样本量下,随着污染率增加,诊断正确率急速下降,特别是在高污染率(10%)下,已基本无诊断力,而稳健诊断法不受异常值干扰,正确率均为100%。随后将稳健诊断法应用于金融时间序列异常值诊断,诊断结果与实际情况相吻合。 相似文献
12.
13.
时间序列异常值检测是时间序列分析研究中的重要内容,然而,在实际检测中往往存在“遮蔽效应”问题。文章分析了已有研究提出的时间序列TC型异常值检测法的不稳健性,并从两个方面进行改进:第一,建立基于Huber权函数的稳健ARMA模型,得到无干扰AR系数与MA系数;第二,用绝对离差中位数作为残差稳健估计量。通过以上改进得到了TC型异常值稳健检测统计量,并通过模拟对比小样本、中样本、大样本,轻污染、中污染、重污染情形下传统检测法与稳健检测法的检测效力,结果发现:在小样本、轻污染率下,两种检测法相差不大,但随着样本量、污染率的增加,稳健检测法显著优于传统检测法。最后,稳健检测法的优良性在金融市场异常现象检测中得到进一步说明。 相似文献
14.
高维数据给传统的协方差阵估计方法带来了巨大的挑战,数据维度和噪声的影响使传统的CCCGARCH模型估计起来较为困难。将主成分和门限方法有效结合,应用到CCC-GARCH模型的估计中,提出基于主成分正交补门限方法的CCC-GARCH模型(PTCCC-GARCH)。PTCCC模型主要通过前K个最优主成分来刻画大维协方差阵的信息,并通过门限函数以剔除噪声的影响。通过模拟和实证研究发现:较CCCGARCH模型而言,PTCCC-GARCH模型明显提高了高维协方差阵的估计和预测效率;并且将其应用在投资组合时,投资者获得了更高的投资收益和经济福利。 相似文献
15.
经典的充分降维方法对解释变量存在异常值或者当其是厚尾分布时效果较差,为此,经过对充分降维理论中加权与累积切片的分析研究,本文提出了一种将两者有机结合的稳健降维方法:累积加权切片逆回归法(CWSIR)。该方法对自变量存在异常值以及小样本情况下表现比较稳健,并且有效避免了对切片数目的选择。数值模拟结果显示CWSIR要优于传统的切片逆回归(SIR)、累积切片估计(CUME)、基于等高线的切片逆回归估计(CPSIR)、加权典则相关估计(WCANCOR)、切片逆中位数估计(SIME)、加权逆回归估计(WIRE)等方法。最后,我们通过对某视频网站真实数据的分析也验证了CWSIR的有效性。 相似文献
16.
随着计算机技术的迅猛发展,高维成分数据不断涌现并伴有大量近似零值和缺失,数据的高维特性不仅给传统统计方法带来了巨大的挑战,其厚尾特征、复杂的协方差结构也使得理论分析难上加难。于是如何对高维成分数据的近似零值进行稳健的插补,挖掘潜在的内蕴结构成为当今学者研究的焦点。对此,本文结合修正的EM算法,提出基于R型聚类的Lasso-分位回归插补法(SubLQR)对高维成分数据的近似零值问题予以解决。与现有高维近似零值插补方法相比,本文所提出的SubLQR具有如下优势。①稳健全面性:利用Lasso-分位回归方法,不仅可以有效地探测到响应变量的整个条件分布,还能提供更加真实的高维稀疏模式;②有效准确性:采用基于R型聚类的思想进行插补,可以降低计算复杂度,极大提高插补的精度。模拟研究证实,本文提出的SubLQR高效灵活准确,特别在零值、异常值较多的情形更具优势。最后将SubLQR方法应用于罕见病代谢组学研究中,进一步表明本文所提出的方法具有广泛的适用性。 相似文献
17.
文章通过比较加权最小二乘,极大似然估计,广义估计方程,分位回归和复合分位回归五种方法在随机效应模型中对固定效应的估计效果,来说明各种方法在不同情况下的表现性能,重点介绍了各个方法的应用背景并给出固定效应、随机效应以及协方差估计的表达式.文章通过蒙特卡洛模拟来进一步说明这些方法的表现情况.最后通过实际的生物数据来说明各个方法的应用. 相似文献
18.
基于稳健马氏距离的多元异常值检测 总被引:3,自引:0,他引:3
多元数据由于其复杂性而使其中的异常值检测问题成为一个研究难点.传统的多元统计方法由于受异常值影响使结果产生不稳定性.本文提出一种基于稳健马氏距离的异常值检测方法,并与其它一般的传统办法进行比较说明其优良性. 相似文献