首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
在多元统计分析中,分片逆回归在处理降维问题时十分有效。假设因变量Y和p维解释变量X满足Y=f(β1TX,…,βkTX,ε),则可以通过分片逆回归估计由βi生成的子空间,从而达到降维的目的。其中涉及到对E[Cov(X|Y)]或Cov[E(X|Y)]的估计,对此Li(1991)、Zhu和Ng(1995)以及Tian和Li(2004)等人曾提出几种不同的估计方法。文章通过蒙特卡洛模拟对它们进行比较研究,发现Zhu和Ng的方法对函数形式不敏感,因而适用性较广;同时对Tian和Li(2004)的方法作了适当推广。  相似文献   

2.
马少沛等 《统计研究》2021,38(2):114-134
在大数据时代,金融学、基因组学和图像处理等领域产生了大量的张量数据。Zhong等(2015)提出了张量充分降维方法,并给出了处理二阶张量的序列迭代算法。鉴于高阶张量在实际生活中的广泛应用,本文将Zhong等(2015)的算法推广到高阶,以三阶张量为例,提出了两种不同的算法:结构转换算法和结构保持算法。两种算法都能够在不同程度上保持张量原有结构信息,同时有效降低变量维度和计算复杂度,避免协方差矩阵奇异的问题。将两种算法应用于人像彩图的分类识别,以二维和三维点图等形式直观展现了算法分类结果。将本文的结构保持算法与K-means聚类方法、t-SNE非线性降维方法、多维主成分分析、多维判别分析和张量切片逆回归共五种方法进行对比,结果表明本文所提方法在分类精度方面有明显优势,因此在图像识别及相关应用领域具有广阔的发展前景。  相似文献   

3.
文章以美国威斯康星州的乳腺癌调查数据为例,分别采用SIS和TCS算法对高维数据进行降维处理,尝试将改进的Logistic广义线性模型对降维后的变量进行拟合.再与传统的一般线性模型、Logistic广义线性模型相比,结果表明,基于算法降维后的Logistic广义线性模型预测误差更小,其中基于TCS算法降维后的广义线性模型在拟合中要明显优于SIS算法降维后的广义线性模型.  相似文献   

4.
在高维空间中进行统计建模通常会碰到"维数祸根"问题,解决办法之一是降维,充分降维是一种有效的降维方法。针对多维响应降维子空间提出一类矩生成函数估计方法及其改进估计量,并给出该类方法估计量的大样本性质:相合性、渐近正态性。通过随机模拟与实例分析,表明改进估计量估计效果有较大幅度提高。  相似文献   

5.
李向杰等 《统计研究》2018,35(7):115-124
经典的充分降维方法对解释变量存在异常值或者当其是厚尾分布时效果较差,为此,经过对充分降维理论中加权与累积切片的分析研究,本文提出了一种将两者有机结合的稳健降维方法:累积加权切片逆回归法(CWSIR)。该方法对自变量存在异常值以及小样本情况下表现比较稳健,并且有效避免了对切片数目的选择。数值模拟结果显示CWSIR要优于传统的切片逆回归(SIR)、累积切片估计(CUME)、基于等高线的切片逆回归估计(CPSIR)、加权典则相关估计(WCANCOR)、切片逆中位数估计(SIME)、加权逆回归估计(WIRE)等方法。最后,我们通过对某视频网站真实数据的分析也验证了CWSIR的有效性。  相似文献   

6.
灰色成分数据模型在中国产业结构分析预测中的应用   总被引:3,自引:0,他引:3  
针对成分数据这种特殊类型的统计数据,提出一种新的预测建模方法:对于一列按照时间顺序收集的成分数据,先运用对数变换使成分数据降维,然后对降维后的数据运用GM(1,1)模型进行预测,最后再将预测值进行反对数变换,从而得到了各成分的预测值.根据提出的方法,建立了中国产业结构的预测模型,并分析了中国产业结构的发展趋势和未来状况.经检验,运用该方法预测出的数据与实际值十分吻合.  相似文献   

7.
在研究神经网络算法和主成分分析理论的基础上,针对股票市场的高度非线性特征,结合主成分分析预处理方法,对原始交易数据进行降维,减少数据规模,提出一种改进的RBF神经网络模型对股票市场进行预测.通过实验对比表明,文章提出的模型具有收敛速度快、预测准确度高等特点,应用前景较好.  相似文献   

8.
一、引言 对于多元线性回归模型Y=Xβ+ε,其中Y为因变量的观测向量,维度为n×1,X是自变量的观测矩阵,其维度为n×(p+1),β是p+1维的系数向量,ε是n维随机向量且εi~ N(0,σ28).根据Gauss-Markov定理,参数β的最小二乘估计量β=(X'X)-1X'Y是最优线性无偏估计(BLUE).当自变量之间存在高度的共线性,则最小二乘估计的结果尽管在理论上有较好的性质,但在实际应用中,参数估计值可能会极不稳定,易导致参数估计值缺乏合理含义. 针对多重共线性对模型估计所带来的这些影响,Hoerl (1962)和Hoerl & Kennard(1970)分别提出和发展了一种改进普通最小二乘估计的方法,也就是现在大家所熟知的岭回归(Ridge Regression).  相似文献   

9.
文章运用主成分分析和BP神经网络方法,提出了用于衡量企业内部控制信息披露质量的主成分神经网络评价模型.运用主成分分析法对内部控制信息披露质量的系列指标进行降维,选出衡量内控信息披露质量的关键输入指标,并在此基础上运用BP神经网络算法,构建内部控制信息披露质量的主成分神经网络评价模型.  相似文献   

10.
本文简单介绍了分形插值的数学模型及其插值方法,构造了一种分形插值算法.该算法利用区间内的迭代函数系和吸引子由特定的初始点出发进行直接搜索,并通过迭代特定次数和获得的点集与吸引子均方偏差不断减小的过程来逐步调整初始点的纵坐标值,而均方偏差达到最小化时的纵坐标值可作为预测值.该值可用于非等距时序GM(1,1)的灰色预测问题.  相似文献   

11.
文章探讨有限维混合分布参数估计的EM算法,总结出有限维混合分布参数估计的EM算法期望、方差迭代表示.跳过繁琐的推导过程,快速得出混合高斯分布、混合指数分布参数估计的EM算法,并将其用于M2供应量同比增长分布和大变动时间间隔分布建模中.结果表明:采用三维混合高斯分布描述M2供应量同比增长分布、采用单一指数分布刻画M2供应量大变动时间间隔分布是合理的.  相似文献   

12.
交替方向法是求解变分不等式的一种有效算法.文章对Han与Luo提出的解强制非线性变分不等式的交替方向法中的步长规则进行了改进,得到了新的修正交替方向法.该方法利用改进的步长规则和增加一个在简单集K上的投影来得到下一次迭代点,提高了Han与Luo算法的可操作性和效率.文章还验证了该算法的收敛性.  相似文献   

13.
秦磊  王奕丹  苏治 《统计研究》2020,37(3):114-128
随着信息技术的飞速发展,大规模数据在短时间内搜集并储存下来,为分析决策提供了巨大的信息量,也给统计建模带来了一定难度。对于样本容量大、变量个数少的数据,Leverage重要性抽样是一个简便可行的方法。本文发现,该方法中度量样本重要性的Leverage分数与因变量无关,而且在维度较大的情形下对样本没有区分程度,使得估计结果较差。为了同时考虑因变量和维度的影响,本文提出了基于充分降维的Leverage重要性抽样方法。该方法以不损失信息为前提,在充分降维的空间内重新计算Leverage分数,使得抽样更具有代表性。模拟数据分析显示,在样本容量较大的复杂数据中,相比于原始的Leverage重要性抽样方法,本文提出的方法可以降低估计的均方误差。三个实际数据也证实了该方法的可行性和有效性。  相似文献   

14.
供应链物流客户服务水平的评价   总被引:1,自引:0,他引:1  
为了科学地评价供应链物流客户服务水平,文章从交易前、交易中和交易后三个维度建立了供应链物流客户服务评价评价指标体系:然后运用DEMATAL方法对众多的观测指标进行了优化和降维.最后,在指标体系基础上,采用网络层次分析方法analytic networks process(ANP)对各评价指标的权重进行计算.  相似文献   

15.
文章在简要介绍EM算法的基础上,对MCMC算法,特别是DA算法实现缺失数据补全做了深入探讨,介绍了DA算法迭代模拟过程,并对DA算法与EM算法进行了比较。  相似文献   

16.
 本文讨论了指数族广义部分线性单指数模型(Generalized Partially Linear Single Index Models, GPLSIM) 的惩罚样条迭代估计,提出了基于惩罚似然和一组预先取定的单指数参数向量 的初始估计的迭代估计算法。另外本文还通过一组模拟数据的分析对所提出的迭代算法进行了验证。  相似文献   

17.
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。  相似文献   

18.
主成分方法在经济管理综合评价应用中的误区   总被引:4,自引:0,他引:4  
主成分分析是一种常用的多元统计方法,由于其降维的思想与多指标评价指标序化的要求非常接近,而且这种方法能浓缩信息,使指标降维,从而简化指标的结构,深刻反映问题的本质.近年来更多地被应用于社会学、经济学、管理学的评价中,逐渐成为一种独具特色的多指标评价技术.但在运用中也出现了一些问题,本文就在这些方面作一些探讨.  相似文献   

19.
与正态回归相比,学生t回归模型是一种对异常值较稳健的回归模型,通常用Gibbs抽样算法估计参数.而Gibbs抽样是一种迭代算法,所得样本不是独立样本,统计推断之前需判断其收敛性.文章探讨了一种基于逆贝叶斯公式的非迭代抽样算法,该算法利用t分布的正态混合表示,结合EM算法和重要再抽样算法,得到参数的独立同分布的后验样本,该样本可直接用于统计推断,从而避免了Gibbs抽样中的问题.  相似文献   

20.
文章提出了估计正态序列均值变点位置的非迭代抽样算法.利用逆贝叶斯公式,得到了变点位置的精确后验分布,通过对该离散分布抽取样本,得到变点位置的贝叶斯估计.模拟显示该算法能有效地估计变点位置,并且计算速度比迭代的Gibbs抽样算法快.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号