首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
回归系数稳定性的检验及实证分析   总被引:1,自引:0,他引:1  
江海峰 《统计与决策》2005,(21):126-127
一、问题的提出 对于一般的线性回归模型 yi=b0+blxli+b2x2i+…+bkxki+εii=1,2…n 而言,通常的做法是根据实际问题收集资料,使用最小二乘法回归得出系数的估计值,然后进行系数显著性的t检验和回归方程整体显著性的F检验,在通过检验之后就用模型进行预测等应用.然而一个值得重视的问题却经常被忽略,即回归系数在样本期内和样本期外是否稳定.如果系数无论在样本期内还是样本期外都不稳定,那么进行系数估计和预测所得到的结论就值得怀疑,因为前者使用整个样本期的数据进行回归就掩盖了系数突变的特征,而后者使用系数突变的模型进行样本外推断,结果的合理性当然有待证实.  相似文献   

2.
在回归问题中,惩罚特征即正则化是特征处理的常用方式。但在集成分类问题中,惩罚特征以改善训练效果的研究较少。文章提出一种基于GBDT模型训练的SHAP值对各样本特征惩罚加权,进而提升分类精度的集成模型;其中,对于测试样本的SHAP值估计,通过其与训练集的样本距离权重结合训练集的SHAP矩阵近似得到。实验结果表明:选择GBDT_SHAP值惩罚特征后,模型的预测精度均有显著提升,验证了该算法的有效性。以GBDT_SHAP_GBDT模型为例,其在多组经典数据集上的分类效果良好,且在不平衡数据集上性能突出;若干组仿真实验表明,该方法能使模型快速达到较优且较为稳定的拟合效果,鲁棒性较强。  相似文献   

3.
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。  相似文献   

4.
一种小样本成本分析模型   总被引:1,自引:0,他引:1  
成本分析是管理会计的基本问题,合理地分析成本构成对于企业管理与短期经营决策有十分重要的意义。传统方法中的散布图法、高低点法等直观方便、简单易行,但过于粗糙,普通回归分析方法又要求太多的观察值(n≥30),适用性较差。本文介绍一种线性回归模型,它采用线性规划方法,可以用Excel在计算机上实行快速分解,操作简单,并确保在小样本情况下,精确度最高。  相似文献   

5.
张维铭 《统计研究》1989,6(3):67-71
指数平滑法是回归分析和时间序列相结合的一种预测方法。华伯泉同志在《统计研究》1986年第2期中介绍了这种方法,但没有解决平滑常数和初始统计量的合理确定问题,也没有提到模型和实际数据是否适合的检验问题;并且以普通回归方程中y的预测区间代替指数平滑法中Z的预测区间,这是不合适的。本文试图解决这些问题,并研究K个观测值总和的预测区间。 -、以时间为独立变量的回归模型 设Z_(n j)表示在时间n j的观测值,考虑如下形式的模型:  相似文献   

6.
非线性回归模型及其应用   总被引:1,自引:0,他引:1  
一、引言实际数据与预测数据呈线性关系的情况是少见的,多数情形呈明显的非线性的关系。对于这种情况我们有多种处理方法,其中一种是根据散点图中点与分布形状考察它在什么样的曲线附近波动,再将该曲线与标准的函数图象进行对比,从而寻找合适的回归模型,在这些回归模型中有一些模型可以通过变换,化为一元线性回归模型,在应用中具有很好的效果。本文给出几种非线性回归模型,并将它们应用到对内蒙古人口总数的预测中去,效果较为理想。二、非线性回归预测出型1、toqlStiC模型,此模型是荷兰生物数学家Verhult为研究人口发展规律而建…  相似文献   

7.
统计预测方法的特点研究   总被引:6,自引:0,他引:6       下载免费PDF全文
徐国祥 《统计研究》1999,16(2):52-56
一、统计预测方法的分类研究现代预测方法的发展,往往是各种预测方法的交叉运用,相互渗透,很难有截然的划分。因此,在分类问题上不能绝对化。但按预测的性质,大致上可分为定性预测法、回归预测法(包括经济计量模型法)、时间序列预测法和组合预测法四类。1.定性预...  相似文献   

8.
钱雪亚 《浙江统计》1997,(12):19-21
一、问题的提出回归分析是利用回归方程(函数)研究总体变量间依存关系的一种专门方法。由于研究总体的大量性所决定,实践中,回归分析一般是依据样本资料进行的,是一个以样本观察的数量关系──样本回归函数(SRF,或称经骏函数)去推断总体真实的数量关系──总体回归函数(PRF)的抽样推断过程。以一元线性回归为例,设:总体回归模型(2)(X1,Y1),(X2,Y2)……(Xn,Yn)为取自总体的一个样本,拟合得:SRF:(3)回归分析的过程实质上就是用(3)式估计(2)式,从而对总体进行经济预测、结构分析、政策评价等。显然,…  相似文献   

9.
在实际应用中,对于有限的样本,分位数回归存在一个普遍的问题,即不同分位数回归曲线会出现相交的现象.这一现象违背了基本的概率理论:分位数函数的单调不减性.文章基于中分布函数样本分位数的定义的启发,对分位数回归曲线相交问题提出一种修正方法:利用两条不同回归曲线的加权组合对所需要修正的回归曲线进行修正,并通过一个实例表明所提出的修正方法是简单有效的.  相似文献   

10.
时间序列曲线分类的目的是为了找到曲线之间相似波动结构、减少建模工作量和进行预测,所以分类的结果将直接影响模型的质量和预测的精度.为此,文章提出了一种新的时序曲线分类方法-分位点回归系数聚类法.它可以有效地避免一些分类方法带来的局限性,能够更为全面、详尽地考查待分类时序数据的运行方式,改善分类的效果并为预测提供强大的支持.  相似文献   

11.
曲线趋势预测在市场预测等领域应用广泛。曲线趋势预测模型的建立一般采取人工计算,这样势必非常繁琐。而计算机的日益普及给这项工作带来极大的方便,并且还具有省时、准确等优点。下面介绍一种能建立曲线预测模型的计算方法。一、计算原理曲线趋势模型的数学表达式是:(设Yt为销售量,X代表时间)建立曲线趋势模型实际上是求(1)式中的系数a,b,c,…,k。设Yi为估计值则:Yai为观察值:(ei为Yai与Yi的残差)则总方差:根据最小二乘法原理,偏导数把(6)式整理后,可得下列方程组在具体实现时,先选定误差精度(E),取n=1,求得…  相似文献   

12.
一、引言自Bates和Grange1969年在运筹学季刊上发表论文《组合预测》以后,国内外对组合预测的研究日趋活跃,已有不少方法和应用成果。通常组会预测模型是用多个预测方法对同一预测对象进行预测的加权组合。而各个预测模型的权重合成方法已有十几种。本文主要利用最小二乘、最小一乘及极小极大化准则下组合预测模型,讨论组合证券投资决策模型。二、最优加权组合预测模型对于一个实际预测问题,设yi,yZ…,人为n期实际数据,欲利用这n期数据对未来的n+1期数据八十;进行预测,设为对于上述预测问题的N种不同预测模型的预测值,误差为:…  相似文献   

13.
据不完全统计,现有的各类预测方法达300种之多,而通常用于系统安全数据预测的方法主要有回归分析法、德尔菲法、趋势外推法、马尔可夫预测、齐次泊松过程模型、指数平滑线、残差辩识法、模型法和灰色预测法等。这些预测方法可分成3类:前5种是统计型的;指数平滑与残差辩识属递推型;灰色预测与模型法则属于连续型。现就这几种预测方法作一简要评述。一、统计型的预测方法1、回归分析法这是一种传统的分析、预测方法,长期以来作为一种经典方法而广泛应用,且种类较多。在系统安全数据的预测上,目前运用较多的为单元线性回归和单元指数回归。由于…  相似文献   

14.
构造一种称为双回归的时间序列预测新方法。本文作者利用与因变量自身相关性紧密的因变量前几期取值,综合前一次的自变量构建了双回归(时间序列自回归-多元线性回归)预测组合模型。这种方法克服了以往时间序列预测只是自身拓展而不考虑多项因素(变量)的不足,也弥补了回归分析预测法必须已知同时期各个自变量值才能预测的缺陷。并用这种新方法对中国的人口总量进行预测,预测效果比较理想。  相似文献   

15.
彭寿康 《统计研究》2002,2(11):24-27
一、引言Logistic回归模型是对二分类因变量 (因变量y只取两个值 )进行回归分析时经常使用的统计分析方法。与线性回归不同 ,Logistic回归是一种非线性模型 ,因而普遍采用的参数估计方法是最大似然估计法。可以证明 ,在随机样本条件下 ,Logistic模型的最大似然估计具有一致性、渐进有效性和渐进正态性。然而在有些问题的研究中 ,样本抽取并不完全是随机的 ,而是采用分层抽样方法 ,首先将研究总体按属性特征分类 ,然后在各类中随机抽取样本 ,这就需要考虑分层抽样条件下Logistic模型的参数估计问题。对分层…  相似文献   

16.
为探索一种较为有效的工具来提高税收收入预测精度,利用1985-2004年的样本数据,建立了五个模型来预测中国2005年的税收收入。结果表明:ARMA(1,1)模型中,以GDP为外生变量的自回归模型、以政策因素为虚拟外生变量的自回归模型以及对数线性移动平均模型都是预测税收收入的有效模型,但以GDP为外生变量的自回归模型在预测2005年税收收入时,预测值与实际值的预测偏差仅有1.23%,此模型在预测税收收入时预测精度最高,是预测税收收入的一种较为有效的工具。  相似文献   

17.
自标记方法能用少量有标记样本和大量无标记样本来训练给定分类模型。误标记是自标记方法中的主要挑战。尽管学者们用数据剪辑技术去识别和移除在自标记方法迭代过程中被误预测的样本,但是许多数据剪辑技术严重依赖于特定假设。为了克服误标记问题和相关解决方案中的缺陷,文章提出一种基于近邻规则和粒子群优化的自标记方法 SLM-NNPSO。首先,SLM-NNPSO用有标记集去训练一个给定的分类模型。其次,SLM-NNPSO用近邻规则来发现具有高置信度的无标记样本,并用被训练的分类模型来预测他们。再次,SLM-NNPSO用粒子优化来识别和移除被误预测的样本,并把被正确预测的样本加入有标记集中。上述过程不断迭代,直到SLM-NNPSO没有发现具有高置信度的无标记样本。最后,SLM-NNPSO输出在迭代过程中被训练的分类模型。经仿真实验证明,就训练k近邻分类器的平均分类正确率而言,在来自销售市场、医学检测、图像识别等领域的12个真实数据集上,SLM-NNPSO优于5个流行的自标记方法。  相似文献   

18.
持续经营审计意见的出具属于多阶段决策问题,本文采用多分类Logistic回归模型,以131家上市公司为样本,对影响持续经营审计意见类型的因素进行了分析。提出了一个三分类Logistic回归模型,该模型对持续经营审计意见类型的预测准确率为83.2%,显示了良好的预测能力。  相似文献   

19.
Bootstrap方法在非参数核估计中的研究与应用   总被引:1,自引:0,他引:1  
当数据中存在异常值时,Bootstrap样本可能比原有样本舍有更多的"污染",这会影响要进行的统计推断的有效性.文章讨论了在非参数回归N-w估计中,如何利用影响函数(influencefunction)得到重新抽样的概率,使用调整后的非等概率Bootstrap抽样方法得到曲线的拟合,从而达到有效地抵制异常值对回归函数影响的目的.数值模拟的结果表明了这种处理方法的有效性.  相似文献   

20.
陈性生 《统计研究》1991,8(4):61-63
一、非线性回归校正模型非线性回归模型具有直观性强、计算简单、可检验等优点。但是,在实际应用中,对某一问题用多种曲线拟合往往都不能得到满意的效果,这主要是由于系统本身出现了一系列的转折性变化,例如受自然灾害、政策、价格等因素的影响。所谓转折性变化,是指在某一时点(称转折点)的前部曲线和后部曲线变化趋势不一致。为弥补这一不足,本文提出了非线性回归校正模型。其方法和步骤如下:第一步:将原始时序样本集S={y~0(1),y_0(2),…,y_0(n)}按时间顺序依次划分成互不相交的二个子集:  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号