首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了克服信用评分模型中自变量存在多重共线性的问题,文章引入了偏最小二乘思想,即采用限制预测值的偏最小二乘回归和偏最小二乘Logistic回归来创建信用评分模型。偏最小二乘法可以同时解释因变量和自变量的变异,在实际运用中更加符合信用评分模型的特点。实证研究的结果表明,利用这两种偏最小二乘模型创建的信用评分模型具有很好的准确性和稳定性。  相似文献   

2.
张忠平 《统计研究》1993,10(1):57-58
回归分析是进行统计预测、描述,评价经济变量间关系及进行政策模拟的一种重要方法。在进行回归分析时,一个重要的问题是模型的优选。一方面是在模型形式一定的情况下选择自变量(即在所有可能自变量中选择出最佳的自变量组合),另一方面是模型形式的选择。 在回归分析中,最简单的模型是线性回归模型:  相似文献   

3.
一种基于逐步回归的国家财政收入模型   总被引:1,自引:0,他引:1  
李晓虹  杨有 《统计与决策》2006,(23):147-148
一、逐步回归模型的建立(一)变量选取在使用回归分析建立模型时,首先遇到的一个重要问题就是自变量的选择问题。一方面为获取全面信息,总希望模型中包含的自变量尽可能多;另一方面,考虑到获取很多白变量的观测值的费用和实际困难,则希望模型中包含的变量是最重要的、且尽可能地  相似文献   

4.
蒋青嬗等 《统计研究》2019,36(6):115-128
内生性是常见的计量问题,忽略内生性会导致估计量有偏且不一致。现有部分文献研究了内生性随机前沿模型的估计,但实现的前提是能够为内生性自变量寻找到合适的工具变量,而实际情况下合适的工具变量通常不容易获取。本文研究了在难以找到合适的工具变量的情况下内生性随机前沿模型的估计问题:结合Copula方法和极大模拟似然方法估计参数。此外,本文还构造了技术无效率的新的点估计,该点估计额外利用了内生自变量的信息,通常比JLMS法对应的点估计更有效。数值模拟表明,相比于已有研究,本文提出的方法估计精度更高。  相似文献   

5.
王小燕等 《统计研究》2014,31(9):107-112
变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构作筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后本文将adSGL法应用到信用卡信用评分研究,对比logistic回归,它具有更高的分类精度和稳健性。  相似文献   

6.
如果一个因变量是由一个或多个自变量来解释的,那么对这些数据可以建立回归模型.但如果因变量和自变量同时又是时间序列,则也可以建立传递函数模型(transferfunction models).与普通的回归模型相比,传递函数模型说明因变量与自变量以及扰动项之间关系时,有着更为丰富的结构.在多变量时间序列模型方面,有关线性回归模型与传递函数序列在时间序列方面应用效果的比较很少,因此,本文拟进行这方面的研究,为多变量时间序列建立模型提供参考.  相似文献   

7.
范新妍等 《统计研究》2021,38(2):99-113
传统信用评分方法主要利用统计分类方法,只能预测借款人是否会发生违约,但不能预测违约发生的时点。治愈率模型是二分类和生存分析的混合模型,不仅可以预测是否会发生违约,而且可以预测违约发生的时点,比传统二分类方法可以提供更多的信息。另外,随着大数据的发展,数据源越来越多,针对相同或者相似任务,可以收集到多个数据集,本文提出了融合多源数据的整合治愈率模型,可以对多个数据集同时建模和估计参数,通过复合惩罚函数进行组间和组内双层变量选择,并通过促进两个子模型回归系数符号相同,提高模型的可解释性。通过数值模拟发现,所提方法在变量选择和参数估计上均有明显优势。最后,将所提方法应用于信用贷款的违约时点预测中,模型表现良好。  相似文献   

8.
变量选择在超高维统计模型中非常重要。Fan和Lv基于简单相关系数提出确保独立筛选法(SIS),但当自变量被分成组时,SIS就会失效。因为SIS只能对单个变量进行选择,不能对组变量进行选择。为此,基于边际组回归提出组确保独立筛选法(GSIS),该方法不仅对组变量有效,对单个变量也有效,或者两者的混合也同样有效。Monte Carlo模拟结果显示,GSIS的表现优于SIS。  相似文献   

9.
层-1自变量中心化方法的选择是分层线性模型中的一个关键问题,它直接影响到模型参数的估计和解释.国外已有很多学者对其进行了理论和实践方面的研究,但是在实证研究中选择适当的中心化方法仍然存在困难,为能够给研究人员提供一点参考依据,在给出两层模型自变量的三种主要中心化方法以后,回顾了分层线性模型中层-1自变量中心化产生的影响,总结了具体应用中不同中心化方法的适用情况和如何进行选择的一些建议.  相似文献   

10.
信用评分是各类机构进行信用管理的有效工具,有着广泛的应用前景。随着计量技术的发展,信用评分方法也不断革新,为实际应用提供了多种选择。选取Logistic回归、分类树两种统计方法及代表信用评分发展趋势的人工智能神经网络中的多层感知器、径向基网络、自组织特征映射网络、支持向量机等共六种模型,运用较大样本量的个体工商户数据在一致的框架下进行检验。结果表明:Logistic回归模型与支持向量机两种方法在错分率、稳定性及适用性方面较为优越,其中支持向量机作为人工智能评分方法的最新应用之一,其综合性能更为突出。  相似文献   

11.
边际     
《四川统计》2008,(1):24-24
在现代汉语中,边际就是指边缘、界限的意思。在经济学中,边际有额外的、追加的意思,指处于边缘之时,再增加一个单位所发生的变化,属于导数和微分的概念,由于披上了数学的面纱并被冠以经济学的术语,因此,许多人对边际一词觉得不好理解:在经济学分析中,人们经常把所研究的各种变量分为两种:自变量和因自变量变动而变动的因变量。而边际的含义就是因变量关于自变量的变化率,说得通俗点,就是指自变量变化一个单位时,因变量的变化情况。边际分析就是分析自变量变动与因变量变动的关系的一种方法。边际分析法广泛运用于经济行为和经济变量的分析过程之中,如效用、成本、收益、消费等分析多有边际的概念,人们所熟知的边际效用递减规律,就通常用吃馒头来形象地加以说明:把吃馒头作为自变量,  相似文献   

12.
信用评分模型综述   总被引:2,自引:0,他引:2  
本文对信用评分领域大量的模型和方法以及相关文献做了细致的分类和综合比较,这些模型包括多元判别分析模型、数学规划法、Logistic回归分析和神经网络模型等。  相似文献   

13.
国际经验表明,信用评分技术可较好地解决小企业贷款高成本、高风险及信息不对称难题.本文广泛选取了可适用于小企业主信用评分领域的12种数据挖掘模型(包括本文的改进模型门限Logistic),并以3个银行微观客户数据集为案例,通过10折交叉验证和预期分类错误成本的方式,检验了这些模型的综合信用评分能力.分析结果及稳健性检验表明,本文改进的门限Logistic模型在模型预测能力及预期错误分类成本等多方面表现优秀;而基于决策树的组合方法也表现良好.本研究对国内商业银行建立合适的小企业主贷款信用评分模型具有参考意义,也有助于推动银行微观金融统计,完善金融统计工作.  相似文献   

14.
我们知道,企业的现金流风险是一个模糊的概念,现金流风险度量模型中测量误差的发生,会导致常规回归模型参数估计产生偏差,并且现金流风险受众多因素的影响,这些因素之间可能存在多重共线性,把这些因素不加剔除全部纳入模糊综合评判模型,可能导致模型的失效.虽然传统的路径分析允许对潜变量设立标识,并可处理测量误差,但不能分析潜变量之间的关系,而结构方程方法的特点在于,它既能在分析中处理测量误差,又可分析潜变量之间的结构关系,并且,结构方程模型能根据模型和数据之间的拟合程度,来决定如何删除、增加或修改模型的变量和参数,对模型进行修正,最后得到的模型中只保留了对因变量有显著影响的自变量.因此,我们拟采用结构方程模型来解决权重的确定问题,并进行实证研究以证明此方法的适用性.  相似文献   

15.
改革开放以来,随着我国经济的繁荣,对于经济活动的分析也逐步趋向定量化,经济计量方法得到了较广泛的运用。在经济计量分析中,多元线性回归模型占有很重要的地位。据统计,在我国用于预测分析的方法中有30%左右是用线性回归模型进行的,在一般的经济分析中,多元线性回归模型使用的比例更高。一、问题的提出设X1,X2…,Xn是依据实际问题搜集到的预报变量(指标或者称为自变量),Y是响应变量(因变量)。为了建立一个用于经济分析的多元线性回归模型,我们希望模型中包含尽量多的X变量,以得到可靠的拟合值。但是,如果方程中包含了…  相似文献   

16.
在分类预测模型的自变量间存在交互效应时,传统Shapley值法的可加性无法满足,造成变量筛选效果变差,导致分类模型的预测精度降低。针对此问题,文章提出使用稳健独立成分分析,从原始数据中估计出具有独立性的数据集并对其进行Shapley值分解,从而提高变量筛选的准确度。统计模拟与实证分析的结果表明,改进后的方法在变量筛选上的表现优于传统Shapley值法。  相似文献   

17.
变量选择是处理高维统计模型的基本方法,在回归模型的变量选择中SCAD惩罚函数不仅可以很好地选择出正确模型,同时还可以对参数进行估计,而且还具有oracle性质,但这些良好的性质是基于选择出一个合适的调节参数。目前国内关于调节参数选择方面大多是对于变量选择问题的研究,针对广义线性模型基于SCAD惩罚使用新方法 ERIC准则进行调节参数的选择,并证明在一定条件下经过该准则选择的模型具有一致性。模拟与实证分析结果表明,ERIC方法在选择调节参数方面优于传统的CV准则、AIC准则和BIC准则。  相似文献   

18.
文章研究了自变量可作重复观测的线性回归模型.对固定自变量X采用重复观测,得到应变量Y的多个观测值,并利用其均值与X构成数对,建立起自变量重复观测的线性回归模型.讨论了这种模型在一元时的情形,实例分析结果表明,该线性回归模型的参数估计值的方差更小,较之传统回归模型更为有效.  相似文献   

19.
吴梦云等 《统计研究》2021,38(8):132-145
多分类数据分析在实证研究中具有重要意义。然而,由于高维数、小样本及低信噪比等原因,现有的多分类方法仍面临信息量不足而导致的效果不佳问题。为此,学者们通过收集更多信息源 数据以更全面地刻画实际问题。不同于收集相同自变量的不同源样本,目前较为流行的多源数据收集了相同样本的不同源自变量,它们的独立性和相关性为统计建模带来了新的挑战。本文提出基于典型变量回归的多分类纵向整合分析方法,其中利用惩罚技术实现变量选择,并独特地考虑不同源数据间的关联结构,提出高效的ADMM算法进行模型优化。数值模拟结果表明,该方法在变量选择和分类预测 上均具有优越性。基于我国上证50的多源股票数据,利用该方法对2019年股票日收益率的影响因素进行了实证探究。研究表明,本文提出的多分类整合分析在筛选出具有解释意义变量的同时具有更好的预测效果。  相似文献   

20.
文章旨在考察经济计量模型中不相关单位根变量间伪回归现象形成的内在成因,为这类伪回归的纠正提供方法依据.借助三个定理的证明,分析了不相关单位根变量间伪回归形成的过程.研究表明,在回归模型中包括自变量和应变量的一阶滞后变量可纠正伪回归的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号