首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
《统计与信息论坛》2017,(12):94-100
选择适合的机器学习算法是在社会经济研究领域进行大数据分析及提高预测效果的关键。在很多情况下,通过融合训练两种或两种以上有差异的算法,能够显著提高算法的泛化能力以提高预测效果。基于阿里巴巴电子商务平台购物行为数据,分别应用Logistic回归、支持向量机以及这两种算法的融合构建了预测模型。实证结果表明,融合后模型比单一模型具备更好的预测效果。  相似文献   

2.
文章针对参数选择关系着支持向量回归机的性能进而影响GDP预测效果这一问题,引入人工鱼群算法将支持向量回归机的参数选择转化为组合优化问题,得到应用人工鱼群算法优化支持向量回归机的短期GDP预测模型。以辽宁省的GDP数据为例,将该模型的预测结果与同为智能算法的BP神经网路和单纯的支持向量机进行对比,结果表明该模型的预测效果优于其余两个,具有更好的学习能力和推广能力。  相似文献   

3.
为了克服信用评分模型中自变量存在多重共线性的问题,文章引入了偏最小二乘思想,即采用限制预测值的偏最小二乘回归和偏最小二乘Logistic回归来创建信用评分模型。偏最小二乘法可以同时解释因变量和自变量的变异,在实际运用中更加符合信用评分模型的特点。实证研究的结果表明,利用这两种偏最小二乘模型创建的信用评分模型具有很好的准确性和稳定性。  相似文献   

4.
文章改变了过去个人信用评估模型多使用统计方法或者主观分析方法精简数据集属性个数的做法,将粗糙集与支持向量机结合的粗糙集支持向量机方法引入个人信用评估实践。以包括1000个统计样本的德国信用数据作为个人信用评估模型的数据来源,应用粗糙集分析系统RSES进行数据预处理,运用遗传算法计算约简,得出以不同的缩减率得到的约简集;然后使用支持向量机分析工具LIBSVM逐步处理已经进行过属性约简的数据集,并在处理过程中应用了交叉验证和网格搜索技术。  相似文献   

5.
基于支持向量机的上市公司信用风险评估研究   总被引:1,自引:0,他引:1  
文章运用一种基于小样本学习的支持向量机(SVM)方法构建信用风险模型进而应用于我国上市公司信用风险评估。实证分析的结果表明:支持向量机在信用风险评估中比多元判别分析(MDA)方法更为准确和有效;研究结果为银行、投资者有效判别信用风险提供了理论依据。  相似文献   

6.
支持向量机已经被成功应用于解决非线性回归和时间级数等问题。文章运用自适应遗传算法对支持向量回归进行最优参数设置,得到一种新的预测模型——AGASVR模型,并且将该模型应用于经济系统的和预测。实验结果表明,提出的模型相对神经网络模型、小波神经网络模型和灰色系统模型而言,运算精度高,是一种有效的经济系统预测方法。  相似文献   

7.
基于模糊支持向量机的客户信用评估研究   总被引:2,自引:0,他引:2  
文章首先比较了支持向量机与传统分类方法在银行客户信用评估中的效果,结果表明支持向量机更适于目前中国商业银行对个人信用的评价;其次引入模糊支持向量机处理银行客户信用样本中的不平衡问题。实证结果显示,带有模糊关系的支持向量机方法能够减小训练数据类别大小差异对决策机器造成的影响,有效地提高了信用评估的精度。  相似文献   

8.
支持向量机是一种基于统计学习理论的机器学习算法,在小样本情况下亦可得到很好的分类效果。文章提出了基于支持向量机的上市公司财务危机预测模型,公司财务指标作为支持向量机的输入,其数目较多,采用主成分分析方法降低支持向量机的输入向量维数。与多元统计方法、Logit及Probit模型进行比较,结果表明,该方法预测精度高,第一类错误及第二类错误显著减小。  相似文献   

9.
一、问题的提出在建立个人信用评分模型时 ,预测精度是非常重要的 ,因为许多情况下即使预测的准确性只提高一点点 ,也会使信贷机构的损失减少很多。正因为如此 ,大量的统计分类技术被应用到信用评分领域。文 [1]首次利用中国某商业银行的信用卡客户数据对多种个人信用评分方法在中国的适用状况进行了全面的比较研究。结果表明 ,不同的模型有自己不同的优点和缺点 :神经网络等非线性方法的精度往往要高于 (线性 )判别分析、Logistic回归、线性规划等线性评分方法 ;而Logistic回归、判别分析、线性规划等方法的稳健性① 则比神经网络方法要好…  相似文献   

10.
稳健参数设计是一种质量改进的重要技术,能够从产品生产的源头上减少和控制波动的产生。双响应曲面法是其常用的方法,主要是利用低阶多项式模型来拟合均值和方差响应,但当样本较复杂(如为非线性或者高维样本)时,低阶多项式模型的拟合性能往往较差,求解优化问题效果不佳。支持向量回归机对非线性数据有良好的拟合潜力,但其性能依赖于参数的合理设置,文章将贝叶斯优化应用于支持向量回归机的参数选择,并将优化后的模型应用于稳健参数设计中响应曲面模型的构建,提出一种基于贝叶斯支持向量回归机的稳健参数设计方法。试验结果表明,所提方法和其他常见优化方法相比,可以获得更精确的响应曲面,可以在实际应用中近似得到可靠的最优因子搭配水平。  相似文献   

11.
Statistical Classification Methods in Consumer Credit Scoring: a Review   总被引:11,自引:0,他引:11  
Credit scoring is the term used to describe formal statistical methods used for classifying applicants for credit into 'good' and 'bad' risk classes. Such methods have become increasingly important with the dramatic growth in consumer credit in recent years. A wide range of statistical methods has been applied, though the literature available to the public is limited for reasons of commercial confidentiality. Particular problems arising in the credit scoring context are examined and the statistical methods which have been applied are reviewed.  相似文献   

12.
方匡南  赵梦峦 《统计研究》2018,35(12):92-101
随着信息技术的发展,数据来源越来越多,一方面可以更加精准、科学地刻画个人信用状况,但另一方面,由于数据来源多、结构复杂等问题,对传统的征信技术带来了挑战。本文提出了基于多源数据融合的个人信用模型,可以同时对多个数据集进行建模和变量选择,同时考虑了数据集间的相似性和异质性。通过模拟实验发现,本文所提出的整合模型在变量选择和分类效果方面都具有明显的优势。最后,将整合模型应用于城市和农村两个数据集的个人信用评分中。  相似文献   

13.
Variable selection is an important decision process in consumer credit scoring. However, with the rapid growth in credit industry, especially, after the rising of e-commerce, a huge amount of information on customer behavior is available to provide more informative implication of consumer credit scoring. In this study, a hybrid quadratic programming model is proposed for consumer credit scoring problems by variable selection. The proposed model is then solved with a bisection method based on Tabu search algorithm (BMTS), and the solution of this model provides alternative subsets of variables in different sizes. The final subset of variables used in consumer credit scoring model is selected based on both the size (number of variables in a subset) and predictive (classification) accuracy rate. Simulation studies are used to measure the performances of the proposed model, illustrating its effectiveness for simultaneous variable selection as well as classification.  相似文献   

14.
The naïve Bayes rule (NBR) is a popular and often highly effective technique for constructing classification rules. This study examines the effectiveness of NBR as a method for constructing classification rules (credit scorecards) in the context of screening credit applicants (credit scoring). For this purpose, the study uses two real-world credit scoring data sets to benchmark NBR against linear discriminant analysis, logistic regression analysis, k-nearest neighbours, classification trees and neural networks. Of the two aforementioned data sets, the first one is taken from a major Greek bank whereas the second one is the Australian Credit Approval data set taken from the UCI Machine Learning Repository (available at http://www.ics.uci.edu/~mlearn/MLRepository.html). The predictive ability of scorecards is measured by the total percentage of correctly classified cases, the Gini coefficient and the bad rate amongst accepts. In each of the data sets, NBR is found to have a lower predictive ability than some of the other five methods under all measures used. Reasons that may negatively affect the predictive ability of NBR relative to that of alternative methods in the context of credit scoring are examined.  相似文献   

15.
In February, internet bank Egg announced its decision to cancel the credit cards of 161 000 of its customers. Egg were "not comfortable with the level of risk" that these customers represented. Bank customers are judged by their credit scores. So what is credit scoring? How do lenders assess your creditworthiness? And how can you improve your credit score with them? David Edelman provides some answers.  相似文献   

16.
Techniques of credit scoring have been developed these last years in order to reduce the risk taken by banks and financial institutions in the loans that they are granting. Credit Scoring is a classification problem of individuals in one of the two following groups: defaulting borrowers or non-defaulting borrowers. The aim of this paper is to propose a new method of discrimination when the dependent variable is categorical and when a large number of categorical explanatory variables are retained. This method, Categorical Multiblock Linear Discriminant Analysis, computes components which take into account both relationships between explanatory categorical variables and canonical correlation between each explanatory categorical variable and the dependent variable. A comparison with three other techniques and an application on credit scoring data are provided.  相似文献   

17.
随着我国金融市场的蓬勃发展,信用评价中的拒绝推断问题越来越受到重视。针对信用评分模型中存在的有类别标签的样本占比低,并且样本中的类别分布不平衡等问题,本文在半监督学习技术与集成学习理论的基础上,提出了一种新的算法——BCT算法。该算法通过使用动态Bagging生成多个子分类器,引入分类阈值参数来解决样本类别分布不平衡问题,以及设定早停止条件来避免算法迭代过程中存在的过拟合风险,以此对传统半监督协同训练法进行改进。通过在5个真实数据集上的实证分析发现,在不同数据集与不同拒绝比例下,BCT算法的性能均优于其他6种有监督学习和半监督学习算法的信用评分模型,显示了BCT算法具有良好的模型泛化性能和更高的模型评价能力。  相似文献   

18.
个人信用评分的主要模型与方法综述   总被引:16,自引:1,他引:15       下载免费PDF全文
随着中国经济的快速发展 ,信用消费已逐步浮出水面 ,住房按揭、汽车贷款、教育贷款、信用卡等各种个人消费贷款的规模在迅速扩大。在消费信贷热不断升温的形势下 ,各商业银行均把发展零售业务作为未来发展战略的重要组成部分。但是由于目前国内商业银行对零售业务的风险管理水平较低 ,管理手段与方法均较落后 ,其中缺乏一套有效的个人信用评分方法是阻碍了个人消费信贷业务进一步开展的主要因素之一。本文的目的就是在对国外有关商业银行较常使用的个人信用评分模型与方法进行综述 ,并就各种方法的性能进行分析比较。  一、信用评分的简要…  相似文献   

19.
征信机构采集到的所有微型企业信用信息变量并未都适合进行微型企业资信评估,文章设计了一种BP神经网络对此进行特征选择。该BP神经网络的训练基于前向序贯的特征选择算法,以输出层输出对输入值的灵敏度作为特征选择的依据,网络输出最小灵敏度对应的特征变量。通过设计概率神经网络对得到的结果进行仿真分析,信贷机构因此获得的利润比基于列联表分析的特征选择法高2/3。  相似文献   

20.
王小燕等 《统计研究》2014,31(9):107-112
变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构作筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后本文将adSGL法应用到信用卡信用评分研究,对比logistic回归,它具有更高的分类精度和稳健性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号