首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
银行客户信用评估动态分类器集成选择模型   总被引:1,自引:0,他引:1  
现实的银行客户信用评估数据常包含大量的缺失值,这在很大程度上影响了信用评估模型的性能.针对已有模型的不足,提出了面向缺失数据的动态分类器集成选择模型DCESM.该模型充分利用数据集中所包含的已知信息,在训练信用评估模型之前不需要事先对缺失数据进行预处理,从而减少了对数据缺失机制假设以及数据分布模型的依赖.从UCI数据库中选择两个银行信用卡业务信用评估数据集进行实证分析,结果表明,与4种常用的基于插补法的多分类器集成模型以及1种直接面向缺失数据建模的集成模型相比,DCESM模型能够取得更好的客户信用评估性能.  相似文献   

2.
随着银行信贷的发展以及其对信用风险的关注,客户信用评估已成为银行业研究的一个重要内容。目前信用评估的研究中采用单个分类器进行评估,预测精度难以提高,本文提出了Bagging-BP算法,它以BP神经网络作为基本分类器,利用Bagging方法产生多个基本分类器,最后用简单多数投票法进行集成。在UCI中的German和Australian信用数据集上的实验结果表明,Bagging-BP优于单个分类器和以其他基本分类器进行组合的算法。  相似文献   

3.
为了降低单个分类模型的不稳定性,提高其应用于消费者信用评估的准确性,提出一种基于组合分类的消费者信用评估方法.首先通过有监督聚类将各个类别的数据样本划分为若干子集合,使得各个子集合中数据样本均来自同一类别,再对不同类别子集合之间进行两两组合得到训练样本子集合,然后在各个训练样本子集合中分别建立不同的分类模型.在分类模型结果综合阶段,以各个分类模型在待分类样本的近邻训练样本中的分类性能作为权重,对各个分类模型的结果进行加权投票以产生待分类样本的最终分类结果.实证研究以决策树作为基本分类器,通过在实际的消费者信用数据集上的比较分析,说明所提出方法相对于其它组合分类方法具有更高的分类准确性,可以有效应用于消费者信用评估.  相似文献   

4.
在现实的很多信用评估问题中,由于对样本进行类别标记需要花费大量的人力、财力和物力,往往只能获取少量有类别标签的样本来训练分类模型,而把数据库中大量无类别标签的客户样本舍弃。为解决这一问题,本研究引入半监督学习技术,并将其与多分类器集成技术中的随机子空间方法(Random Subspace, RSS)相结合,构建了类别不平衡环境下基于RSS的半监督协同训练模型RSSCI。该模型主要包括三个阶段:1)使用RSS方法训练得到若干基本分类器;2)从大量无类别标签数据集中选择性标记一部分最合适的样本加入到原始训练集中;3)在最终的训练集上训练分类模型,并对测试集样本进行分类。在三个客户信用评估数据集上进行实证分析,结果表明,RSSCI模型的信用评估性能不仅优于常用的监督式集成信用评估模型,也优于已有的一些半监督协同训练信用评估模型。  相似文献   

5.
针对信用评分中有标记样本获取难度大、成本高的问题,本文提出一种新的基于半监督支持向量机的信用评分模型。通过给未标记样本引入新的参数,使得模型无需满足随机缺失假设,具有良好的适用性。同时,在损失函数中加入半监督部分鼓励有标记样本和未标记样本系数的相似性,从而能够有效融合未标记样本信息,提升估计效果。此外,本文利用Group LASSO进行变量选择,可以充分利用组结构信息,筛选重要变量。通过数值模拟和一个信用卡风险违约预测实例数据证明了所提方法的可行性,以及在变量选择、系数估计和分类预测上的优良效果。  相似文献   

6.
电力系统大停电后需要安全可靠的黑启动方案进行电力快速恢复,如何从众多黑启动方案中进行优选是一个重要课题。不同于以往完全信息情况下的研究,本文对电力系统黑启动方案评估问题的研究是基于不完全信息情况下进行的,提出一种EM填补和加权秩和比相结合的黑启动决策方法。首先,采用EM算法填补黑启动方案评价空值,得到完备的黑启动评价矩阵;然后,计算指标间的差异性,利用差异性权重法得到各个指标的权重;最后,采用加权秩和比法确定每个方案的评分值,实现黑启动方案的分级和完全排序。本文方法基于广东电网黑启动数据集进行实验验证,实验结果表明,本文方法可以对不完全信息情况下的黑启动方案进行优劣排序,且具有较高准确性。  相似文献   

7.
为了研究诸如在收入差距和健康关系中某些解释变量的影响效应可能依赖于其他解释变量的状况,降低可能存在的模型设定和遗漏变量偏误,本文提出了随机效应半参数二值响应模型,其中非参数的设定还可用于数据的初探性分析.随后本文探讨了模型非参数和参数部分的估计.由于似然函数中随机效应和非参数的存在加大了估计难度,为此本文采用B样条方法逼近非参数部分,同时将随机效应视为缺失数据,利用EM算法和MCMC方法建立了模型参数的估计,并研究了其一致性.模拟研究结果表明估计量在有限样本下的表现良好,最后将模型运用于收入差距与健康关系的实例研究中,结果表明数据支持收入差距弱假说.  相似文献   

8.
针对现实中信用评估存在的问题,本研究将元代价敏感学习、半监督学习和异构集成等技术结合,提出了基于Metacost的客户信用评估半监督异构集成模型(Metacost based semi-supervised heterogeneous ensemble model, Meta-Semi-HE)。该模型主要包括三个阶段:1)用Metacost方法修改初始有标签训练集得到Lm;2)在Lm上通过AdaBoost方法训练N个异构分类器hi(i = 1,…, N),用伴随分类器组合Hi选择性标记无标签数据集的样本,并将其添加到Lm中,用新的Lm重新训练N个异构分类器。重复这一步骤,不断提高分类器性能,直至满足终止条件;3)用最终的N个异构分类器对测试集样本分类。在6个客户信用评估数据集上进行实证分析,结果表明,与已有的3种半监督集成模型和2种监督式集成模型相比,本研究提出的模型具有更好的客户信用评估性能。  相似文献   

9.
考虑影响因素的隐马尔可夫模型在经济预测中的应用   总被引:2,自引:1,他引:1  
定量预测方法分为因果预测法和时间序列预测法,因果预测法利用预测变量与其他变量之间的因果关系进行预测,时间序列预测法是根据预测变量历史数据的结构推断其未来值。由于因果预测法只利用某个变量与其他变量之间的因果关系,但缺少描述变量自身时间序列结构的功能;而时间序列预测法只能描述变量自身序列的结构,但没有考虑其他相关因素的影响,因此本文提出基于观测向量序列的隐马尔可夫模型(HMM)预测方法,该方法能同时考虑变量自身序列结构以及相关因素的影响。首先介绍HMM基本理论;其次,在模型训练、隐状态序列估计的基础上,提出基于观测向量序列HMM预测算法;最后分别进行仿真实验和实证研究,结果表明该方法的有效性。  相似文献   

10.
面向巴塞尔新资本协议的自优化神经网络信用评估方法   总被引:2,自引:0,他引:2  
邹鹏  叶强  李一军 《管理学报》2005,2(4):406-409
巴塞尔新资本协议中对信用风险评估使用的数据作了明确规定,而我国银行业目前所积累的数据还不能达到协议的要求;立足于我国银行业的现状,在新协议框架范围内探索可行的信用评估方法.对原有神经网络算法加以改进,提出自优化神经网络方法,该方法能较好地适应时变数据和自动优化神经网络评估模型,用真实的客户信用数据试验也表明该方法比普通神经网络有较高的准确性.  相似文献   

11.
将自组织数据挖掘理论引入贝叶斯分类中,提出一种新颖的贝叶斯分类器结构学习算法.算法将基于依赖分析和评分搜索两种贝叶斯网络结构学习思想相接合,根据互信息测度值选择初始模型,用贝叶斯评分作为筛选中间模型的外准则,能够在不同数据集上完成自适应建模过程,包括选择进入模型的变量、确定具有最优复杂度的模型结构等.在 10 个UCI数据集上进行分类测试,结果表明,贝叶斯分类器结构学习算法分类器的分类精度要高于常用的朴素贝叶斯、树扩展朴素贝叶斯以及基于K2算法的分类器.进一步地,在信用卡客户分类数据集german上的学习曲线和抗干扰试验还表明,与朴素贝叶斯、树扩展朴素贝叶斯以及K2等分类器相比,贝叶斯分类器结构学习算法分类器具有更加稳定的分类性能和更强的抗干扰能力.  相似文献   

12.
研究了小额贷款公司对客户进行信用风险评估时面临的问题,构建了信用风险评估指标体系,改进了支持向量机(Support Vector Machine, SVM)对非均衡样本分类时分类超平面偏移的不足。首先分析小额贷款公司业务区域性强、信用数据来源不规范、评价标准不一致等特点,给出用于客户信用风险评估的四个维度指标。针对传统SMOTE算法在处理非均衡数据时对全部少数类样本操作的问题,提出仅对错分样本人工合成的改进思想,给出具体算法步骤。将改进算法用于某小额贷款公司客户信用风险评估案例中,分类精确度较其他算法有所提升,表明该方法的可行性和有效性。  相似文献   

13.
遗传算法优化神经网络及信用评价研究   总被引:14,自引:5,他引:14  
研究关于公司神经网络信用评估问题的现状,提出遗传算法辅助网络训练策略(优化后的网络称为进化网络),克服传统网络建模中产生的局部极小缺陷。建立了适合于我国商业企业的信用评分指标体系;然后依据该指标体系建立了基于进化神经网络的信用评估模型;最后,利用样本公司实际指标数据对该模型的评分效果进行了比较研究。  相似文献   

14.
基于ANFIS和Elman网络的信用评价研究   总被引:2,自引:0,他引:2  
BP神经网络用作信用等级分类可取得较好的效果,但在过分要求输出信用分值时效果不佳。针对该缺陷,本文采用自适应神经网络(ANFIS)和Elman网络研究公司信用评分。文中提出了一套甄选方法准则,用于建立适合我国企业的信用评分指标体系;然后依据该指标体系建立了基于Elman网络和ANFIS的信用评估模型;采用V foldCross validation技巧,利用样本公司实际指标数据对该模型的评分效果进行了实证研究。  相似文献   

15.
本文以银行信用风险管理为例,将粗糙集和决策树两种具有互补优势的数据挖掘方法相结合,对客户信用做出归类分析判断,最后利用决策树生成决策规则.实践证明,这种方法忠于原始数据,提高了分类准确度,减小了决策树规模,具有良好的性能.  相似文献   

16.
信用风险评价是金融机构风险防控的重要环节之一。近年来,基于机器学习的信用风险评价模型以其准确的预测效果受到越来越多的关注,但机器学习模型具有可解释性不强的弊端,导致投资者无法完全信任其预测结果。针对上述问题,本文提出了一种改进的教学式方法,利用机器学习模型指导生成一个兼顾准确性与可解释性的信用风险评价决策树模型,以辅助投资者决策。为提高决策树对机器学习模型中正确功能的学习能力,提出了基于Weight Synthetic Minority Over-sampling Technique(Weight-SMOTE)的伪数据集生成方法,以提高伪数据集中可信度高的功能所标记的伪样本比例;为实现所生成的决策树在准确性、可解释性以及其与机器学习模型一致性间的有效权衡,在决策树生成过程中提出了一种新的决策树剪枝方法;同时针对保真度评价指标的局限性,提出了真保真度评价指标,来有效的衡量决策树与机器学习模型正确功能的近似程度。最后使用3个真实信用风险评价数据集对改进的教学式方法进行验证,实验结果表明所提出方法能够生成准确且可解释的信用风险评价模型,以满足投资者的决策偏好与实际需求。  相似文献   

17.
在许多大陆法系国家,不断产生的新型法律关系使得成文法无法及时制定和修改的缺陷逐渐显现。与此同时,世界各国纠纷诉讼的数目也在急剧增长,所以,很多国家面临如何在保证审判质量的前提下提高司法系统审判效率的问题。因此,在进行制度改革的同时,建立决策支持系统将会有效地辅助司法判决。本文以中国的医疗损害诉讼文本为例,使用文本挖掘和自动分类技术提出了一个法院裁判决策支持系统(CJ-DSS),该系统可以依据以往判例预测新诉讼文本的判决结果:驳回与非驳回。结合案例,本文研究发现,组合特征提取法确实能够改进和提高分类器的分类性能,而且针对支持向量机(SVM)、人工神经网络(ANN)、K最近邻(KNN)三种不同的分类器,文档词频-卡方(DF-CHI)组合特征提取法对性能的改进程度有所差异,其中ANN的性能改进最高。除此之外,集成学习后该系统的分类性能更加稳定,显著优于单一分类器,F1值达到93.3%。  相似文献   

18.
在分类问题中,类别不平衡问题将引起分类器训练偏差,导致少数类样本诊断敏感性降低.马田系统是一种多元数据诊断和预测技术,它通过构建一个连续的测量尺度而非直接对训练样本进行学习,该性质有望不受数据分布的影响,克服分类不平衡问题.本文针对马田系统阈值计算缺陷和不平衡数据分类要求,研究一种概率阈值模型计算马田系统阈值;还针对马田系统的若干不足,采用优化模型替代正交表和信噪比筛选关键变量,并使用了一种全方位优化算法求解.通过对8个UCI数据集的实验分析表明,改进的马田系统不仅对不平衡数据有较好的分类效果,且能筛选关键变量,降维效果明显.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号