首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
当前面向大样本设计的信用评估模型,大多没有深入探究大样本的分布特征,只是简单地将传统评估方法应用在大样本上.首先提出了用于描述大样本分布特征的相关属性集、边界向量等若干概念及定义,并证明了其主要性质.之后在两个大样本数据集的基础上,研究了样本在相似性方面的分布特征,最后设计了一种大样本混合信用评估模型——HLSCE模型.HLSCE模型认为在大样本数据集中,样本的同一属性在不同局部区域内,对分类性能的贡献是不同的.具体地,HLSCE模型根据各样本与边界向量的相似性差异,结合生物启发式算法,将样本归并划分为若干子集并分别在其上训练基分类器.实证研究表明,HLSCE模型的分类精度相比于现有的代表性信用评估模型更高,同时也具有更为优越的平衡性与稳定性.  相似文献   

2.
为了降低单个分类模型的不稳定性,提高其应用于消费者信用评估的准确性,提出一种基于组合分类的消费者信用评估方法.首先通过有监督聚类将各个类别的数据样本划分为若干子集合,使得各个子集合中数据样本均来自同一类别,再对不同类别子集合之间进行两两组合得到训练样本子集合,然后在各个训练样本子集合中分别建立不同的分类模型.在分类模型结果综合阶段,以各个分类模型在待分类样本的近邻训练样本中的分类性能作为权重,对各个分类模型的结果进行加权投票以产生待分类样本的最终分类结果.实证研究以决策树作为基本分类器,通过在实际的消费者信用数据集上的比较分析,说明所提出方法相对于其它组合分类方法具有更高的分类准确性,可以有效应用于消费者信用评估.  相似文献   

3.
在现实的很多信用评估问题中,由于对样本进行类别标记需要花费大量的人力、财力和物力,往往只能获取少量有类别标签的样本来训练分类模型,而把数据库中大量无类别标签的客户样本舍弃。为解决这一问题,本研究引入半监督学习技术,并将其与多分类器集成技术中的随机子空间方法(Random Subspace, RSS)相结合,构建了类别不平衡环境下基于RSS的半监督协同训练模型RSSCI。该模型主要包括三个阶段:1)使用RSS方法训练得到若干基本分类器;2)从大量无类别标签数据集中选择性标记一部分最合适的样本加入到原始训练集中;3)在最终的训练集上训练分类模型,并对测试集样本进行分类。在三个客户信用评估数据集上进行实证分析,结果表明,RSSCI模型的信用评估性能不仅优于常用的监督式集成信用评估模型,也优于已有的一些半监督协同训练信用评估模型。  相似文献   

4.
信用评估中的鲁棒赋权自适应Lp最小二乘支持向量机方法   总被引:1,自引:1,他引:0  
消费者信用评估是金融风险管理和信用产业竞争的一个重要方面.信用评估数据中常带有噪声点,并且其类别是不均衡的.最小二乘支持向量机是一个被广泛应用的分类模型,其模型简单,求解速度快,但鲁棒性差.本文提出了一个鲁棒赋权自适应Lp最小二乘支持向量机模型,能够适应信用评估样本数据库类别不均衡的特点,可以有效处理信用评估数据中带有噪声点的问题.在仿真数据和三个信用数据库上的实证分析表明,本文所提出的模型具有较好的鲁棒性和分类能力.  相似文献   

5.
本文应用半正定规划支持向量机模型,将核函数特征子空间的组合作为核映射矩阵,提出一种新的将特征选择整合在数据分类过程中的学习算法。首先,将样本按其特征进行分组,计算每组样本子集的核矩阵;然后将这些核矩阵线性组合后加入基于半正定规划的支持向量机模型中,利用半正定规划支持向量机学习器求解得到各子特征空间的权重系数,其次,根据特征权重系数建立特征贡献度和支持度用于特征选择并控制分类准确率、特征数量和对不同类别样本的分类能力;最后根据最优分类准确率、最少特征数量、最佳泛化能力三项不同目标计算所对应的特征数量和分类结果。实证中采用医学、植物学、文本识别和信用等领域数据以及人工数据集比较该方法和SFS、Relief-F以及SBS算法的特征选择效果。结果表明,在实际数据中,本文提出的方法不但能够保持较好的分类学习效果,而且可以比SFS、Relief-F以及SBS特征选择算法的特征子集数目大幅减少;在人工数据中,该方法可以正确地选出真正的特征,去除噪声特征。  相似文献   

6.
在现实的目标客户选择建模中,往往只能获取少量有类别标签的样本,而剩下的大量样本都无法获取类别标签。已有研究大都使用监督式建模研究范式,仅在少量有类别标签样本集上建模,很难取得令人满意的效果。为解决这一问题,本文引入半监督学习(semi-supervised learning,SSL)技术,将其与代价敏感学习(cost sensitive learning,CSL)和多分类器集成中的随机子空间(random subspace,RSS)方法相结合,提出了代价敏感的目标客户选择半监督集成模型(cost-sensitive semi-supervised ensemble model,CSSE)。该模型使用代价敏感的支持向量机(SVM)来解决目标客户选择建模中样本数据类别分布不平衡的问题,还能够同时使用有、无类别标签的客户样本来建模。进一步地,该模型利用RSS方法训练一系列基本分类模型,并通过集成得到最终的分类结果。在某保险公司目标客户选择数据集上进行实证分析,结果表明,与两种监督式集成模型、两种单一的半监督模型以及两种半监督集成模型相比,CSSE模型具有更好的目标客户选择性能。  相似文献   

7.
针对信用评分中有标记样本获取难度大、成本高的问题,本文提出一种新的基于半监督支持向量机的信用评分模型。通过给未标记样本引入新的参数,使得模型无需满足随机缺失假设,具有良好的适用性。同时,在损失函数中加入半监督部分鼓励有标记样本和未标记样本系数的相似性,从而能够有效融合未标记样本信息,提升估计效果。此外,本文利用Group LASSO进行变量选择,可以充分利用组结构信息,筛选重要变量。通过数值模拟和一个信用卡风险违约预测实例数据证明了所提方法的可行性,以及在变量选择、系数估计和分类预测上的优良效果。  相似文献   

8.
针对现实中信用评估存在的问题,本研究将元代价敏感学习、半监督学习和异构集成等技术结合,提出了基于Metacost的客户信用评估半监督异构集成模型(Metacost based semi-supervised heterogeneous ensemble model, Meta-Semi-HE)。该模型主要包括三个阶段:1)用Metacost方法修改初始有标签训练集得到Lm;2)在Lm上通过AdaBoost方法训练N个异构分类器hi(i = 1,…, N),用伴随分类器组合Hi选择性标记无标签数据集的样本,并将其添加到Lm中,用新的Lm重新训练N个异构分类器。重复这一步骤,不断提高分类器性能,直至满足终止条件;3)用最终的N个异构分类器对测试集样本分类。在6个客户信用评估数据集上进行实证分析,结果表明,与已有的3种半监督集成模型和2种监督式集成模型相比,本研究提出的模型具有更好的客户信用评估性能。  相似文献   

9.
研究了小额贷款公司对客户进行信用风险评估时面临的问题,构建了信用风险评估指标体系,改进了支持向量机(Support Vector Machine, SVM)对非均衡样本分类时分类超平面偏移的不足。首先分析小额贷款公司业务区域性强、信用数据来源不规范、评价标准不一致等特点,给出用于客户信用风险评估的四个维度指标。针对传统SMOTE算法在处理非均衡数据时对全部少数类样本操作的问题,提出仅对错分样本人工合成的改进思想,给出具体算法步骤。将改进算法用于某小额贷款公司客户信用风险评估案例中,分类精确度较其他算法有所提升,表明该方法的可行性和有效性。  相似文献   

10.
基于最优支持向量机模型的经营失败预警研究   总被引:3,自引:0,他引:3  
宋新平  丁永生 《管理科学》2008,21(1):115-120
根据中国资本市场的实际和样本数据特点,设计一套从样本准备到模型参数优化、再到模型比较的集成解决方案,对上市公司经营失败进行预警,通过实验分析参数调整和核函数选择对支持向量机建模的影响,寻求最优的支持向量机模型.实证结果表明,经营失败预警应用中,参数和核函数的选择对预警模型有较大影响,基于最优支持向量机模型的预测效果优于统计方法和神经网络方法,支持向量机适合中国上市公司分行业小样本的实际.特别处理事件作为经营失败样本切分标准对模型产生一定影响.  相似文献   

11.
方法群评价中权重集化问题的研究   总被引:10,自引:5,他引:10  
本文将运用多种方法独立地确定一个多属性评价问题的权重,它形成一个基本的权重向量集,在这个基础上构造出可能的权重向量集,采用非线性规划方法在可能的权重集上选择最优的权向量,这是一种对权重进行集化的新方法.本研究方法思路清晰,易于计算机上实现,可以更好地解决权重的确定问题.最后用一个算例说明本方法实际应用上的方便性和有效性.  相似文献   

12.
财务风险预警的支持向量机应用   总被引:1,自引:0,他引:1  
本文给出了财务评价指标体系及其量化方法,利用支持向量机的分类能力建立财务风险预警的模型.对上市公司的财务数据进行训练和评估.证明基于支持向量机的财务风险预警模型的可行性和实用性,实验表明支持向量机在小样本情况下具有良好的非线性建模能力和泛化能力.  相似文献   

13.
夏国恩 《管理学报》2010,7(6):856-860
针对已有属性选择方法较少考虑属性获取代价和属性集维数的自动确定问题,提出一种满意属性选择方法(SASM),将样本分类性能、属性集维数和属性提取复杂性等多种因素综合考虑.给出了属性满意度和属性集满意度定义,设计出满意度函数,导出满意属性集评价准则,详细描述了属性选择算法.对某电信公司客户流失预测的实证结果显示,SASM获得的命中率、覆盖率、准确率和提升系数高于属性相关性选择法、一致性选择法、实例选择法和对称不确定性选择法.证实了SASM的有效性和实用性.  相似文献   

14.
文章针对常规电力需求预测方法的不足,在分析SVM的线性和非线性分类方法的基础上提出一种基于最小二乘的支持向量机预测方法.LS-SVM模型采用结构风险最小化原则,能够在对小样本学习的基础上,对其他样本快速、准确的拟合预测,具有更好的泛化性能和精度,减少对初始值的依赖.文章采用河北省某市实际的负荷数据,按照不同的负荷日属性和历史数据属性进行样本选择,使用径向基核函数进行了电力需求预测.将预测结果与真实值和由时间序列及BP神经网络方法得到的结论进行比较,表明所提出的预测模型具有较高的精度,是有效和可行的.  相似文献   

15.
银行客户信用评估动态分类器集成选择模型   总被引:1,自引:0,他引:1  
现实的银行客户信用评估数据常包含大量的缺失值,这在很大程度上影响了信用评估模型的性能.针对已有模型的不足,提出了面向缺失数据的动态分类器集成选择模型DCESM.该模型充分利用数据集中所包含的已知信息,在训练信用评估模型之前不需要事先对缺失数据进行预处理,从而减少了对数据缺失机制假设以及数据分布模型的依赖.从UCI数据库中选择两个银行信用卡业务信用评估数据集进行实证分析,结果表明,与4种常用的基于插补法的多分类器集成模型以及1种直接面向缺失数据建模的集成模型相比,DCESM模型能够取得更好的客户信用评估性能.  相似文献   

16.
基于多分类器融合的客户细分研究   总被引:3,自引:0,他引:3       下载免费PDF全文
叶强  邹鹏  尚维 《管理科学》2004,17(2):64-67
基于多分类器融合技术,建立了新的客户分类模型,该模型通过使用分类融合器,将多个分类器得到的客户信用评估结果进行合并,从而综合了不同分类器的局部优势,提高了分类性能.采用线性分类融合器,并通过遗传算法对分类器进行优化.实验分析表明,该方法的分类效果明显优于传统的运用单个分类器的分类方法.  相似文献   

17.
半模糊超球支持向量机多类分类方法研究   总被引:1,自引:0,他引:1  
针对支持向量机在大类别模式分类中存在的问题,提出了一种基于半模糊核聚类的超球支持向量机分类方法.该方法首先利用半模糊核聚类方法对样本进行预处理,完成边缘样本的选取,进而以所选样本为训练样本进行超球支持向量机训练,从而有效提高分类器的性能.实验表明,该方法比标准支持向量机多类分类方法具有更高的速度和精度.  相似文献   

18.
本文研究风险因子多元厚尾分布情形下的信用资产组合风险度量问题.用多元t-Copula分布来描述标的资产收益率分布的厚尾性,同时将三步重要抽样技术发展到基多元t-Copula分布的资产组合模型中,拓宽和丰富了信用资产组合风险度量模型.同时,并运用了非线性优化技术中的Levenberg-Marquardt算法来解决重要抽样技术中风险因子期望向量估计.模拟结果表明该算法比普通Monte Carlo模拟法的计算效率更有效,且能很大程度上减少所要估计的损失概率的方差,从而更精确地估计出信用投资组合损失分布的尾部概率或给定置信度下组合VaR值.  相似文献   

19.
遗传繁衍样本策略及神经网络信用评价研究   总被引:3,自引:0,他引:3       下载免费PDF全文
吴德胜  梁梁 《管理科学》2004,17(1):59-65
提出遗传算法繁衍样本策略,克服了小样本建立模型的缺陷,建立适合于我国商业企业的信用评分指标体系,依据该指标体系和遗传优化样本建立了基于反向传播回归神经网络的信用评估模型,利用样本公司实际指标数据对该模型的评分效果进行了比较研究.  相似文献   

20.
在基于价值的客户细分中,不可避免地产生"拒真纳伪"的两类错误,由于错误分类代价差异和不同价值客户数量的不平衡分布,基于总体准确率的数据挖掘方法不能体现由于客户价值不同对分类效果带来的影响.本研究在代价敏感性学习机制下引入支持向量机作为分类工具,建立基于客户价值的错分代价函数,为适应客户价值多类别细分的要求,将二元分类扩展为多元分类,建立分类的期望损失函数作为分类效果的评价标准.实验结果说明,该方法可以更精确地控制代价敏感性和不同种分类错误的分布,降低总体的错误分类代价,使模型能更准确反映分类的代价,有效识别客户价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号