期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

信用评分模型综述 总被引：2，自引：0，他引：2

朱晓明刘治国《统计与决策》2007,(2):103-105

本文对信用评分领域大量的模型和方法以及相关文献做了细致的分类和综合比较,这些模型包括多元判别分析模型、数学规划法、Logistic回归分析和神经网络模型等。相似文献

2.

魏秋萍张景肖《统计与决策》2012,(10):4-6

为了克服信用评分模型中自变量存在多重共线性的问题,文章引入了偏最小二乘思想,即采用限制预测值的偏最小二乘回归和偏最小二乘Logistic回归来创建信用评分模型。偏最小二乘法可以同时解释因变量和自变量的变异,在实际运用中更加符合信用评分模型的特点。实证研究的结果表明,利用这两种偏最小二乘模型创建的信用评分模型具有很好的准确性和稳定性。相似文献

3.

基于核函数法进行拒绝推断的信用评分模型

魏秋萍张景肖张波《统计与决策》2012,(12):4-8

文章分三种情形说明了信用评分模型的开发和应用存在样本偏差,需要使用拒绝推断来校正样本偏差,并提出了核函数推断法来做拒绝推断。在此基础上文章还做了相应的实证分析,获得了比较理想的结果。根据文章的研究,人行征信这类外部数据是拒绝推断最有效的方法,如果此类数据缺乏,则核函数推断法是一种有效的拒绝推断方法。相似文献

4.

基于自然最近邻的不平衡数据欠采样方法

孟东霞魏晓光柳凌燕《统计与决策》2023,(15):52-56

针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。相似文献

5.

不平衡数据下模型评价指标的有效性探讨

刘赛可何晓群夏利宇《统计与决策》2022,(19):5-9

模型评价指标对于衡量模型的表现尤为关键,只有正确合理的评价指标才能更好地反映模型的性能优劣。由于AUC和KS指标在被用于评价信用评级模型时,均存在忽视了数据的不平衡性和类别误判代价不等价性的不足,故文章从代价敏感矩阵出发计算总损失,进而提出新的评价指标——AKS指标。进一步地,模拟分析的结果表明,由AKS指标确定的阈值较KS指标更合理,且不同情形下AUC、KS和AKS指标的有效性分析结果表明AKS指标可以较好地衡量模型的分类性能。相似文献

6.

信用评分模型应用比较研究——基于个体工商户数据的检验 总被引：2，自引：0，他引：2

晏艳阳蒋恒波《统计与信息论坛》2010,25(5):30-35

信用评分是各类机构进行信用管理的有效工具,有着广泛的应用前景。随着计量技术的发展,信用评分方法也不断革新,为实际应用提供了多种选择。选取Logistic回归、分类树两种统计方法及代表信用评分发展趋势的人工智能神经网络中的多层感知器、径向基网络、自组织特征映射网络、支持向量机等共六种模型,运用较大样本量的个体工商户数据在一致的框架下进行检验。结果表明：Logistic回归模型与支持向量机两种方法在错分率、稳定性及适用性方面较为优越,其中支持向量机作为人工智能评分方法的最新应用之一,其综合性能更为突出。相似文献

7.

数据挖掘模型在小企业主信用评分领域的应用

王磊范超解明明《统计研究》2014,31(10)

国际经验表明,信用评分技术可较好地解决小企业贷款高成本、高风险及信息不对称难题.本文广泛选取了可适用于小企业主信用评分领域的12种数据挖掘模型(包括本文的改进模型门限Logistic),并以3个银行微观客户数据集为案例,通过10折交叉验证和预期分类错误成本的方式,检验了这些模型的综合信用评分能力.分析结果及稳健性检验表明,本文改进的门限Logistic模型在模型预测能力及预期错误分类成本等多方面表现优秀;而基于决策树的组合方法也表现良好.本研究对国内商业银行建立合适的小企业主贷款信用评分模型具有参考意义,也有助于推动银行微观金融统计,完善金融统计工作. 相似文献

8.

基于改进的AdaBoost算法的信用评分模型 总被引：3，自引：0，他引：3

杨海江魏秋萍张景肖《统计与信息论坛》2011,26(2):27-31

将AdaBoost组合算法应用于信用评分模型中的分类问题,并针对该算法在解决不平衡分类问题上的一些不足,对算法进行了改进。应用此改进的AdaBoost算法,创建了新的信用评分模型,并进行了实证分析。实证结果表明,基于改进的AdaBoost算法的信用评分模型可以有效降低由于模型错判而导致的损失。相似文献

9.

信用评分模型中拒绝推断问题研究：基于半监督协同训练法的改进

黎春周振宇《统计研究》2019,36(9):82

随着我国金融市场的蓬勃发展,信用评价中的拒绝推断问题越来越受到重视。针对信用评分模型中存在的有类别标签的样本占比低,并且样本中的类别分布不平衡等问题,本文在半监督学习技术与集成学习理论的基础上,提出了一种新的算法——BCT算法。该算法通过使用动态Bagging生成多个子分类器,引入分类阈值参数来解决样本类别分布不平衡问题,以及设定早停止条件来避免算法迭代过程中存在的过拟合风险,以此对传统半监督协同训练法进行改进。通过在5个真实数据集上的实证分析发现,在不同数据集与不同拒绝比例下,BCT算法的性能均优于其他6种有监督学习和半监督学习算法的信用评分模型,显示了BCT算法具有良好的模型泛化性能和更高的模型评价能力。相似文献

10.

大数据风控有效吗?——基于统计评分卡与机器学习模型的对比分析

《统计与信息论坛》2019,(9):18-26

随着金融科技的巨大进步,机器学习在金融风控领域的应用也逐渐深化起来。信用评分卡模型作为一种应用最为广泛的风险评估模型,在大数据时代存在着不能对高维、复杂、非线性的个人征信数据进行全面分析的局限性。从中国的互联网金融发展的实际情况出发,提出一种基于XGBoost机器学习算法的互联网金融风控模型,并与传统的统计评分卡模型进行了对比试验,同时给出了将机器学习模型预测结果转化为传统信用评分的解决方法。研究结果表明,机器学习模型能更好地预测个人信用风险,从而构建更加有效的风控体系。相似文献

11.

个人信用评分的主要模型与方法综述 总被引：15，自引：1，他引：15

下载免费PDF全文

石庆焱靳云汇《统计研究》2003,20(8):36-4

随着中国经济的快速发展 ,信用消费已逐步浮出水面 ,住房按揭、汽车贷款、教育贷款、信用卡等各种个人消费贷款的规模在迅速扩大。在消费信贷热不断升温的形势下 ,各商业银行均把发展零售业务作为未来发展战略的重要组成部分。但是由于目前国内商业银行对零售业务的风险管理水平较低 ,管理手段与方法均较落后 ,其中缺乏一套有效的个人信用评分方法是阻碍了个人消费信贷业务进一步开展的主要因素之一。本文的目的就是在对国外有关商业银行较常使用的个人信用评分模型与方法进行综述 ,并就各种方法的性能进行分析比较。　　一、信用评分的简要… 相似文献

12.

面向不平衡数据集分类的LDBSMOTE过采样方法

王泳欣张大斌车大庆吕建秋《统计与决策》2022,(18):58-63

文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法（LDBSMOTE）。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。相似文献

13.

企业危机事件应急处理的蚁群优化模型

马吟秋王翔《统计与决策》2016,(7):92-95

采用新兴信息技术研究企业危机事件应急管理问题已经成为国内外学者广为关注的焦点问题.文章提出了一种基于改进蚁群算法的企业危机事件应急资源调配模型、方法及其应用.在对应急资源调配问题进行标准化建模的基础上,提出了能高效求解该问题的改进蚁群算法. 相似文献

14.

基于整合治愈率模型的信贷违约时点预测

范新妍等《统计研究》2021,38(2):99-113

传统信用评分方法主要利用统计分类方法,只能预测借款人是否会发生违约,但不能预测违约发生的时点。治愈率模型是二分类和生存分析的混合模型,不仅可以预测是否会发生违约,而且可以预测违约发生的时点,比传统二分类方法可以提供更多的信息。另外,随着大数据的发展,数据源越来越多,针对相同或者相似任务,可以收集到多个数据集,本文提出了融合多源数据的整合治愈率模型,可以对多个数据集同时建模和估计参数,通过复合惩罚函数进行组间和组内双层变量选择,并通过促进两个子模型回归系数符号相同,提高模型的可解释性。通过数值模拟发现,所提方法在变量选择和参数估计上均有明显优势。最后,将所提方法应用于信用贷款的违约时点预测中,模型表现良好。相似文献

15.

五普数据的多维模型的处理方法

刘建华《统计与预测》2003,(1):47-50

人口普查是一种全面调查,由于我国人口众多,所以普查后的数据量十分大。尽管在这次普查中采用了长短表技术,在一定程度上利用了采样的优势,可短表却是100％的抽样率,所以这并不能从根本上解决问题。也正是因为这庞大的数据量,后期的数据处理面临一定的挑战。相似文献

16.

结构方程模型中关于有序分类数据的处理方法

高静《统计与决策》2012,(18):19-21

现有的结构方程模型(SEM)分析软件有LISREL、AMOS、EQS、Mplus等,但它们都要求变量是连续的,并且服从多元正态分布,然而现实中却很难达到要求。文章基于有序分类数据研究幸福指数,对有序分类数据作了连续化处理,使其符合现有的SEM分析软件的假设条件,从而建立结构方程模型;并用AMOS、SPSS等软件进行了分析。事实证明,这样的处理方法是可行的,并且比原有数据有了改进。相似文献