期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王磊范超解明明《统计研究》2014,31(10)

国际经验表明,信用评分技术可较好地解决小企业贷款高成本、高风险及信息不对称难题.本文广泛选取了可适用于小企业主信用评分领域的12种数据挖掘模型(包括本文的改进模型门限Logistic),并以3个银行微观客户数据集为案例,通过10折交叉验证和预期分类错误成本的方式,检验了这些模型的综合信用评分能力.分析结果及稳健性检验表明,本文改进的门限Logistic模型在模型预测能力及预期错误分类成本等多方面表现优秀;而基于决策树的组合方法也表现良好.本研究对国内商业银行建立合适的小企业主贷款信用评分模型具有参考意义,也有助于推动银行微观金融统计,完善金融统计工作. 相似文献

2.

基于稀疏结构连续比率模型的消费金融风控研究

张晶等《统计研究》2020,37(11):57-67

近年来,我国消费金融发展迅速,但同时也面临着更加复杂的欺诈和信用风险,为了更好地对消费金融中借贷客户的信用风险进行监测,本文提出了基于稀疏结构连续比率模型的风控方法。相对于传统的二分类模型,该模型的特点是可以处理借贷客户被分为三类或三类以上的有序数据,估计系数的同时能从众多纷繁复杂的数据中自动筛选重要变量,并在变量筛选过程中考虑不同子模型系数的结构特征。通过蒙特卡洛模拟发现,本文所提出的稀疏结构连续比率模型在分类泛化误差和变量筛选上的表现都较好。最后将本文提出的模型应用到实际的消费金融信用风险分析中,针对传统征信信息不足的借款人,通过引入高频电商消费行为数据,利用本文提出的高维有序多分类模型能有效识别借款人的信用风险,可以弥补传统征信方法的不足。相似文献

3.

基于数据挖掘的上市公司信用评级变动预测

盛夏李斌张迪《统计与决策》2016,(15):159-162

文章研究如何利用机器学习算法来预测中国上市公司的信用评级变动.选取了中国2003-2015年可得信用评级的记录,得到330条信用评级变动的记录.随后利用包含传统的线性分类器和最近提出的AdaBoost及随机森林分类模型等五类模型进行了实证.实证结果显示,随机森林分类模型对信用评级变动的预测能力最强. 相似文献

4.

信用评分模型应用比较研究——基于个体工商户数据的检验 总被引：1，自引：0，他引：1

晏艳阳蒋恒波《统计与信息论坛》2010,25(5):30-35

信用评分是各类机构进行信用管理的有效工具,有着广泛的应用前景。随着计量技术的发展,信用评分方法也不断革新,为实际应用提供了多种选择。选取Logistic回归、分类树两种统计方法及代表信用评分发展趋势的人工智能神经网络中的多层感知器、径向基网络、自组织特征映射网络、支持向量机等共六种模型,运用较大样本量的个体工商户数据在一致的框架下进行检验。结果表明：Logistic回归模型与支持向量机两种方法在错分率、稳定性及适用性方面较为优越,其中支持向量机作为人工智能评分方法的最新应用之一,其综合性能更为突出。相似文献

5.

信用评分模型中稀有事件特殊采样处理方法探讨

张景肖魏秋萍张波《统计与信息论坛》2012,(11):15-19

信用评分模型的建模样本是由坏客户这一稀有事件和好客户这一大众事件组成的不平衡数据,故从模型残差的方差这一角度刻画稀有事件识别的难度,借鉴机器学习领域处理不平衡数据的方法,对建模样本中的稀有事件做特殊采样处理然后再建模,并证明对建模样本做特殊采样处理后必须用经验公式校正样本偏差。实证分析表明这是提高信用评分模型准确性的有效方法。相似文献

6.

民营企业信用评估模型研究

杨星郭彩琴郭璐《统计与决策》2005,(2):17-19

为民营企业的信用资质提供一种科学的度量方法是解除营企业金融困本文采用某商业银行2002年对120家不同规模的民营企业贷款的截面数据,在现有的信用评级法指标体系的基础上构建了一个简单的民营企业信用评估模型.该模型突破了传统的定性分析框架,具有简洁、直观、操作性强的特点,可为商业银行信贷决策的科学化提供参考. 相似文献

7.

利用互联网大数据预测季度GDP增速的方法研究

何强董志勇《统计研究》2020,37(12):91-104

大数据为季度GDP走势预测创新研究带来重要突破口。本文利用百度等网站的互联网大数据,基于代表性高维数据机器学习(和深度学习)模型,对我国2011-2018年季度GDP增速深入进行预测分析。研究发现,对模型中的随机干扰因素作出一定分布的统计假设,有助于降低预测误差,任由模型通过大量数据机械地学习和完善并不总是有利于模型预测能力的提升;采用对解释变量集添加惩罚约束的方法,可以有效地处理互联网大数据维度较高的棘手问题;预测季度GDP增速的最优大数据解释变量集的稳定性较高。相似文献

8.

计量经济学中的机器学习方法：回顾与展望

石荣张特杨国涛《统计与决策》2024,(1):52-56

文章从传统计量经济学的三大作用——经济预测、验证理论、政策评价入手,梳理了机器学习与计量经济学融合发展过程中机器学习在计量经济学中的应用途径。研究发现：机器学习可以更高效地探索变量之间的关系,以做出更精准的预测;在大数据背景下机器学习丰富了经济数据的多样性,通过对大量经济数据进行分析和处理,从而揭示出数据中的潜在模式、关联性和趋势,继而能够检验一些更复杂、更富有挑战性的研究假设;机器学习从识别假设条件、函数形式拟合、“反事实”预测等角度提高了因果处理效应估计的准确性和稳定性,进而更精确地定量评估政策效应,服务国家重大战略需求。相似文献

9.

基于大数据的跨境电商平台供应商信用评估研究

《统计与信息论坛》2018,(3):100-107

跨境电商平台要实现其质量担保功能,必须对供应商进行有效信用评估。结合跨境电商交易模式及平台供应商的特点,充分考虑供应商信用评估数据的来源和处理方法,构建基于大数据的跨境电商平台供应商信用评价指标体系和基于BP神经网络的信用评估模型,并进行实证研究;在数据集基础上采用机器学习K-折交叉验证和混淆矩阵对模型进行评估,证明该模型具有较好的泛化能力和准确度。应用基于大数据的跨境电商平台供应商信用评估指标体系及评估模型,有助于实现跨境电商平台的质量担保功能,减少平台交易中出现的信息不对称问题。相似文献

10.

基于机器学习融合算法的网络购买行为预测研究

《统计与信息论坛》2017,(12):94-100

选择适合的机器学习算法是在社会经济研究领域进行大数据分析及提高预测效果的关键。在很多情况下,通过融合训练两种或两种以上有差异的算法,能够显著提高算法的泛化能力以提高预测效果。基于阿里巴巴电子商务平台购物行为数据,分别应用Logistic回归、支持向量机以及这两种算法的融合构建了预测模型。实证结果表明,融合后模型比单一模型具备更好的预测效果。相似文献

11.

基于机器学习的车险索赔频率预测

《统计与信息论坛》2019,(5):69-78

近年来,广义线性模型已被广泛用于车险定价,而一些研究结果显示机器学习在某些方面优于广义线性模型,但这些结果都只是基于某个单一数据集。为了更全面地比较广义线性模型与机器学习方法在车险索赔频率预测问题上的效果,对7个车险数据集进行了比较测试,包括深度学习、随机森林、支持向量机、XGboost等机器学习方法;基于相同的训练集,建立不同的广义线性模型预测索赔频率,根据最小信息准则(AIC)选取最优的广义线性模型;通过交叉验证调参获得机器学习最佳参数和模型。研究结果显示:在所有的数据集上XGboost的预测效果一致地优于广义线性模型;对于某些自变量较多、变量间相关性强的数据集,神经网络、深度学习和随机森林的预测效果比广义线性模型更好。相似文献

12.

基于机器学习LSTM&US模型的消费者信心指数预测研究

唐晓彬等《统计研究》2020,37(7):104-115

消费者信心指数等宏观经济指标具有时间上的滞后效应和动态变化的多维性,不易精确预测。本文基于机器学习长短时间记忆(Long Short-Term Memory,LSTM)神经网络模型,结合大数据技术挖掘消费者信心指数相关网络搜索数据(User Search,US),进而构建一种LSTM&US预测模型,并将其应用于对我国消费者信心指数的长期、中期与短期的预测研究,同时引入多个基准预测模型进行了对比分析。结果发现:引入网络搜索数据能够提高LSTM神经网络模型的预测性能与预测精度;LSTM&US预测模型具有较好的泛化能力,对不同期限的预测效果均较稳定,其预测性能与预测精度均优于其他六种基准预测模型(LSTM、SVR&US、RFR&US、BP&US、XGB&US和LGB&US);预测结果显示本文提出的LSTM&US预测模型具有一定的实用价值,该预测方法为消费者信心指数的预测与预判提供了一种新的研究思路,丰富了机器学习方法在宏观经济指标预测领域中的理论研究。相似文献

13.

机器学习与线性模型在资产收益率预测中的比较

方毅陈煜之《统计与决策》2022,(16):180-183

文章基于CAPM、多因子、DNN、LSTM和SVM模型,探讨传统线性资本资产定价模型与机器学习模型对于资产组合样本外的预测能力。提出了六个假设,并采用固定窗口和滚动窗口对模型的预测能力进行验证,结果发现机器学习模型比线性回归在样本外的预测能力更佳,泛化能力更强。相似文献

14.

基于灰色线性回归组合模型的金融预测方法 总被引：1，自引：0，他引：1

卢阳《统计与决策》2017,(10):91-93

建立精确的金融预测模型对金融产品管理和风险控制具有重要的实用价值.文章针对新时期下金融产品推出周期短,可建模数据少的特性,构建了一种少数据建模的灰色线性回归组合金融预测模型.针对传统GM模型中忽略了数据的线性变化规律,对传统的GM模型进行改进,加入线性部分,构建了灰色线性组合金融预测模型,并给出了灰色线性组合金融预测模型的参数识别算法.最后实证分析了灰色线性组合金融预测模型对少数据建模的有效性,且实证结果显示该组合金融预测模型具有较高的预测精度. 相似文献

15.

基于整合治愈率模型的信贷违约时点预测

范新妍等《统计研究》2021,38(2):99-113

传统信用评分方法主要利用统计分类方法,只能预测借款人是否会发生违约,但不能预测违约发生的时点。治愈率模型是二分类和生存分析的混合模型,不仅可以预测是否会发生违约,而且可以预测违约发生的时点,比传统二分类方法可以提供更多的信息。另外,随着大数据的发展,数据源越来越多,针对相同或者相似任务,可以收集到多个数据集,本文提出了融合多源数据的整合治愈率模型,可以对多个数据集同时建模和估计参数,通过复合惩罚函数进行组间和组内双层变量选择,并通过促进两个子模型回归系数符号相同,提高模型的可解释性。通过数值模拟发现,所提方法在变量选择和参数估计上均有明显优势。最后,将所提方法应用于信用贷款的违约时点预测中,模型表现良好。相似文献

16.

一个基于神经网络——Logistic回归的混合两阶段个人信用评分模型研究 总被引：8，自引：0，他引：8

下载免费PDF全文

石庆焱《统计研究》2005,5(5):45-5

一、问题的提出在建立个人信用评分模型时 ,预测精度是非常重要的 ,因为许多情况下即使预测的准确性只提高一点点 ,也会使信贷机构的损失减少很多。正因为如此 ,大量的统计分类技术被应用到信用评分领域。文 [1]首次利用中国某商业银行的信用卡客户数据对多种个人信用评分方法在中国的适用状况进行了全面的比较研究。结果表明 ,不同的模型有自己不同的优点和缺点 :神经网络等非线性方法的精度往往要高于 (线性 )判别分析、Logistic回归、线性规划等线性评分方法 ;而Logistic回归、判别分析、线性规划等方法的稳健性① 则比神经网络方法要好… 相似文献

17.

多种个人信用评分模型在中国应用的比较研究 总被引：13，自引：0，他引：13

下载免费PDF全文

石庆焱靳云汇《统计研究》2004,21(6):43-5

信用评分的目的是利用现有的样本数据建立模型,利用此模型对未来申请人的信用行为进行预测,从而区分出"好"客户和"坏"客户.这里,预测的精度是非常重要的,因为许多情况下即使预测的准确性只提高一点点,也会使信贷机构的损失减少很多.正因为如此,大量的分类技术被应用到信用评分领域.那么,到底哪种方法比较好?从现有的研究结果看,并不能得到一个一致的结论,有些结论甚至互相矛盾.如:Desai等(1996)发现,神经网络方法显著优于线性判别分析,而Yobas等(2000)的研究结论则正好相反.因此,到底选择哪一种方法建立评分模型,到目前为止即使在发达国家也仍然是一件困难的事情. 相似文献

18.

利率结构、市场摩擦与跨期套利——基于机器学习的预测

周亮《统计与决策》2022,(22):142-147

传统套利模型大多仅采用价差自身滞后项建模预测,并利用预测值与阈值的差异来决定是否套利,该方法遗漏了较多有用信息。文章通过将利率结构及市场摩擦因素引入预测模型,并利用8种机器学习模型对沪深300股指期货的跨期价差进行预测及构造套利策略,研究结果表明：机器学习模型能够对跨期价差实现非常精准的拟合,Elman网络、随机森林以及平均集成模型表现最好;利用机器学习模型预测值构造的套利模型能够取得非常优异的费后绩效,绝大部分套利模型的夏普比率均在30以上;将利率结构和市场摩擦因素从机器学习模型中剔除,模型预测能力及套利绩效会发生明显下降。相似文献

19.

信用评分模型中拒绝推断问题研究：基于半监督协同训练法的改进

黎春周振宇《统计研究》2019,36(9):82

随着我国金融市场的蓬勃发展,信用评价中的拒绝推断问题越来越受到重视。针对信用评分模型中存在的有类别标签的样本占比低,并且样本中的类别分布不平衡等问题,本文在半监督学习技术与集成学习理论的基础上,提出了一种新的算法——BCT算法。该算法通过使用动态Bagging生成多个子分类器,引入分类阈值参数来解决样本类别分布不平衡问题,以及设定早停止条件来避免算法迭代过程中存在的过拟合风险,以此对传统半监督协同训练法进行改进。通过在5个真实数据集上的实证分析发现,在不同数据集与不同拒绝比例下,BCT算法的性能均优于其他6种有监督学习和半监督学习算法的信用评分模型,显示了BCT算法具有良好的模型泛化性能和更高的模型评价能力。相似文献

20.

双参数Tweedie机器学习模型及其精算应用

高雅倩孟生旺《统计研究》2024,(4):126-140

Tweedie回归是保险损失预测和风险定价的主要工具之一。为充分利用大数据、物联网、机器学习等技术促进保险业的数字化转型,实现更加精准的风险识别和风险定价,本文将传统的Tweedie广义线性模型推广到双参数形式,并结合机器学习算法,提出双参数Tweedie梯度提升树模型和双参数Tweedie组合神经网络模型。基于我国一家保险公司的车联网大数据,提取了新的驾驶行为风险因子。通过实证研究检验了双参数Tweedie梯度提升树和双参数Tweedie组合神经网络在风险识别以及风险定价中的有效性,为促进我国保险业数字化转型提供了一种新的模型和方法。相似文献