期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

信用评分模型综述 总被引：2，自引：0，他引：2

朱晓明刘治国《统计与决策》2007,(2):103-105

本文对信用评分领域大量的模型和方法以及相关文献做了细致的分类和综合比较,这些模型包括多元判别分析模型、数学规划法、Logistic回归分析和神经网络模型等。相似文献

2.

刘颖李惠迪谭博元《统计与决策》2022,(23):52-56

文章提出一种双阶段深度学习的金融时间序列预测模型,研究股民评论、金融新闻资讯与股票指标多源数据对股票市场波动的影响。该模型运用word2vec并结合卷积神经网络对非结构化文本数据进行情感分析,计算情感权重并与股票指数联合;通过双向长短时记忆网络结合注意力机制关注文本重点语义分布,提升全局时序信息敏感度,从而完成非线性、时变性的股指预测。所提模型相比于单一使用股票指数,其均方误差降低0.264,比BiLSTM股票预测模型降低了0.186。实证结果表明,端对端的多源数据融合情感分析模型能够有效解决因多级因素导致的股票市场波动性与不规律性,从而对股票指数进行预测。相似文献

3.

个人信用评分的主要模型与方法综述 总被引：15，自引：1，他引：15

下载免费PDF全文

石庆焱靳云汇《统计研究》2003,20(8):36-4

随着中国经济的快速发展 ,信用消费已逐步浮出水面 ,住房按揭、汽车贷款、教育贷款、信用卡等各种个人消费贷款的规模在迅速扩大。在消费信贷热不断升温的形势下 ,各商业银行均把发展零售业务作为未来发展战略的重要组成部分。但是由于目前国内商业银行对零售业务的风险管理水平较低 ,管理手段与方法均较落后 ,其中缺乏一套有效的个人信用评分方法是阻碍了个人消费信贷业务进一步开展的主要因素之一。本文的目的就是在对国外有关商业银行较常使用的个人信用评分模型与方法进行综述 ,并就各种方法的性能进行分析比较。　　一、信用评分的简要… 相似文献

4.

一个基于神经网络——Logistic回归的混合两阶段个人信用评分模型研究 总被引：8，自引：0，他引：8

下载免费PDF全文

石庆焱《统计研究》2005,5(5):45-5

一、问题的提出在建立个人信用评分模型时 ,预测精度是非常重要的 ,因为许多情况下即使预测的准确性只提高一点点 ,也会使信贷机构的损失减少很多。正因为如此 ,大量的统计分类技术被应用到信用评分领域。文 [1]首次利用中国某商业银行的信用卡客户数据对多种个人信用评分方法在中国的适用状况进行了全面的比较研究。结果表明 ,不同的模型有自己不同的优点和缺点 :神经网络等非线性方法的精度往往要高于 (线性 )判别分析、Logistic回归、线性规划等线性评分方法 ;而Logistic回归、判别分析、线性规划等方法的稳健性① 则比神经网络方法要好… 相似文献

5.

多源高维数据的多分类纵向整合分析及应用

吴梦云等《统计研究》2021,38(8):132-145

多分类数据分析在实证研究中具有重要意义。然而,由于高维数、小样本及低信噪比等原因,现有的多分类方法仍面临信息量不足而导致的效果不佳问题。为此,学者们通过收集更多信息源数据以更全面地刻画实际问题。不同于收集相同自变量的不同源样本,目前较为流行的多源数据收集了相同样本的不同源自变量,它们的独立性和相关性为统计建模带来了新的挑战。本文提出基于典型变量回归的多分类纵向整合分析方法,其中利用惩罚技术实现变量选择,并独特地考虑不同源数据间的关联结构,提出高效的ADMM算法进行模型优化。数值模拟结果表明,该方法在变量选择和分类预测上均具有优越性。基于我国上证50的多源股票数据,利用该方法对2019年股票日收益率的影响因素进行了实证探究。研究表明,本文提出的多分类整合分析在筛选出具有解释意义变量的同时具有更好的预测效果。相似文献

6.

基于整合治愈率模型的信贷违约时点预测

范新妍等《统计研究》2021,38(2):99-113

传统信用评分方法主要利用统计分类方法,只能预测借款人是否会发生违约,但不能预测违约发生的时点。治愈率模型是二分类和生存分析的混合模型,不仅可以预测是否会发生违约,而且可以预测违约发生的时点,比传统二分类方法可以提供更多的信息。另外,随着大数据的发展,数据源越来越多,针对相同或者相似任务,可以收集到多个数据集,本文提出了融合多源数据的整合治愈率模型,可以对多个数据集同时建模和估计参数,通过复合惩罚函数进行组间和组内双层变量选择,并通过促进两个子模型回归系数符号相同,提高模型的可解释性。通过数值模拟发现,所提方法在变量选择和参数估计上均有明显优势。最后,将所提方法应用于信用贷款的违约时点预测中,模型表现良好。相似文献

7.

多源异常检测的整合单类SVM方法及应用

张庆昭陈子怡方匡南《统计研究》2023,(4):138-150

异常检测作为一种智能化的数据管控手段,在网络入侵检测、欺诈识别和故障检测等场景中都扮演着重要角色。大数据时代下,数据来源众多,给多源数据集的异常检测建模分析带来了较大挑战。本文将惩罚整合分析的思想应用到异常检测中,通过对不同数据集的模型系数差异进行惩罚,提出了基于多源数据的整合单类SVM异常检测方法。该方法可以同时对多源数据进行异常检测并自动将相似数据集聚为一类,可以大幅减少模型待估参数个数并降低后期维护成本。模拟实验表明,本文提出的方法不仅能准确将数据集聚类,而且模型预测效果优于合并数据集建模和每个数据集单独建模。该方法在某银行网站日志异常检测中也有较好的表现。相似文献

8.

基于多源信息融合的能源需求预测模型研究综述

冯雪张金锁邹绍辉《统计与决策》2016,(23):29-32

文章以能源需求预测模型技术提升和预测误差不断改善为线索,从信息源的角度出发,梳理了国内外能源需求预测的相关理论与模型特征.能源需求预测模型经历了单一模型、多源模型组合和智能信息融合三个发展阶段,文章对模型发展阶段的特点和存在问题进行评述,对未来非线性、变权重技术以及多源信息融合模型在能源需求预测方面的应用做出进一步展望. 相似文献

9.

多种个人信用评分模型在中国应用的比较研究 总被引：13，自引：0，他引：13

下载免费PDF全文

石庆焱靳云汇《统计研究》2004,21(6):43-5

信用评分的目的是利用现有的样本数据建立模型,利用此模型对未来申请人的信用行为进行预测,从而区分出"好"客户和"坏"客户.这里,预测的精度是非常重要的,因为许多情况下即使预测的准确性只提高一点点,也会使信贷机构的损失减少很多.正因为如此,大量的分类技术被应用到信用评分领域.那么,到底哪种方法比较好?从现有的研究结果看,并不能得到一个一致的结论,有些结论甚至互相矛盾.如:Desai等(1996)发现,神经网络方法显著优于线性判别分析,而Yobas等(2000)的研究结论则正好相反.因此,到底选择哪一种方法建立评分模型,到目前为止即使在发达国家也仍然是一件困难的事情. 相似文献

10.

基于FAHP的个人信用评分模型

易传和彭江《统计与决策》2009,(15)

在经济、金融快速发展,信用交易日益频繁的中国,个人信用评分的建设仍然是个薄弱环节.文章基于运用FAHP法构建了个人信用评分模型,并通过案例分析对模型进行了验证.结果显示,引入FAHP法简化了模型的构建过程,模型运行结果有效、合理,值得在个人信用评分领域推广. 相似文献

11.

信用评分模型中拒绝推断问题研究：基于半监督协同训练法的改进

黎春周振宇《统计研究》2019,36(9):82

随着我国金融市场的蓬勃发展,信用评价中的拒绝推断问题越来越受到重视。针对信用评分模型中存在的有类别标签的样本占比低,并且样本中的类别分布不平衡等问题,本文在半监督学习技术与集成学习理论的基础上,提出了一种新的算法——BCT算法。该算法通过使用动态Bagging生成多个子分类器,引入分类阈值参数来解决样本类别分布不平衡问题,以及设定早停止条件来避免算法迭代过程中存在的过拟合风险,以此对传统半监督协同训练法进行改进。通过在5个真实数据集上的实证分析发现,在不同数据集与不同拒绝比例下,BCT算法的性能均优于其他6种有监督学习和半监督学习算法的信用评分模型,显示了BCT算法具有良好的模型泛化性能和更高的模型评价能力。相似文献

12.

基于变系数模型的高维数据异同性识别方法研究

孙怡帆等《统计研究》2021,38(5):136-146

随着信息技术的发展,高维数据日益丰富。现实中,很多高维数据由多个主体各异的数据集融合而成。如何准确识别出高维数据集间的异同性成为大数据分析的目标之一。本文提出了变系数模型下的高维数据整合分析方法。该方法可以同时对多个数据集进行变量选择和系数估计,并且能够自动识别出变量系数在数据集间的异同性。模拟结果表明本文方法在异同性识别、变量选择、系数估计和预测等方面明显优于对比方法。在肺癌致病基因识别的应用研究中,本文方法能够识别出具有生物解释的致病基因并发现了两种亚型之间的异同性。相似文献

13.

统计信用与统计数据质量研究 总被引：6，自引：0，他引：6

下载免费PDF全文

刘清海熊祖辕《统计研究》2009,26(12):19-22

统计数据质量问题严重影响着政府决策和社会公信力。本文运用博弈论分析方法,分析了声誉资本大小、失信惩戒力度、报假收益及监督力度是影响统计数据失真的重要因素,证明了引入统计信用可以在有限的成本下防范数据失真,提出了完善统计信用惩戒制度是统计信用发挥作用的制度基础。相似文献

14.

大数据的整合分析方法

马双鸽等《统计研究》2015,32(11):3-11

大数据具有数据来源差异性、高维性及稀疏性等特点,如何挖掘数据集间的异质性和共同性并降维去噪是大数据分析的目标与挑战之一。整合分析（Integrative Analysis）同时分析多个独立数据集,避免因地域、时间等因素造成的样本差异而引起模型不稳定,是研究大数据差异性的有效方法。它的特点是将每个解释变量在所有数据集中的系数视为一组,通过惩罚函数对系数组进行压缩,研究变量间的关联性并实现降维。本文从同构数据整合分析、异构数据整合分析以及考虑网络结构的整合分析三方面梳理了惩罚整合分析方法的原理、算法和研究现状。统计模拟发现,在弱相关、一般相关和强相关三种情形下, Group Bridge、 Group MCP、Composite MCP都表现良好,其中 Group Bridge的假阳数最低且最稳定。最后,将整合分析用于研究具有来源差异性的新农合家庭医疗支出,以及具有超高维、小样本等大数据典型特征的癌症基因数据,得到了一些有意义的结论。相似文献

15.

信用评分模型应用比较研究——基于个体工商户数据的检验 总被引：2，自引：0，他引：2

晏艳阳蒋恒波《统计与信息论坛》2010,25(5):30-35

信用评分是各类机构进行信用管理的有效工具,有着广泛的应用前景。随着计量技术的发展,信用评分方法也不断革新,为实际应用提供了多种选择。选取Logistic回归、分类树两种统计方法及代表信用评分发展趋势的人工智能神经网络中的多层感知器、径向基网络、自组织特征映射网络、支持向量机等共六种模型,运用较大样本量的个体工商户数据在一致的框架下进行检验。结果表明：Logistic回归模型与支持向量机两种方法在错分率、稳定性及适用性方面较为优越,其中支持向量机作为人工智能评分方法的最新应用之一,其综合性能更为突出。相似文献

16.

基于Gibbs抽样算法的面板数据分位回归方法

下载免费PDF全文

罗幼喜李翰芳田茂再《统计研究》2011,28(7):98-103

文章讨论了含有随机效应的面板数据模型,利用非对称Laplace分布与分位回归之间的关系,文章建立了一种贝叶斯分层分位回归模型。通过对非对称Laplace分布的分解,文章给出了Gibbs抽样算法下模型参数的点估计及区间估计,模拟结果显示,在处理含随机效应的面板数据模型中,特别是在误差非正态的情况下,本文的方法优于传统的均值模型方法。文章最后利用新方法对我国各地区经济与就业面板数据进行了实证研究,得到了有利于宏观调控的有用信息。相似文献

17.

Imputation in Data Fusion of Heterogeneous Data Sets A Model-Based Numerical Experiment

Andre Berchtold Andre Jeannin 《统计学通讯:模拟与计算》2013,42(7):1316-1328

Given the very large amount of data obtained everyday through population surveys, much of the new research again could use this information instead of collecting new samples. Unfortunately, relevant data are often disseminated into different files obtained through different sampling designs. Data fusion is a set of methods used to combine information from different sources into a single dataset. In this article, we are interested in a specific problem: the fusion of two data files, one of which being quite small. We propose a model-based procedure combining a logistic regression with an Expectation-Maximization algorithm. Results show that despite the lack of data, this procedure can perform better than standard matching procedures. 相似文献

18.

面板数据的分位回归方法及其模拟研究 总被引：5，自引：0，他引：5

下载免费PDF全文

罗幼喜田茂再《统计研究》2010,27(10):81-87

文章讨论了含有固定效应的面板数据模型,给出了3种估计未知参数的分位回归方法,蒙特卡洛模拟结果显示这些分位回归方法是处理面板数据的有效手段,且在误差非正态时优于均值回归方法。文章最后给出了一个真实数据的建模案例,得到了有利于决策的有用参考信息。相似文献