排序方式: 共有19条查询结果,搜索用时 15 毫秒
1.
随着计算机和互联网的快速发展,特别是在大数据时代,企业积累了大量有关企业经营、财务等相关数据,变量众多且关系纷繁复杂,如果利用传统的logistic回归建立企业信用风险预警模型往往效果不好.本文在充分考虑变量间的网络结构(Network)关系基础上,提出了网络结构Logistic模型,通过惩罚方法同时实现变量选择和参数估计.蒙特卡洛模拟表明网络结构Logistic模型要优于其他方法.最后,我们将其应用到我国企业信用风险预警中,充分考虑财务指标间的网络结构关系,科学地选择评估指标,构建更加适合我国国情的企业信用风险预警方法. 相似文献
2.
我国在抽样理论和方法中,对抽样框误差的讨论并不多,且涉及定量分析的内容更少。故对抽样框误差进行量化分析有着重要的意义。本文将比较全面地分析抽样框误差,定量测定其对估计量的影响,并提出相对有效的调整控制方法。 相似文献
3.
随着信息技术的发展,数据来源越来越多,一方面可以更加精准、科学地刻画个人信用状况,但另一方面,由于数据来源多、结构复杂等问题,对传统的征信技术带来了挑战。本文提出了基于多源数据融合的个人信用模型,可以同时对多个数据集进行建模和变量选择,同时考虑了数据集间的相似性和异质性。通过模拟实验发现,本文所提出的整合模型在变量选择和分类效果方面都具有明显的优势。最后,将整合模型应用于城市和农村两个数据集的个人信用评分中。 相似文献
4.
5.
随着计算机的飞速发展,极大地便利了数据的获取和存储,很多企业积累了大量的数据,同时数据的维度也越来越高,噪声变量越来越多,因此在建模分析时面临的重要问题之一就是从高维的变量中筛选出少数的重要变量。针对因变量取值为(0,1)区间的比例数据提出了正则化Beta回归,研究了在LASSO、SCAD和MCP三种惩罚方法下的极大似然估计及其渐进性质。统计模拟表明MCP的方法会优于SCAD和LASSO,并且随着样本量的增大,SCAD的方法也将优于LASSO。最后,将该方法应用到中国上市公司股息率的影响因素研究中。 相似文献
6.
针对信用评分中有标记样本获取难度大、成本高的问题,本文提出一种新的基于半监督支持向量机的信用评分模型。通过给未标记样本引入新的参数,使得模型无需满足随机缺失假设,具有良好的适用性。同时,在损失函数中加入半监督部分鼓励有标记样本和未标记样本系数的相似性,从而能够有效融合未标记样本信息,提升估计效果。此外,本文利用Group LASSO进行变量选择,可以充分利用组结构信息,筛选重要变量。通过数值模拟和一个信用卡风险违约预测实例数据证明了所提方法的可行性,以及在变量选择、系数估计和分类预测上的优良效果。 相似文献
7.
本文基于CGSS《中国城乡居民生活综合调查》2006年的家庭微观调查数据分析了我国城乡家庭消费支出的分布特征,按有无社会保障把城乡家庭分别分为两组,利用分位数回归方法分别研究了不同消费层次上,社会保障对城乡家庭消费的影响,并利用反事实分析与分位数分解方法对这两组家庭消费差异进行研究。主要结论有:有社会保障家庭人均消费要高于无社会保障家庭人均消费,消费收入弹性呈“几”字型,有社会保障和无社会保障家庭的消费差异主要是由于收入、地产财富等差异造成的。最后,提出了具有针对性的政策建议。 相似文献
8.
在抽样调查中,总体分为目标总体和抽样总体。所谓目标总体是研究的对象,亦即通过抽样调查所要得到信息的总体3而抽样总体是从中抽取样本的总体,也就是抽样框,对目标总体进行推断的信息取自于抽样总体。理想的抽样框的标准是能够实现目标总体与抽样总体的一致。然而在实践中由于 相似文献
9.
针对分类问题,本文提出了稀疏组Lasso支持向量机方法(Sparse group lasso SVM, SGL-SVM),即在SVM模型的损失函数中引入SGL惩罚函数,能同时进行组间变量和组内变量的筛选。由于SGL-SVM的目标函数求解比较复杂,本文又提出了一种快速的双层坐标下降算法。通过模拟实验,发现SGL-SVM方法在预测效果和变量选择上均要好于其他方法,对于变量具有自然分组结构且组内是稀疏的数据,本文方法在提高变量选择效果的同时又能提高模型的预测精度。最后,将本文提出的SGL-SVM方法应用到我国制造业上市公司财务困境预测中。 相似文献
10.