共查询到10条相似文献,搜索用时 459 毫秒
1.
索赔频率预测是非寿险费率厘定的重要组成部分。最常使用的索赔频率预测模型是泊松回归和负二项回归,以及与它们相对应的零膨胀回归模型。但是,当索赔次数观察值既具有零膨胀特征,又存在组内相依结构时,上述模型都不能很好地拟合实际数据。为此,本文在泊松分布、负二项分布、广义泊松分布、P型负二项分布等条件下分别建立了随机效应零膨胀损失次数回归模型。为了改进模型的预测效果,对于连续型的解释变量,还引入了二次平滑项,并建立了结构性零比例与解释变量之间的回归关系。基于一组实际索赔次数数据的实证分析结果表明,该模型可以显著改进现有模型的拟合效果。 相似文献
2.
在非寿险损失预测的广义线性模型中,通常假设损失次数与损失强度相互独立,事实上二者之间往往存在一定的相依关系,可通过copula函数来刻画.在损失已经发生的条件下,假设损失次数服从零截断泊松分布,损失强度服从伽玛分布,可以建立损失次数与损失强度相互依赖的copula回归模型.把损失强度的分布扩展到逆高斯分布,并将此模型应用于一组车险保单数据进行实证研究.结果表明:该模型不但在损失预测方面优于独立假设下的广义线性模型,而且也优于损失强度服从伽马分布假设下的copula回归模型. 相似文献
3.
4.
Tweedie回归是保险损失预测和风险定价的主要工具之一。为充分利用大数据、物联网、机器学习等技术促进保险业的数字化转型,实现更加精准的风险识别和风险定价,本文将传统的Tweedie广义线性模型推广到双参数形式,并结合机器学习算法,提出双参数Tweedie梯度提升树模型和双参数Tweedie组合神经网络模型。基于我国一家保险公司的车联网大数据,提取了新的驾驶行为风险因子。通过实证研究检验了双参数Tweedie梯度提升树和双参数Tweedie组合神经网络在风险识别以及风险定价中的有效性,为促进我国保险业数字化转型提供了一种新的模型和方法。 相似文献
5.
面板数据的自适应Lasso分位回归方法研究 总被引:1,自引:0,他引:1
如何在对参数进行估计的同时自动选择重要解释变量,一直是面板数据分位回归模型中讨论的热点问题之一。通过构造一种含多重随机效应的贝叶斯分层分位回归模型,在假定固定效应系数先验服从一种新的条件Laplace分布的基础上,给出了模型参数估计的Gibbs抽样算法。考虑到不同重要程度的解释变量权重系数压缩程度应该不同,所构造的先验信息具有自适应性的特点,能够准确地对模型中重要解释变量进行自动选取,且设计的切片Gibbs抽样算法能够快速有效地解决模型中各个参数的后验均值估计问题。模拟结果显示,新方法在参数估计精确度和变量选择准确度上均优于现有文献的常用方法。通过对中国各地区多个宏观经济指标的面板数据进行建模分析,演示了新方法估计参数与挑选变量的能力。 相似文献
6.
大数据为季度GDP走势预测创新研究带来重要突破口。本文利用百度等网站的互联网大数据,基于代表性高维数据机器学习(和深度学习)模型,对我国2011-2018年季度GDP增速深入进行预测分析。研究发现,对模型中的随机干扰因素作出一定分布的统计假设,有助于降低预测误差,任由模型通过大量数据机械地学习和完善并不总是有利于模型预测能力的提升;采用对解释变量集添加惩罚约束的方法,可以有效地处理互联网大数据维度较高的棘手问题;预测季度GDP增速的最优大数据解释变量集的稳定性较高。 相似文献
7.
非寿险精算的核心问题之一是对未决赔款准备金进行准确评估。非寿险未决赔款准备金评估通常使用增量赔款或累积赔款的流量三角形数据。在未决赔款准备金评估中,多条业务线的流量三角形数据之间通常存在一定的相依关系,这种相依关系对保险公司总准备金的评估结果具有重要影响。从本质上看,未决赔款准备金是一个随机变量,其损失分布存在一定的多样性。因此,在未决赔款准备金的评估中选择合适的分布至关重要。GB2分布是一种包含四个参数的连续型分布,具有灵活的密度函数,分布形状更加灵活,许多常见分布都是它的特例,适宜处理不同特点的未决赔款流量三角形数据。为了考虑不同业务线之间的相依关系对未决赔款准备金评估结果的影响,本文基于GB2分布建立了一种相依性准备金评估模型,该模型首先假设不同业务线的增量赔款服从GB2分布,并在分布的期望中引入事故年和进展年作为解释变量,引入日历年随机效应描述各条业务线之间的相依关系;然后借助贝叶斯HMC方法进行参数估计和未决赔款准备金预测,最后给出了总准备金的预测分布和评估结果。本文将该方法应用到两条业务线的流量三角形数据进行实证研究,并与现有其他方法进行了比较。实证研究结果表明,基于GB2分布的相依性准备金评估模型对未决赔款准备金的尾部风险和不确定性的考虑更加充分,更加适用于评估具有厚尾或者长尾特征的准备金数据。 相似文献
8.
9.
为了研究大数据是否能够帮助我们预测碳排放权价格,本文讨论了结构化数据和非结构化信息对预测碳价所起的作用。结构化数据选取了国际碳现货价格、碳期货价格和汇率,非结构化信息选择百度搜索指数和媒体指数。考虑到当解释变量很多时,平等对待每一个解释变量是不合理的,所以提出了网络结构自回归分布滞后(ADL)模型,在参数估计和变量选择的同时兼顾了解释变量之间的网络关系。实证分析表明,网络结构ADL模型明显优于其他模型,可以获得较高的预测准确性,更适合基于大数据的预测。 相似文献