首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
医疗费用预测是健康保险费率厘定的前提和基础。对于多年期的医疗费用数据,通常使用线性混合效应模型对其进行拟合,但线性混合效应模型对非线性关系的纵向数据建模具有一定的局限性。本文对线性混合效应模型进行扩展,根据医疗费用数据中变量之间的非线性关系,建立了多项式混合效应模型,并将其应用于一组医疗费用数据进行实证研究。结果表明,多项式混合效应模型对住院医疗费用的拟合效果显著优于通常使用的线性混合模型,在医疗费用管理和健康保险的费率厘定中具有重要的应用价值。  相似文献   

2.
由于常用的线性混合效应模型对具有非线性关系的纵向数据建模具有一定的局限性,因此对线性混合效应模型进行扩展,根据变量间的非线性关系建立不同的非线性混合效应模型,并根据因变量的分布特征建立混合分布模型。基于一组实际的保险损失数据,建立多项式混合效应模型、截断多项式混合效应模型和B样条混合效应模型。研究结果表明,非线性混合效应模型能够显著改进对保险损失数据的建模效果,对非寿险费率厘定具有重要参考价值。  相似文献   

3.
孙旭等 《统计研究》2019,36(7):119-128
代际流动表可以统计子代与其父代社会地位配对数据的交互频数,反映了社会资源占有的优劣势在父子两代人之间的比较。对财富、阶级、特权等社会基本特征演变的实证考察,均依赖于代际流动表的量化分析。对数线性模型是流动表建模分析的基本工具,通过对列联表单元格频数进行拟合,可以识别流动表行分类与列分类之间的强弱交互效应,刻画父子社会地位间的交互结构。本文利用复杂网络社区发现算法分析父子社会地位的关联结构,针对简约对数线性模型拟合精度不够的问题,提出一种新的建模思路:利用社区发现算法对简约对数线性模型的残差列联表进行关联关系挖掘,将发现的社区效应作为附加参数约束引入原对数线性模型,以改善数据的拟合情况。由于该方法只在原简约对数线性模型中增加了一个参数约束,因此仍可以保证建模结果的简洁性及理论意义,同时社区效应补充了原对数线性模型对经验数据结构的解读。论文用此方法对来源于中国综合社会调查数据的经验代际职业流动表进行建模分析,较好地解释了子代职业阶层与父代职业阶层间的关联模式。  相似文献   

4.
文章考虑纵向数据下工具变量线性回归模型,基于工具变量和二次推断函数方法,提出了回归参数的经验对数似然比统计量.在一些正则条件下,证明了所提出的经验对数似然比统计量渐近于标准卡方分布,由此构造兴趣参数的置信域.  相似文献   

5.
纵向网络数据是较为常见的复杂网络数据,也是目前网络数据分析的热点之一。随机块模型是网络社区发现的经典模型,但是该模型无法直接用于模拟纵向网络数据。基于随机块模型,引入半参数比例风险模型去分析纵向网络数据,并利用随机块模型来描述复发瞬间链接间隔。结合变分EM算法,采用两步估计来分别估计模型参数和非参数部分,通过不同场景下的模拟试验来验证所提议模型的优良性,最后利用法国小学生的社交网络数据进行了实证分析。模拟和实证结果表明,在统计计算的时效和参数或非参数估计的精度上,本文所提出的网络数据模型和统计分析方法比现存文献的模型和方法具有较好的优势。  相似文献   

6.
基于纵向数据,研究参数部分协变量含有测量误差的可加部分线性测量误差模型的估计问题,提出了用于模型估计的偏差修正的二次推断函数方法,得到参数部分的估计结果具有相合性、渐近正态性,非参数可加函数的估计结果达到最优收敛速度。数值模拟和实例数据分析结果显示,该模型估计方法在同等条件下要优于广义估计方程方法。理论和数值结果显示,偏差修正的二次推断函数可以有效地处理测量误差和个体内相关性,是一个有效的纵向数据和测量误差数据分析工具,具有一定的理论和应用价值。  相似文献   

7.
零膨胀负二项(ZINB)层次回归模型是分析散度偏大集群计数数据的有力工具,该模型的基本假设是随机效应和随机误差均服从正态分布.然而,在许多实际应用中,上述假设缺乏稳健性,且相关研究表明,个体内的随机误差以及随机效应将共同导致数据的非正态性特征.基于上述原因,文章将重点考虑基于偏斜正态分布的ZINB层次回归模型的贝叶斯分析问题,与经典的基于似然的方法相比,贝叶斯分析方法具有建模灵活,计算相对简便的优势,特别适合于层次结构较为复杂的模型.  相似文献   

8.
在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。  相似文献   

9.
在读者测量中,面临许多定性数据,如:男、女;常来图书馆、不常来图书馆;会用信息技术、不会用信息技术等.对数线性等级完备模型是分析定性数据的重要手段之一.对数线性等级完备模型有二维、三维、四维……之分,二维对数线性等级完备模型有最大似然估计解、计算简单,但是只适用于测量只有二个属性问题的数据,适应面较小.相对二维对数线性模型,三维以上的对数线性模型能更深入地了解数据之间的联系.有较大的普适性,大多数测量问题都是三维以上的,但随着维数的增加,计算难度随之增大.三维对数线性模型在读者测量中即有较大的普适性,又有计算难度适中性.是比较理想的工具.  相似文献   

10.
空气质量指数是与人们的日常活动密切相关的指标。基于中国18个城市2014年共52个周的空气污染计数数据进行负二项回归分析,通过运用广义线性混合效应模型和广义估计方程的方法进行比较分析,从理论和实际应用上得到了一定结论。研究结果表明:广义线性混合效应模型和广义估计方程两种方法在分析空气污染问题中差别不大;人口因素、城市园林绿化状况、气象因素、城市群效应以及季节效应对所研究城市的空气污染状况发生与否及其严重程度有显著的影响。  相似文献   

11.
非寿险业务中的损失数据结构日益复杂,呈现异质性与相关性并存的异象。分层广义线性模型能够突破传统费率厘定精算方法仅分析风险个体同一保单年损失数据的局限,可以提高复杂结构损失数据预测的准确性。基于分层广义线性模型等方法,研究具有多年损失数据的非寿险费率厘定问题,并以车险和工伤补偿保险的两组损失数据为例进行实证分析。研究结果表明,相对于GLM而言,考虑随机效应后GLMM的拟合优度大幅改善,GLMM与HGLM可以更有效地反映不同风险个体的差异,并有利于揭示风险个体在多个保险期内损失的异质性与相关性。  相似文献   

12.
徐小君 《统计研究》2015,32(10):12-20
为考察货币政策的非对称性效应,本文将工资下调刚性与价格下调刚性特征构建于宏观结构模型,并利用中国宏观经济季度数据,采用模拟矩方法对上述结构模型中的参数进行估计,最后利用估计得到的参数对模型进行随机动态模拟分析。模型参数的估计结果表明,我国工资和价格的变动具有明显的下调刚性特征。基于估计得到的参数对模型的动态模拟分析说明,信贷政策、存款准备金率政策以及存贷利差政策都在执行方向和力度上对经济系统产生了不同类型的非对称性效应,并且不同种类的货币政策工具对经济产生了不同的影响效果。本文的研究对我国中央银行根据经济状况选择恰当的货币政策工具,以及确定政策工具在数量上的执行力度都有着参考意义。  相似文献   

13.
于力超  金勇进 《统计研究》2016,33(1):95-102
抽样调查领域常采用对多个受访者进行跟踪调查得到面板数据,进而对总体特性进行统计推断,在面板数据中常含缺失数据,大多数处理面板缺失数据的软件都是直接删去含缺失值的受访者以得到完全数据集,当数据缺失机制为非随机缺失时会导致总体参数估计结果有偏。本文针对数据缺失机制为非随机缺失情形下,如何对面板数据进行统计分析进行了阐述,主要采用的是基于模型的似然推断法,对目标变量、缺失指示变量和随机效应向量的联合分布建模,在已有选择模型和模式混合模型的基础上,引入随机效应,研究目标变量期望的计算方法,并研究随机效应杂合模型下参数的估计方法,在变量分布相对简单的情形下给出了用极大似然法推断总体参数的估计步骤,最后通过模拟分析比较方法的优劣。  相似文献   

14.
如何精确计量信用风险一直是理论界和实务部门的难点和热点问题.本文使用广义线性混合模型对信用风险进行建模分析,将影响违约概率的可观测因素和不可观测因素分别用固定效应和随机效应表示,根据需要随机效应可扩展为多个因子.研究表明,模型具有较好的延展性,宏观经济变量作为可观测变量无法全部解释违约率的异质性,随机效应可以更好地捕捉违约率的异质性,行业因素对违约概率的影响比宏观经济变量显著.  相似文献   

15.
近年来,广义线性模型已被广泛用于车险定价,而一些研究结果显示机器学习在某些方面优于广义线性模型,但这些结果都只是基于某个单一数据集。为了更全面地比较广义线性模型与机器学习方法在车险索赔频率预测问题上的效果,对7个车险数据集进行了比较测试,包括深度学习、随机森林、支持向量机、XGboost等机器学习方法;基于相同的训练集,建立不同的广义线性模型预测索赔频率,根据最小信息准则(AIC)选取最优的广义线性模型;通过交叉验证调参获得机器学习最佳参数和模型。研究结果显示:在所有的数据集上XGboost的预测效果一致地优于广义线性模型;对于某些自变量较多、变量间相关性强的数据集,神经网络、深度学习和随机森林的预测效果比广义线性模型更好。  相似文献   

16.
于力超  金勇进 《统计研究》2018,35(11):93-104
大规模抽样调查多采用复杂抽样设计,得到具有分层嵌套结构的调查数据集,其中不可避免会遇到数据缺失问题,针对分层结构含缺失数据集的插补策略目前鲜有研究。本文将Gibbs算法应用到分层含缺失数据集的多重插补过程中,分别研究了固定效应模型插补法和随机效应模型插补法,进而通过理论推导和数值模拟,在不同组内相关系数、群组规模、数据缺失比例等情形下,从参数估计结果的无偏性和有效性两方面,比较不同方法的插补效果,给出插补模型的选择建议。研究结果表明,采用随机效应模型作为插补模型时,得到的参数估计结果更准确,而固定效应模型作为插补模型操作相对简便,在数据缺失比例较小、组内相关系数较大、群组规模较大等情形下,可以采用固定效应插补模型,否则建议采用随机效应插补模型。  相似文献   

17.
文章使用空间广义线性混合模型为连续空间非正态变量建模,在MATLAB中实现模型参数估计的MCEMG算法,即结合Monte Carlo样本的EM梯度法,求解参数的极大似然估计及采样点随机效应的最小均方误估计。在GS+中进行随机效应的普通克里格插值,并最终对非采样点响应变量进行预测。模拟仿真结果显示该方法参数估计与真实值较接近,响应变量预测结果能反应真实数据总体分布情况。  相似文献   

18.
在遗漏重要自变量时,传统logistic模型的最大似然估计值通常情况下是有偏估计,但自变量的分布情况会影响参数估计的有偏程度。通过传统logistic模型的输出概率的区间划分来进行数据分组,得到了改进的门限随机效应logistic模型,通过Monte Carlo数值模拟发现,给出的数据分组方法可以有效地把受遗漏重要自变量影响大小不同的数据分离开,相对于传统logistic模型和随机效应logistic模型,门限随机效应logistic模型具有更高的分类准确性,并且该模型在清洗数据和分组决策方面有着很好的应用。  相似文献   

19.
在对广义线性模型与经典线性模型进行对比分析基础上,重点介绍了广义线性混合模型与估计方法及其在满意度调查数据中的模型设定与应用,并采用某调查机构在2011年1月至2012年3月期间对购买过某地区银行理财产品的客户进行的满意度调查数据进行实证分析。研究表明:相对于经典线性回归模型与广义线性模型,广义线性混合模型是分析满意度调查数据的有效方法。  相似文献   

20.
隐马尔可夫模型对于异质纵向数据的处理有良好的效果,因此被广泛应用于工程技术、生物医学、经济管理等领域。文章引入了一种特殊的非齐次隐马尔可夫状态转移方式,并将其与经典的多元线性回归相结合,提出了隐非齐次马尔可夫多元线性回归模型,介绍了对该模型进行贝叶斯推断的方法原理和技术细节。最后,通过两个模拟实验说明了推断方法的结果是可靠的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号