首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
国内删失数据统计研究状况综述   总被引:1,自引:0,他引:1  
研究了国内在线性回归模型、非线性回归模型、半参数回归、非参数回归、单指标回归、生存分析、时间序列分析、密度估计等领域删失数据统计研究状况。  相似文献   

2.
流式生存数据是一个随时间延续而无限增长的动态生存数据集合,由于数据集以流的形式不断高速到达,一旦当前批次的数据到来,经过快速处理后就要被释放,不能继续保留在内存中。基于右删失流式生存数据来解析协变量与生存时间之间的相关性时,加速失效时间模型(AFT模型)是常被使用的模型之一。文章基于带流数据集的AFT模型,通过泰勒展开构造一个Working估计方程,提出可再生估计,该估计仅依赖历史批数据集的汇总统计量和当前批数据集,有效避免了计算机对历史批数据存储带来的压力。模拟分析和实证结果表明,基于带流数据集的AFT模型提出的可再生估计方法在有限样本中的运行性能较好,在实践中具有可操作性。  相似文献   

3.
在生物医学、临床试验和流行病学等领域的研究中,由于获得生存数据的试验设计、观测时间的局限,以及观测对象在进入或退出试验时的个体差异等方面的原因,与所关注事件的发生时间相关的数据经常存在右删失。基于右删失生存数据解析协变量和生存时间的关系时,应用最为广泛的统计模型是Cox模型。随着科学技术的进步,数据收集变得越来越容易,导致数据库规模越来越大、复杂性越来越高,数据的维度通常可以达到成百上千维,甚至更高。文章提出一种Cox模型中基于Model-X Knockoffs的高维控制变量选择方法。首先基于Knockoffs框架建立一个Knockoffs变量,并基于原始协变量和其相应的Knockoffs变量构造一个正则化的目标函数,然后通过求解目标函数的最优解构造一个统计量和基于数据的阈值,最后进行变量选择。模拟分析和实证研究结果表明:所提方法可以在变量选择的同时提供可靠的FDR控制,优于传统的LASSO方法。  相似文献   

4.
EM算法是一种迭代算法,主要采用后验分布的众数或极大似然估计,广泛的应用于删失数据,截尾数据,成群数据,带有讨厌参数的数据等。文章介绍EM算法,并对删失数据的对数正态分布参数估计和混合正态分布参数的极大似然估计进行了模拟,模拟结果表明对删失数据分布的参数估计和复杂的极大似然估计,EM算法是有效的,估值精度满足要求。  相似文献   

5.
生存数据分析的统计方法在很多领域有重要应用,然而生存分析中的观测数据常常出现删失。本文基于EM算法给出随机删失数据下对数正态分布的参数估计迭代算法。实验表明所给算法是容易施行并且行之有效的。  相似文献   

6.
指数分布在生存分析中有着极其重要的应用.文章基于EM算法研究左截断右删失数据下指数分布的参数估计,通过建立似然函数推导出参数迭代表达式,并进行随机模拟试验和实证分析.结果表明EM算法迭代4次后即可收敛,收敛速度很快且估计值较稳定.  相似文献   

7.
为了弄清被试产品的寿命分布,求出各项可靠性指标,常常需要进行删失试验.如何对得到的这些数据进行处理是生存分析需要解决的一个重要问题.本文针对这个问题提出了贝叶斯威布尔生存回归模型.  相似文献   

8.
鉴于生存分析中风险函数较生存函数更能反映生存数据内在失效机制,基于累计风险函数的Nelson-Aalen估计量,构造了右删失数据风险函数的新直方图估计量,并对该估计量的偏差、方差、积分均方误差等统计性质进行了论证,对该估计量的使用注意事项进行了说明,通过数值模拟进一步说明了新估计量的合理性。  相似文献   

9.
文章考虑两类逐步删失场合的Pareto分布的参数估计问题,在Ⅰ型逐步删失场合,形状参数的极大似然估计没有显式表达式,故采用图解法求出其极大似然估计;在Ⅱ型逐步删失场合,我们能得到两个参数的极大似然估计量。  相似文献   

10.
汽车延保在中国方兴未艾,相应保险产品的推出更是必然趋势,但相关精算定价研究仍为空白。假设系统故障过程为更新过程,将故障分析问题转换为生存分析问题,对存在左截断和右删失的选择性样本进行分析;模型构建上,假设汽车系统寿命服从两参数威布尔分布,构造多层贝叶斯模型,基于MCMC方法估计后验参数;在第二层模型中引入地区、车型、系统等因子作为协变量建立威布尔混合效应模型,并假设随机效应服从Gamma分布,考虑到系统内部件存在竞争风险,对系统寿命分布参数进行调整,把系统寿命的建模分析转换为指定时间内故障次数的分析,并据此给出延保产品精算定价;通过实证研究,基于某4S店真实数据给出两年期延保定价,结果表明基于Gibbs抽样的贝叶斯MCMC方法估计结果收敛性较好,最终定价也贴合实际情况。  相似文献   

11.
谢振中 《统计与决策》2008,(11):148-149
文章利用非参数估计的思想对带约束条件非线性回归模型进行了随机化改造,将带约束条件非线性回归模型转化为一个不带约束条件的随机化模型。并运用这一随机化方法和最优化理论,在这个随机化模型下对带约束条件回归模型的广义LS估计量的存在性进行了研究。  相似文献   

12.
在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。  相似文献   

13.
Tobit模型的产生及发展   总被引:1,自引:0,他引:1  
Tobit模型作为删失模型中的一个典型代表,最初是由Tobin提出。在他的论文中,通过考察人们对耐用消费品的消费,发现以下特点:在一定的效用及收入约束条件下,人们对耐用消费品的消费分为两种情况,一种就是对耐用消费品进行消费,但其消费量仅为一个常数,其消费情况及其效用的特点我们无法获取;另外一种情况就是对耐用消费品的消费与某些经济变量相  相似文献   

14.
由于常用的线性混合效应模型对具有非线性关系的纵向数据建模具有一定的局限性,因此对线性混合效应模型进行扩展,根据变量间的非线性关系建立不同的非线性混合效应模型,并根据因变量的分布特征建立混合分布模型。基于一组实际的保险损失数据,建立多项式混合效应模型、截断多项式混合效应模型和B样条混合效应模型。研究结果表明,非线性混合效应模型能够显著改进对保险损失数据的建模效果,对非寿险费率厘定具有重要参考价值。  相似文献   

15.
秦朵  刘一萌 《统计研究》2015,(2):97-103
本文通过对截面数据排序这样一种创新的简单建模实验,将经济变量间关系的一个基本特征——非线性规模效应纳入到截面数据模型设定中。本文以特征价格模型为实验案例,具体的分析对象是汽车和电脑的特征价格模型。实验得出的主要结论有:由于忽略了截面数据样本中潜在的非线性规模效应,传统模型得出的特征价格指数很可能存在系统偏差;基于规模解释变量的数据排序方法是滤出截面数据样本中非线性信息的一种简易而有效的途径;截面数据一经排序,便可采用现有的系统动态建模方法来实现对变量间这种非线性规模信息的滤出。  相似文献   

16.
黎梅  李林  高勇标 《统计研究》2009,26(7):55-62
 本文基于商业银行的特殊性,考虑会计公允值约束,以招商、深发展、浦发展、华夏、民生、兴业银行等上市股份制商业银行2000-2007年的样本数据,运用删失(Censoring)面板数据建模技术(Panel Data Modelling),选择适当的控制变量,详尽分析了股权集中度和股东性质2个维度8项指标所描述的商业银行股权结构对商业银行银行3个维度7项结构指标的正面绩效和3项结构指标的负面绩效的影响。删失面板建模实证分析结果表明,在各家银行绩效异质性和会计公允值制度的约束下,本文从绩效构成结构方面,更为深入系统地揭示了股权集中度和股东性质对上市商业银行流动性、盈利性、成长性等正面绩效以及竞争结构、监管压力和资产质量等负面绩效的依存关系;各家上市商业银行绩效在结构方面存在异质性;测度股权结构对商业银行绩效的影响效应时,考虑公允值制度与否,所得结论在结构上有着显著的差异性甚至相反的结论。  相似文献   

17.
非线性回归模型的线性变换和正交多项式回归   总被引:1,自引:0,他引:1  
在非线性回归模型中,部分模型可以通过数据变换转化为线性模型进行研究,但这种转换有时会引起随机扰动项的变换,改变其假设条件,从而影响模型的准确性.文章引入非线性回归模型的线性变换方法和正交多项式回归方法,重点介绍了正交多项式回归方法;基于R语言软件,通过例子说明了非线性模型线性变换的局限性,并给出了正交多项式回归方法拟合非线性模型的具体应用.  相似文献   

18.
基于STAR模型的外汇储备数据非线性性质研究   总被引:1,自引:0,他引:1  
文章利用1993年1月至2008年9月的月度数据,使用非线性STAR模型技术对我国的外汇储备数据进行实证研究.研究发现我国外汇储备月度数据具有明显非线性特征,可以使用ESTAR模型表达;外汇储备数据具有显著阶段性特征,并且外汇储备数据在两种不同的机制下相互转换,转换速度缓慢.最后,基于ESTAR模型的实证分析,给出一些相关政策建议,认为充分的外汇储备有助于维护国民经济稳定运行,抑制金融危机的影响,削减外汇储备应当审慎.  相似文献   

19.
文章提出了随机系数SETAR模型,推导出其回归系数的估计式,并把该模型应用于一个月度数据序列.实证研究表明,对于非线性时间序列数据,随机系数SETAR模型明显优于AR—MA模型。  相似文献   

20.
鲁万波  杨冬 《统计研究》2018,35(10):28-43
考虑宏观经济变量具有明显的非线性特征,将非线性误差修正项引入存在协整关系的非平稳混频数据抽样(MIDAS)模型中,构建半参数混频数据抽样误差修正(SEMI-ECM-MIDAS)模型。使用广义似然比(GLR)检验,拓展了混频数据下模型函数形式的一致性检验问题。模拟结果表明SEMI-ECM-MIDAS模型对存在非线性误差修正机制的数据具有显著的预测优势。最后使用该模型研究中国股票市场周度数据、广义货币发行量月度数据和国际原油市场月度数据对中国CPI的短期预测效果。基于AIC准则,对包含半参数模型在内的4种混频数据抽样模型和2种同频模型的连续预测效果进行了全面的比较。研究结果发现:GLR检验表明误差修正项具有明显的非线性特征且在回归中具有显著的反向修正机制,无论采用递归样本、滚动样本还是固定样本,本文提出的SEMI-ECM-MIDAS模型在进行连续预测时均具有最优的预测精度,且预测结果不受混频动态协整关系选择的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号