首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
流式生存数据是一个随时间延续而无限增长的动态生存数据集合,由于数据集以流的形式不断高速到达,一旦当前批次的数据到来,经过快速处理后就要被释放,不能继续保留在内存中。基于右删失流式生存数据来解析协变量与生存时间之间的相关性时,加速失效时间模型(AFT模型)是常被使用的模型之一。文章基于带流数据集的AFT模型,通过泰勒展开构造一个Working估计方程,提出可再生估计,该估计仅依赖历史批数据集的汇总统计量和当前批数据集,有效避免了计算机对历史批数据存储带来的压力。模拟分析和实证结果表明,基于带流数据集的AFT模型提出的可再生估计方法在有限样本中的运行性能较好,在实践中具有可操作性。  相似文献   

2.
生存数据分析的统计方法在很多领域有重要应用,然而生存分析中的观测数据常常出现删失。本文基于EM算法给出随机删失数据下对数正态分布的参数估计迭代算法。实验表明所给算法是容易施行并且行之有效的。  相似文献   

3.
鉴于生存分析中风险函数较生存函数更能反映生存数据内在失效机制,基于累计风险函数的Nelson-Aalen估计量,构造了右删失数据风险函数的新直方图估计量,并对该估计量的偏差、方差、积分均方误差等统计性质进行了论证,对该估计量的使用注意事项进行了说明,通过数值模拟进一步说明了新估计量的合理性。  相似文献   

4.
大数据下的样本大多为非概率样本,其入样概率未知,同时可能面临着协变量较多甚至是高维的情况,那么如何对这种情况下的非概率样本进行推断值得探索。针对该问题,文章考虑到Model-X Knockoffs的降维特点,提出采用Model-X Knockoffs筛选出重要变量,建立Logistic倾向得分模型来估计非概率样本的入样概率或倾向得分,对总体进行推断,从而提高估计的精度,同时可控制变量选择的错误发现率与功效。模拟与实证研究结果表明:基于Model-X Knockoffs的Logistic倾向得分模型的总体均值估计相比一般的Logistic倾向得分模型和广义线性回归模型的总体均值估计,偏差更小、效率更高、估计效果更好,并且能很好地控制错误发现率的水平,功效值也接近1。  相似文献   

5.
文章考虑了Cox模型的变量选择问题,将自适应Lasso引入到Cox模型中,提出了一类基于惩罚偏似然函数的自适应Lasso估计程序.通过对偏似然函数采用二阶泰勒展开式近似逼近,运用循环坐标下降法求解模型,再借助牛顿-拉普森迭代完成整个变量选择和估计过程.随机数据模拟的结果表明该方法具有优良的变量选择效果,并适用于高维数据.  相似文献   

6.
指数分布在生存分析中有着极其重要的应用.文章基于EM算法研究左截断右删失数据下指数分布的参数估计,通过建立似然函数推导出参数迭代表达式,并进行随机模拟试验和实证分析.结果表明EM算法迭代4次后即可收敛,收敛速度很快且估计值较稳定.  相似文献   

7.
介绍带右删失数据非线性模型,研究了带右删失数据非线性模型的参数估计及其算法.  相似文献   

8.
针对协变量是函数型、响应变量是标量的多元函数型回归模型,文章提出了函数系数基于再生核Hilbert空间展开的变量选择方法。首先,利用带积分余项的泰勒展开式和再生核Hilbert空间内积性质将模型转化为结构化形式,其次,通过自适应弹性网惩罚对结构化模型中的组间和组内系数同时进行压缩。结果证明了这种压缩估计具有Oracle性质,蒙特卡罗模拟结果也显示新方法在不同样本量、不同噪声和变量相关性干扰下均优于基于普通基函数展开的变量选择方法,且尤其适用于原始协变量高度相关的情形。最后,通过分析一个商品房平均销售价格影响因素数据演示了新方法的应用。  相似文献   

9.
国内删失数据统计研究状况综述   总被引:1,自引:0,他引:1  
研究了国内在线性回归模型、非线性回归模型、半参数回归、非参数回归、单指标回归、生存分析、时间序列分析、密度估计等领域删失数据统计研究状况。  相似文献   

10.
汽车延保在中国方兴未艾,相应保险产品的推出更是必然趋势,但相关精算定价研究仍为空白。假设系统故障过程为更新过程,将故障分析问题转换为生存分析问题,对存在左截断和右删失的选择性样本进行分析;模型构建上,假设汽车系统寿命服从两参数威布尔分布,构造多层贝叶斯模型,基于MCMC方法估计后验参数;在第二层模型中引入地区、车型、系统等因子作为协变量建立威布尔混合效应模型,并假设随机效应服从Gamma分布,考虑到系统内部件存在竞争风险,对系统寿命分布参数进行调整,把系统寿命的建模分析转换为指定时间内故障次数的分析,并据此给出延保产品精算定价;通过实证研究,基于某4S店真实数据给出两年期延保定价,结果表明基于Gibbs抽样的贝叶斯MCMC方法估计结果收敛性较好,最终定价也贴合实际情况。  相似文献   

11.
函数性数据的统计分析:思想、方法和应用   总被引:9,自引:0,他引:9       下载免费PDF全文
严明义 《统计研究》2007,24(2):87-94
 摘  要:实际中,越来越多的研究领域所收集到的样本观测数据具有函数性特征,这种函数性数据是融合时间序列和横截面两者的数据,有些甚是曲线或其他函数图像。虽然计量经济学近二十多年来发展的面板数据分析方法,具有很好的应用价值,但是面板数据只是函数性数据的一种特殊类型,且其分析方法太过于依赖模型的线性结构和假设条件等。本文基于函数性数据的普遍特征,介绍一种对其进行分析的全新方法,并率先使用该方法对经济函数性数据进行分析,拓展了函数性数据分析的应用范围。分析结果表明,函数性数据分析方法,较之计量经济学和其他统计方法具有更多的优越性,尤其能够揭示其他方法所不能揭示的数据特征  相似文献   

12.
胡亚南  田茂再 《统计研究》2019,36(1):104-114
零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术, 研究了零膨胀计数数据的联合建模及变量选择问题.对于零膨胀泊松分布,引入潜变量,构造出零膨胀泊松模型的完全似然, 其中由零膨胀部分和泊松部分两项组成.考虑到协变量可能存在共线性和稀疏性,通过对似然函数加自适应弹性网惩罚得到目标函数,然后利用EM算法得到回归系数的稀疏估计量,并用贝叶斯信息准则BIC来确定最优调节参数.本文也给出了估计量的大样本性质的理论证明和模拟研究,最后把所提出的方法应用到实际问题中。  相似文献   

13.
范新妍等 《统计研究》2021,38(2):99-113
传统信用评分方法主要利用统计分类方法,只能预测借款人是否会发生违约,但不能预测违约发生的时点。治愈率模型是二分类和生存分析的混合模型,不仅可以预测是否会发生违约,而且可以预测违约发生的时点,比传统二分类方法可以提供更多的信息。另外,随着大数据的发展,数据源越来越多,针对相同或者相似任务,可以收集到多个数据集,本文提出了融合多源数据的整合治愈率模型,可以对多个数据集同时建模和估计参数,通过复合惩罚函数进行组间和组内双层变量选择,并通过促进两个子模型回归系数符号相同,提高模型的可解释性。通过数值模拟发现,所提方法在变量选择和参数估计上均有明显优势。最后,将所提方法应用于信用贷款的违约时点预测中,模型表现良好。  相似文献   

14.
为了弄清被试产品的寿命分布,求出各项可靠性指标,常常需要进行删失试验.如何对得到的这些数据进行处理是生存分析需要解决的一个重要问题.本文针对这个问题提出了贝叶斯威布尔生存回归模型.  相似文献   

15.
协变量平衡聚焦于消除处理变量和协变量的相关性,有助于在因果推断中减少极端权重的产生,提高估计量的稳定性和精度。目前二元处理变量下的协变量平衡相关研究较多,但连续处理变量下的协变量平衡研究有待进一步发展和完善。同时,现有研究直接基于平衡权重的角度实现协变量平衡,相应最优化为带等式和不等式约束的非线性规划,最优化求解相对复杂,导致方法对于大样本量数据尤其是微观数据的使用存在局限性。为避免上述不足,本文基于广义倾向得分的角度提出一种连续处理变量下的协变量平衡方法。该方法使得协变量逼近基的加权样本均值等于协变量逼近基的样本均值,平均剂量响应函数的估计量满足渐近无偏性和相合性。特别地,本文方法的最优化函数为严格凸函数且不带任何约束,从而最优化函数存在唯一解且求解相对简单,因此方法适用于大样本量数据尤其是微观数据的问题研究。此外,本文还提出一种特别的J折交叉验证方法,选择逼近基的阶数以实现数据驱动。数值模拟表明,本文提出方法的估计精度较高。将方法应用于中国家庭追踪调查微观数据,本文得出我国存在“年龄–储蓄率之谜”现象,即户主年龄与家庭储蓄率存在正U型关系,拐点约为42岁。  相似文献   

16.
针对复发事件数据协变量的重要作用,建立含有协变量的复发事件变点模型,考虑协变量作用于强度率函数的情形。对于此模型,使用最大似然方法得到变点及各参数估计,并得到了变点估计的相合性。最后对于同时存在待估参数和待估变点的似然函数,采用最速上升法进行了数据模拟。  相似文献   

17.
赵明涛  许晓丽 《统计研究》2019,36(10):115-128
纵向数据是随着时间变化对个体进行重复观测而得到的一种相关性数据,广泛出现在诸多科学研究领域。在对个体进行观测时,测量误差不可避免,忽略测量误差往往会导致有偏估计。本文利用二次推断函数方法研究关于纵向数据的参数部分和非参数部分协变量均含有测量误差的部分线性变系数测量误差(errors-in-variables, EV)模型的估计问题。利用B样条逼近模型中的未知系数函数,构造关于回归参数和B样条系数的偏差修正的二次推断函数以处理个体内相关性和测量误差,得到回归参数和变系数的偏差修正的二次推断函数估计,然后证明了估计方法和结果的渐近性质。数值模拟和实例数据分析结果显示本文提出的方法具有一定的实用价值。  相似文献   

18.
竞争风险下我国住房抵押贷款风险的实证研究   总被引:1,自引:0,他引:1       下载免费PDF全文
 本文利用我国住房抵押贷款持续期数据,对贷款终止的提前还款和违约这两种情形展开研究,估计了竞争风险下Cox比例危险模型,刻画我国住房抵押贷款的两类风险概率随协变量变化的时间效应。对竞争风险下的Cox比例危险模型,本文计算了相应的Cox-Snell残差和Deviance残差用于模型的拟合检验,检验表明本文估计的竞争风险模型用于抵押贷款持续期数据的分析是合适的。本文进一步讨论了基于持续期的贷款终止风险研究在银行抵押贷款证券化和信贷风险管理中的意义。  相似文献   

19.
在超高维数据中,一方面,协变量的维数可能远远大于样本量,甚至随着样本量以指数级的速度增长;另一方面,超高维数据通常是异质的,协变量对条件分布中心的影响可能与他们对尾部的影响大不相同,甚至会出现重尾以及异常点的复杂情况。文章在协变量维度发散且为超高维的情况下研究了部分线性可加分位数回归模型的变量选择和稳健估计问题。首先,为了实现模型的稀疏性和非参数光滑性,引入了一种非凸Atan双惩罚,并采用分位迭代坐标下降算法来解决所提方法的优化问题。在选择适当正则化参数的情况下,证明了所提双惩罚估计量的理论性质。其次,通过模拟研究对所提方法的性能进行验证。模拟结果表明,所提方法比其他惩罚方法具有更好的表现,尤其是在数据存在重尾的情况下。最后,通过基于癌症筛查病人血液样本数据的实证来验证所提方法的实用性。  相似文献   

20.
《生存数据分析的统计方法》简介该书是生存分析专家E.T.Lee所著。生存分析是根据试验或调查得到的数据对生物或人的生存时间进行分析和推断。生存分析是现代统计学的重要分支,其方法和理论不仅在生物、医学领域有广泛应用,而且越来越广泛地用于工程科学、社会学...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号