首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
介绍带右删失数据非线性模型,研究了带右删失数据非线性模型的参数估计及其算法.  相似文献   

2.
EM算法是一种迭代算法,主要采用后验分布的众数或极大似然估计,广泛的应用于删失数据,截尾数据,成群数据,带有讨厌参数的数据等。文章介绍EM算法,并对删失数据的对数正态分布参数估计和混合正态分布参数的极大似然估计进行了模拟,模拟结果表明对删失数据分布的参数估计和复杂的极大似然估计,EM算法是有效的,估值精度满足要求。  相似文献   

3.
指数分布在生存分析中有着极其重要的应用.文章基于EM算法研究左截断右删失数据下指数分布的参数估计,通过建立似然函数推导出参数迭代表达式,并进行随机模拟试验和实证分析.结果表明EM算法迭代4次后即可收敛,收敛速度很快且估计值较稳定.  相似文献   

4.
国内删失数据统计研究状况综述   总被引:1,自引:0,他引:1  
研究了国内在线性回归模型、非线性回归模型、半参数回归、非参数回归、单指标回归、生存分析、时间序列分析、密度估计等领域删失数据统计研究状况。  相似文献   

5.
为了弄清被试产品的寿命分布,求出各项可靠性指标,常常需要进行删失试验.如何对得到的这些数据进行处理是生存分析需要解决的一个重要问题.本文针对这个问题提出了贝叶斯威布尔生存回归模型.  相似文献   

6.
鉴于生存分析中风险函数较生存函数更能反映生存数据内在失效机制,基于累计风险函数的Nelson-Aalen估计量,构造了右删失数据风险函数的新直方图估计量,并对该估计量的偏差、方差、积分均方误差等统计性质进行了论证,对该估计量的使用注意事项进行了说明,通过数值模拟进一步说明了新估计量的合理性。  相似文献   

7.
在生物医学、临床试验和流行病学等领域的研究中,由于获得生存数据的试验设计、观测时间的局限,以及观测对象在进入或退出试验时的个体差异等方面的原因,与所关注事件的发生时间相关的数据经常存在右删失。基于右删失生存数据解析协变量和生存时间的关系时,应用最为广泛的统计模型是Cox模型。随着科学技术的进步,数据收集变得越来越容易,导致数据库规模越来越大、复杂性越来越高,数据的维度通常可以达到成百上千维,甚至更高。文章提出一种Cox模型中基于Model-X Knockoffs的高维控制变量选择方法。首先基于Knockoffs框架建立一个Knockoffs变量,并基于原始协变量和其相应的Knockoffs变量构造一个正则化的目标函数,然后通过求解目标函数的最优解构造一个统计量和基于数据的阈值,最后进行变量选择。模拟分析和实证研究结果表明:所提方法可以在变量选择的同时提供可靠的FDR控制,优于传统的LASSO方法。  相似文献   

8.
文章考虑两类逐步删失场合的Pareto分布的参数估计问题,在Ⅰ型逐步删失场合,形状参数的极大似然估计没有显式表达式,故采用图解法求出其极大似然估计;在Ⅱ型逐步删失场合,我们能得到两个参数的极大似然估计量。  相似文献   

9.
流式生存数据是一个随时间延续而无限增长的动态生存数据集合,由于数据集以流的形式不断高速到达,一旦当前批次的数据到来,经过快速处理后就要被释放,不能继续保留在内存中。基于右删失流式生存数据来解析协变量与生存时间之间的相关性时,加速失效时间模型(AFT模型)是常被使用的模型之一。文章基于带流数据集的AFT模型,通过泰勒展开构造一个Working估计方程,提出可再生估计,该估计仅依赖历史批数据集的汇总统计量和当前批数据集,有效避免了计算机对历史批数据存储带来的压力。模拟分析和实证结果表明,基于带流数据集的AFT模型提出的可再生估计方法在有限样本中的运行性能较好,在实践中具有可操作性。  相似文献   

10.
在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。  相似文献   

11.
黎梅  李林  高勇标 《统计研究》2009,26(7):55-62
 本文基于商业银行的特殊性,考虑会计公允值约束,以招商、深发展、浦发展、华夏、民生、兴业银行等上市股份制商业银行2000-2007年的样本数据,运用删失(Censoring)面板数据建模技术(Panel Data Modelling),选择适当的控制变量,详尽分析了股权集中度和股东性质2个维度8项指标所描述的商业银行股权结构对商业银行银行3个维度7项结构指标的正面绩效和3项结构指标的负面绩效的影响。删失面板建模实证分析结果表明,在各家银行绩效异质性和会计公允值制度的约束下,本文从绩效构成结构方面,更为深入系统地揭示了股权集中度和股东性质对上市商业银行流动性、盈利性、成长性等正面绩效以及竞争结构、监管压力和资产质量等负面绩效的依存关系;各家上市商业银行绩效在结构方面存在异质性;测度股权结构对商业银行绩效的影响效应时,考虑公允值制度与否,所得结论在结构上有着显著的差异性甚至相反的结论。  相似文献   

12.
朱慧明等 《统计研究》2014,31(7):97-104
针对不可观测异质性非时变假设导致的删失变量偏差及推断无效问题,构建贝叶斯隐马尔科夫异质面板模型,刻画截面个体间的动态时变不可观测异质性,诊断经济系统环境中可能存在的隐性变点,设计相应的马尔科夫链蒙特卡洛抽样算法估计模型参数,并对中国各地区的金融发展与城乡收入差距关系进行实证分析,捕捉到金融发展与城乡收入差距间长期稳定关系的隐性变化,发现了区域个体不可观测异质性存在的动态时变特征。研究结果表明各参数的迭代轨迹收敛且估计误差非常小,验证了贝叶斯隐马尔科夫异质面板模型的有效性。  相似文献   

13.
汽车延保在中国方兴未艾,相应保险产品的推出更是必然趋势,但相关精算定价研究仍为空白。假设系统故障过程为更新过程,将故障分析问题转换为生存分析问题,对存在左截断和右删失的选择性样本进行分析;模型构建上,假设汽车系统寿命服从两参数威布尔分布,构造多层贝叶斯模型,基于MCMC方法估计后验参数;在第二层模型中引入地区、车型、系统等因子作为协变量建立威布尔混合效应模型,并假设随机效应服从Gamma分布,考虑到系统内部件存在竞争风险,对系统寿命分布参数进行调整,把系统寿命的建模分析转换为指定时间内故障次数的分析,并据此给出延保产品精算定价;通过实证研究,基于某4S店真实数据给出两年期延保定价,结果表明基于Gibbs抽样的贝叶斯MCMC方法估计结果收敛性较好,最终定价也贴合实际情况。  相似文献   

14.
Tobit模型的产生及发展   总被引:1,自引:0,他引:1  
Tobit模型作为删失模型中的一个典型代表,最初是由Tobin提出。在他的论文中,通过考察人们对耐用消费品的消费,发现以下特点:在一定的效用及收入约束条件下,人们对耐用消费品的消费分为两种情况,一种就是对耐用消费品进行消费,但其消费量仅为一个常数,其消费情况及其效用的特点我们无法获取;另外一种情况就是对耐用消费品的消费与某些经济变量相  相似文献   

15.
基于Dirichlet过程的非参数贝叶斯方法将先验分布有效扩展到了非参数分布,并广泛应用于密度估计、分层线性模型、有序数据以及生存数据等领域的分析。由于理论和实际的需要,该方法不断发展。为此,文章综述了基于Dirichlet过程的非参数贝叶斯方法的构造、算法及其在不同理论框架下的最新进展,并展望了未来的几个发展方向。  相似文献   

16.
海量数据挖掘算法研究是当前数据挖掘研究领域的热点问题。以网络终端海量数据分布处理及软硬件资源共享为基础,以两变量线性关联效应测度学习算法设计为例,设计出基于超海量数据各终端数据分布处理的学习算法,并运用实验数据验证了该学习算法的有效性。该学习算法设计为海量数据云计算提供了应用思路。  相似文献   

17.
<正>第十届全国生存分析和应用统计研讨会于2016年3月25-27日在重庆召开。本届会议由中国现场统计研究会生存分析分会主办,重庆工商大学、香港浸会大学数学系、重庆誉锋宸数据信息技术有限公司和重庆允升科技大数据研究中心联合承办,主题为"共享数据时代生存分析领域的最新动态和应用统计研究"。来自企事业单位的80多位专家学者参会。会议入选论文36篇,以大数据与高维数据、生存分析模型理论与应用等专题进行了交流讨论。  相似文献   

18.
文章针对频繁项集挖掘中传统串行Eclat算法面对海量数据时挖掘效率不高的问题,提出一种海量数据下的并行频繁项集挖掘算法,即I-SPEclat算法。首先,对Eclat算法存在的缺陷进行改进,引入图的邻接矩阵作为数据的存储结构,避免了大量的交集运算;其次,利用先验性质对候选项集进行预剪枝和后剪枝,减少无用候选项集的数量,节约存储空间;再次,根据项集的前缀对数据进行划分,平衡每个计算节点的工作负载;最后,将改进的Eclat算法在Spark分布式计算框架上实现并行化。实验结果表明,I-SPEclat算法较已有的改进Eclat算法在时间消耗和内存消耗方面均有减少,且面对不同规模的数据集也有着良好的扩展性。  相似文献   

19.
《寿命数据中的统计模型与方法》寿命数据是医学、生物学、保险学和工程科学中常遇到的一类数据。它与一般统计学中研究的数据有不同之处,常表现为不完全数据,或具有截尾的特点、或具有栅失的特点,或具有加速的特点,或具有分组的特点,另外,寿命数据的获得常常花费较...  相似文献   

20.
针对基于众包竞赛中欺诈者筛除机制的黄金标准数据方法、聚类算法的离群点检测算法K-means-算法和DBSCAN算法,依赖于事先给定的参数,不适合大规模数据集检测的问题,提出基于样本连通图的离群点检测算法。首先,给定参数并重复调用离群点检测算法,识别数据中的离群点和聚类;其次,计算每两个样本之间的连接次数和连接强度,在给定连接强度下界δ的情况下,根据样本的连接强度来构造样本之间的连通图;最后,根据样本之间的连通情况,对样本进行标记,把样本标记为聚类节点和离群点。实验结果表明,该算法在放宽参数设置范围的情况下,缩小了离群点个数波动范围,提升了离群点识别准确率,优于对比算法和经典的黄金标准数据方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号