首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
面板数据的自适应Lasso分位回归方法研究   总被引:1,自引:0,他引:1  
如何在对参数进行估计的同时自动选择重要解释变量,一直是面板数据分位回归模型中讨论的热点问题之一。通过构造一种含多重随机效应的贝叶斯分层分位回归模型,在假定固定效应系数先验服从一种新的条件Laplace分布的基础上,给出了模型参数估计的Gibbs抽样算法。考虑到不同重要程度的解释变量权重系数压缩程度应该不同,所构造的先验信息具有自适应性的特点,能够准确地对模型中重要解释变量进行自动选取,且设计的切片Gibbs抽样算法能够快速有效地解决模型中各个参数的后验均值估计问题。模拟结果显示,新方法在参数估计精确度和变量选择准确度上均优于现有文献的常用方法。通过对中国各地区多个宏观经济指标的面板数据进行建模分析,演示了新方法估计参数与挑选变量的能力。  相似文献   

2.
阈值模型是刻画非线性关系的一类重要模型,但由于传统的阈值估计量具有非标准型的渐近分布以及保守的置信区间,使得其在实证应用中受到限制.针对这些局限性,本文将传统的阈值模型扩展成为具有高维稀疏特征的形式,并从变量筛选的角度去考察模型的结构突变,在此基础上为新的高维阈值模型设计合理的求解算法,并进一步推导了参数估计量的一致性与渐近正态性.通过数值模拟实验发现,高维稀疏的建模方法,不仅能够有效识别出阈值模型的结构突变,对重要变量的参数也有着非常良好的估计效果.  相似文献   

3.
在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。  相似文献   

4.
孙怡帆等 《统计研究》2021,38(5):136-146
随着信息技术的发展,高维数据日益丰富。现实中,很多高维数据由多个主体各异的数据集融合而成。如何准确识别出高维数据集间的异同性成为大数据分析的目标之一。本文提出了变系数模型下的高维数据整合分析方法。该方法可以同时对多个数据集进行变量选择和系数估计,并且能 够自动识别出变量系数在数据集间的异同性。模拟结果表明本文方法在异同性识别、变量选择、系数估 计和预测等方面明显优于对比方法。在肺癌致病基因识别的应用研究中,本文方法能够识别出具有生物解释的致病基因并发现了两种亚型之间的异同性。  相似文献   

5.
SCAD惩罚逻辑回归的财务预警模型   总被引:1,自引:0,他引:1  
作为一种有监督学习算法,逻辑回归(Logistic Regression,LR)已广泛应用于财务危机建模分析,但其潜在地存在过拟合问题。鉴此,提出一种基于平滑削边绝对偏离(Smoothly Clipped Absolute Deviation,SCAD)惩罚逻辑回归的财务预警模型。该模型不仅能很好地解决模型过拟合问题,而且还可以同时实现变量选择和模型系数估计,并提高了模型的解释性。结合沪深股市A股制造业上市公司的财务数据进行实证研究,同时对比一般的L1正则化和L2正则化逻辑回归模型的预警效果进行实证分析,实验结果表明:SCAD惩罚逻辑回归模型具有较好的分类效果和较强的经济解释能力。  相似文献   

6.
针对混合效应模型中固定效应与随机效应同时选择问题,提出了施加多个惩罚项的回归过程,同时给出了参数估计的交替迭代算法,并证明了算法的收敛性。针对两种特殊的多惩罚回归过程,分别利用计算机模拟数据进行了比较分析,结果显示新方法在各种不同条件下均有良好的表现,尤其是能处理高维稀疏的混合效应模型。最后通过一个实际数据演示了新方法的应用。  相似文献   

7.
基于递归特征消除方法的随机森林算法   总被引:1,自引:0,他引:1  
基于随机森林算法中的相关预测因子进行变量选择,在高维回归或分类框架中,变量选择是一项艰巨的任务,甚至在高度相关的预测中变得更加具有挑战性,文章提供了在回归模型上置换重要性测量的理论研究,这使我们能够描述相关性预测和排名的重要性之间的影响.相比于原始随机森林算法使用重要性排名做变量选择,研究结果使用了递归特征消除(RFE)方法做变量选择.通过实验证明了RFE-RF方法对机器学习算法的正确预测有很大的帮助.  相似文献   

8.
张景肖  刘燕平 《统计研究》2012,29(9):95-102
本文对函数性广义线性模型曲线选择的正则化方法进行了较全面地综述,并比较了各种方法的性质。结果发现,函数性广义线性模型曲线选择问题具有群组效应,另外可能具有高维数据性质。同时通过数据模拟发现,Group Bridge、Group MCP、Elastic Net和Mnet表现出较好的数值结果。  相似文献   

9.
对回归模型的参数进行比较是计量经济学研究的一个重要内容.文章提出了一种新的思路来对回归模型的参数的差异进行检验,该方法与一般人们所用的Wald统计量来检验的方法和使用虚拟变量的方法相比而言比较灵活,应用面较广,它既可以对同一个回归方程的不同参数的差异进行比较,也可以对两个解释变量个数不同的回归方程的不同参数进行比较,在一定程度上能够解决其他方法所不能够处理的问题.  相似文献   

10.
缺失数据问题在抽样调查、社会科学、流行病等领域普遍存在,这一现象在高维情形下更为凸显;而与高维数据相伴的信息海量化、复杂化、异质化、缺失化等问题,给高维缺失数据理论建立及应用研究带来极大的挑战。如何建立一种稳健高效的高维缺失数据插补方法,已成为当今学者研究的焦点。为解决上述难题,创新性地将增强的逆概率加权(IPW)与加法模型融合,应用协变量平衡倾向评分法(CBPS)估计缺失概率,提出一种适用于高维缺失数据的可加协变量平衡倾向评分插补方法(CBPS-AM),期望对高维缺失问题提供更为有效的解决方案。CBPS-AM方法不仅具有多重稳健性,避免了模型误设带来的严重风险,还能够有效规避高维缺失数据具有厚尾分布而使得传统插补方法失效的问题,起到双重降维的作用,实现建模的灵活性与广泛适用性。其次借鉴广义矩估计方法和Backfitting算法给出了CBPS估计算法,该算法简洁有效,能够提高数据使用效率与插补精度,同时研究了估计量的理论性质,对比了所提方法与传统方法在数值模拟中的表现。最后将CBPS-AM方法分别应用于存在缺失的HIV临床试验数据和中国新冠病毒感染疫情数据中,建立科学的综合评价以及针对...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号