首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
对于半连续两部回归模型,考虑到每个回归部分都会遇到大量的候选变量,此时就会产生变量选择问题。文章主要研究Bernoulli-Normal两部回归模型的变量选择问题。先提出一种基于Lasso惩罚函数的变量选择方法,但考虑到Lasso估计量不具有Oracle性质,又提出一种基于自适应Lasso惩罚函数的变量选择方法。模拟结果表明:两种方法都能够对Bernoulli-Normal回归模型进行变量选择,且自适应Lasso方法的变量选择性能往往优于Lasso方法。  相似文献   

2.
王小燕等 《统计研究》2014,31(9):107-112
变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构作筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后本文将adSGL法应用到信用卡信用评分研究,对比logistic回归,它具有更高的分类精度和稳健性。  相似文献   

3.
经济数据常存在空间相关性,忽略空间相关性会引发内生性问题,导致相应估计量有偏且不一致。空间随机前沿模型在随机前沿模型的基础上考虑了生产单元的空间相关性,更利于效率测算。然而现有空间随机前沿模型的生产函数形式单一,适用性较差,实证分析存在局限性。文章在空间随机前沿模型中引入平滑转移效应,构建了平滑转移空间随机前沿模型,该模型同时考虑了空间相关性和个体异质性,适用性较佳。为丰富估计方法,同时采用极大似然方法和贝叶斯方法估计模型,其中极大似然估计的核心在于推导对数似然函数、对数似然函数的最优化以及使用JLMS法估计技术效率,贝叶斯估计的核心在于推导未知参数的后验分布及执行MCMC抽样。数值模拟结果显示:(1)极大似然估计和贝叶斯估计的估计精度均较高,其中贝叶斯估计的估计精度略高于极大似然估计;增加样本容量,贝叶斯估计和极大似然估计的估计精度更高。(2)若忽略空间效应或者平滑转移效应,则估计精度较低。  相似文献   

4.
胡亚南  田茂再 《统计研究》2019,36(1):104-114
零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术, 研究了零膨胀计数数据的联合建模及变量选择问题.对于零膨胀泊松分布,引入潜变量,构造出零膨胀泊松模型的完全似然, 其中由零膨胀部分和泊松部分两项组成.考虑到协变量可能存在共线性和稀疏性,通过对似然函数加自适应弹性网惩罚得到目标函数,然后利用EM算法得到回归系数的稀疏估计量,并用贝叶斯信息准则BIC来确定最优调节参数.本文也给出了估计量的大样本性质的理论证明和模拟研究,最后把所提出的方法应用到实际问题中。  相似文献   

5.
逆高斯回归模型可用于分析正偏态数据,人们通常研究解释变量对其均值参数的影响,但往往忽略了对其散度参数的影响,文章则基于解释变量对均值和散度都有影响的前提,针对联合均值和散度逆高斯回归模型,探讨模型参数的极大似然估计问题。MM算法在优化问题上具有分离参数、降低目标函数的维度、简化求解过程等优点,将MM算法应用于联合均值和散度逆高斯回归模型,能将多元似然函数彻底分解为一系列一元函数之和,从而绕开了参数估计中的矩阵求逆问题。模拟研究表明,当数据量达到100时就能得到很好的估计效果;实证分析表明,理论研究在实际应用中具有可行性。  相似文献   

6.
研究了随机右截尾情形下两个单参数Cox模型的参数估计.在两个Cox模型的参数都未知时,得到了两个Cox模型的参数的具有强相合性的最大似然估计与参数比的区间估计.  相似文献   

7.
文章将自适应Lasso变量选择方法扩展到变系数向量自回归模型(TVP-VAR)中.利用所提出方法对2005-2014年航空煤油价格与民航货邮与旅客周转量月度数据进行分析,并与其他四种方法进行了比较,结果显示:与常系数VAR模型相比,变系数VAR模型能够显著提高模型的拟合与预测精度.提出的自适应Lasso变系数模型一致优于Belmonte,Koop和Korobolis(2014)提出的Lasso变系数模型.  相似文献   

8.
于力超  金勇进 《统计研究》2016,33(1):95-102
抽样调查领域常采用对多个受访者进行跟踪调查得到面板数据,进而对总体特性进行统计推断,在面板数据中常含缺失数据,大多数处理面板缺失数据的软件都是直接删去含缺失值的受访者以得到完全数据集,当数据缺失机制为非随机缺失时会导致总体参数估计结果有偏。本文针对数据缺失机制为非随机缺失情形下,如何对面板数据进行统计分析进行了阐述,主要采用的是基于模型的似然推断法,对目标变量、缺失指示变量和随机效应向量的联合分布建模,在已有选择模型和模式混合模型的基础上,引入随机效应,研究目标变量期望的计算方法,并研究随机效应杂合模型下参数的估计方法,在变量分布相对简单的情形下给出了用极大似然法推断总体参数的估计步骤,最后通过模拟分析比较方法的优劣。  相似文献   

9.
针对复发事件数据协变量的重要作用,建立含有协变量的复发事件变点模型,考虑协变量作用于强度率函数的情形。对于此模型,使用最大似然方法得到变点及各参数估计,并得到了变点估计的相合性。最后对于同时存在待估参数和待估变点的似然函数,采用最速上升法进行了数据模拟。  相似文献   

10.
在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。  相似文献   

11.
在协变量随机缺失时,文章利用加权拟似然方法给出了广义变系数模型中非参数函数系数的估计。由估计的渐近性质可知,当缺失概率未知时,本文提出的方法与缺失概率已知时的估计的渐近性质类似。通过模拟表明加权拟似然估计要比仅用完整个体的方法要好。  相似文献   

12.
闫懋博  田茂再 《统计研究》2021,38(1):147-160
Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。  相似文献   

13.
由于多重响应变量之间可能存在相关性,文章考虑对二值型响应变量和连续型响应变量进行联合建模.利用probit模型,对二值响应引入了具有正态分布的潜变量,从而对多重响应建立线性回归模型,能得到二值变量和连续变量的联合分布.然后考虑回归系数会存在稀疏性,通过对似然函数加惩罚,从而对二重响应的回归系数和协方差矩阵的逆矩阵进行估计,达到参数估计和变量选择的目标.文中目标函数基于l1惩罚.数值模拟和实证分析展示了所提出方法的良好性质.  相似文献   

14.
文章讨论响应变量和部分协变量含测量误差的重复测量数据的建模和估计问题,获得参数极大似然估计的EM迭代算法以及估计量的渐近协方差矩阵,并利用Monte-Carlo模拟说明估计的有效性和模型的价值.最后,将研究理论用于处理气象数据的测量误差校正问题.  相似文献   

15.
由于价格变量同时出现在需求函数和供给函数中,又由于使用数据建模时需求和供给的均衡量是同一数据,通常估计得到的两个函数中价格的符号经常与经济学理论相悖。文章通过对模型的精心设计,使用完全信息极大似然估计,建立了与微观经济理论相符的中国粮食市场动态均衡模型。在此基础上,从数量上分析了决定市场出清的主要变量的作用。最后,从中国粮食安全的角度出发,讨论了政府调控粮食市场的基本原则和策略。  相似文献   

16.
统计物理学中的Beck模型具有很好地描述变量的长期记忆和厚尾的特点,文章利用Beck模型和Tsallis熵的最大化理论,对沪市股票指数进行了研究,首先,给出了在Tsallis熵最大化条件下的分布函数,然后,对沪市股票指数数据进行了实证分析,并通过最大似然估计估计出其参数,最后,利用该厚尾分布计算了沪市综合指数的VaR.  相似文献   

17.
孙燕 《统计研究》2013,30(4):92-98
 在颇具争议的收入差距和健康关系研究中,为了降低可能存在的模型设定和遗漏变量偏误,本文提出了随机效应半参数logit模型,其中非参数的设定还可用于数据的初探性分析。随后本文提出了模型非参数和参数部分的估计方法。这里涉及的难点是随机效应的存在导致似然函数中的积分没有解析式,而非参数的存在更加大了估计难度。本文基于惩罚样条非参数估计方法和四阶Laplace近似方法建立了惩罚对数似然函数,其最大化采用了Newton_Raphson近似方法。文章还建立了惩罚样条中重要光滑参数的选取准则。模型在收入差距和健康实例中的估计结果表明数据支持收入差距弱假说,且非参数估计结果表明其具有U型形式,与实例估计结果的比较指出本文提出的估计方法是较准确的。  相似文献   

18.
尽管贝叶斯分位数回归方法能够有效克服经济金融数据的尖峰厚尾、结构突变等问题,充分借鉴已有研究成果信息,但是其并不能很好解决多维变量模型的维数灾难问题.为此,文章在贝叶斯分位数回归基础上,结合自适应Lasso变量惩罚作用,构建了基于MH抽样的自适应Lasso惩罚贝叶斯分位数回归模型.通过仿真模拟实验以及MCMC链条检验,证明上述模型具有优良拟合性质,尤其是在小样本情形下.  相似文献   

19.
文章考虑了大样本下线性回归中同时进行快速估计和变量选择的问题,即针对一个存在稀疏解的大样本线性模型,根据重要性抽样分布从全数据集抽取少量子样本,对该子样本进行自适应Lasso估计。通过随机模拟研究,将该算法分别应用在几种不同的数据集中,并从模型预测精度和可解释性两个方面比较了四种子抽样方法在该算法下的表现。模拟结果表明,所提出的算法具有良好表现,在计算开销上也具有一定优势。  相似文献   

20.
在贝叶斯Lasso分位数回归中,样本似然函数的计算和后验分布的抽样通常难以处理.针对这一问题,文章采用一种基于线性插值的似然函数计算方法,并结合拉普拉斯先验分布,设计出一种新的对后验分布进行抽样的算法.数值模拟结果表明了该方法具有较好的适应性和参数估计准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号