期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李纯净张淼赵昱榕袁晓惠《统计与决策》2023,(24):29-34

文章针对协变量为函数型变量、响应变量为标量的函数型分位数回归模型，提出了一种局部稀疏估计方法，能够正确识别系数函数的空子区域。首先，使用非对称拉普拉斯分布构建函数型分位数回归的全似然函数，并通过EM算法推导出系数向量的估计式。其次，提出了一种结合样条光滑和平滑剪切绝对偏离方法的局部稀疏估计方法。数值模拟结果表明，该估计方法在不同的样本量和分位点下均优于传统方法。最后，通过实例证明了估计方法的有效性。相似文献

2.

基于变系数模型的高维数据异同性识别方法研究

孙怡帆等《统计研究》2021,38(5):136-146

随着信息技术的发展,高维数据日益丰富。现实中,很多高维数据由多个主体各异的数据集融合而成。如何准确识别出高维数据集间的异同性成为大数据分析的目标之一。本文提出了变系数模型下的高维数据整合分析方法。该方法可以同时对多个数据集进行变量选择和系数估计,并且能够自动识别出变量系数在数据集间的异同性。模拟结果表明本文方法在异同性识别、变量选择、系数估计和预测等方面明显优于对比方法。在肺癌致病基因识别的应用研究中,本文方法能够识别出具有生物解释的致病基因并发现了两种亚型之间的异同性。相似文献

3.

基于随机化适应性Lasso的高维变量选择

闫懋博田茂再《统计研究》2021,38(1):147-160

Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。相似文献

4.

左删失数据的双惩罚贝叶斯Tobit分位回归方法

舒婷罗幼喜胡超竹李翰芳《统计与决策》2023,(5):27-33

在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。相似文献

5.

面板数据的自适应Lasso分位回归方法研究 总被引：1，自引：0，他引：1

李子强田茂再罗幼喜《统计与信息论坛》2014,(7):3-10

如何在对参数进行估计的同时自动选择重要解释变量,一直是面板数据分位回归模型中讨论的热点问题之一。通过构造一种含多重随机效应的贝叶斯分层分位回归模型,在假定固定效应系数先验服从一种新的条件Laplace分布的基础上,给出了模型参数估计的Gibbs抽样算法。考虑到不同重要程度的解释变量权重系数压缩程度应该不同,所构造的先验信息具有自适应性的特点,能够准确地对模型中重要解释变量进行自动选取,且设计的切片Gibbs抽样算法能够快速有效地解决模型中各个参数的后验均值估计问题。模拟结果显示,新方法在参数估计精确度和变量选择准确度上均优于现有文献的常用方法。通过对中国各地区多个宏观经济指标的面板数据进行建模分析,演示了新方法估计参数与挑选变量的能力。相似文献

6.

Logistic回归的双层变量选择研究

王小燕等《统计研究》2014,31(9):107-112

变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构作筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后本文将adSGL法应用到信用卡信用评分研究,对比logistic回归,它具有更高的分类精度和稳健性。相似文献

7.

再生核Hilbert空间展开的函数型回归模型变量选择

田密罗幼喜《统计与决策》2022,(3)

针对协变量是函数型、响应变量是标量的多元函数型回归模型,文章提出了函数系数基于再生核Hilbert空间展开的变量选择方法。首先,利用带积分余项的泰勒展开式和再生核Hilbert空间内积性质将模型转化为结构化形式,其次,通过自适应弹性网惩罚对结构化模型中的组间和组内系数同时进行压缩。结果证明了这种压缩估计具有Oracle性质,蒙特卡罗模拟结果也显示新方法在不同样本量、不同噪声和变量相关性干扰下均优于基于普通基函数展开的变量选择方法,且尤其适用于原始协变量高度相关的情形。最后,通过分析一个商品房平均销售价格影响因素数据演示了新方法的应用。相似文献

8.

非正态分布下具有自回归误差项的空间自回归模型变量选择研究

王周伟陶志鹏张元庆《统计与信息论坛》2016,(11):27-32

将变量选择引入空间计量模型,讨论具有自回归误差项的空间自回归模型的变量选择问题。在残差非正态独立同分布的条件下,通过最大化信息熵,提出空间信息准则,并证明其在该模型变量选择中具有一致性。模拟研究结果表明:无论对单个系数还是对全部系数,空间信息准则都能很好识别,且与经典的赤池准则相比具有较大的优势。因此,空间信息准则是一种更为有效的变量选择方法。相似文献

9.

Cox模型中的自适应Lasso变量选择

刘丹郑少智《统计与决策》2016,(10):7-10

文章考虑了Cox模型的变量选择问题,将自适应Lasso引入到Cox模型中,提出了一类基于惩罚偏似然函数的自适应Lasso估计程序.通过对偏似然函数采用二阶泰勒展开式近似逼近,运用循环坐标下降法求解模型,再借助牛顿-拉普森迭代完成整个变量选择和估计过程.随机数据模拟的结果表明该方法具有优良的变量选择效果,并适用于高维数据. 相似文献

10.

具有随机缺失协变量的广义变系数模型

于伟程《统计与决策》2008,(9):25-26

在协变量随机缺失时,文章利用加权拟似然方法给出了广义变系数模型中非参数函数系数的估计。由估计的渐近性质可知,当缺失概率未知时,本文提出的方法与缺失概率已知时的估计的渐近性质类似。通过模拟表明加权拟似然估计要比仅用完整个体的方法要好。相似文献

11.

一种新的空间权重矩阵选择方法 总被引：1，自引：0，他引：1

下载免费PDF全文

任英华游万海《统计研究》2012,29(6):99-105

空间权重矩阵选择问题一直是空间计量经济学中的一个难题,权重矩阵的选择正确与否关系到模型的最终估计结果。本文在空间滞后模型框架下,把空间权重矩阵选择问题转化为变量选择问题,然后利用CWB方法进行变量选择。中国城市服务业集聚机理实证研究显示,利用本文所提出的方法所选取的空间权重矩阵较为合理,进而可以减少因为空间权重矩阵误设问题而引起的模型估计偏误。在大样本情形下,该方法可以非常有效地降低计算成本。相似文献

12.

纵向数据下半参数Logistic模型的变量选择

高仙立姜玉英《统计与决策》2017,(20):26-29

文章研究了纵向数据半参数Logistic回归模型的估计问题,给出了模型中未知参数和未知函数的估计方法,探讨了参数部分的变量选择问题,并对不同的变量选择方法进行比较分析.从模拟结果可以看到,文中给出的方法具有很好的估计效果. 相似文献

13.

资产定价模型中β系数的局部加权估计

花俊洲《统计与决策》2011,(1)

在资产定价模型的中,通常采用一般线性回归方法对系数进行估计,但实证数据中,由于资产的期望收益与系数之间未必存在严格的线性关系,往往会导致估计值的不精确。作为对这种估计方法的一种修正,文章利用了局部加权最小二乘估计方法对模型中的系数β进行估计,并对局部权系统的决定问题进行了相关的探讨。由于放松了系数线性性的假定,使得估计值更适应实际数据的变化规律,该方法也为风险管理者提供了一种可供选择且较为实用的数理工具。相似文献

14.

基于带跳时变系数模型的PPI与CPI相关性研究

苍玉权等《统计研究》2019,36(2):101-111

2008年以来,我国PPI与CPI走势出现了多次背离与分化,从整体上看,两者相关性很弱。但从动态视角来看,由于相关关系可能会因时而变,整体相关性有可能被关系本身的方向和强弱变化所削弱甚至掩盖。为准确反映两者相关性的动态变化,本文放宽时变系数函数的光滑性假设,提出了带跳时变系数模型,并给出一种非参数三步估计方法：首先,估计系数函数中跳点的位置和个数;然后,基于估计的跳点和Bootstrap方法选择的窗宽给出系数函数的最终估计;最后,利用蒙特卡洛模拟评价本文提出的非参数估计和窗宽选择方法的有限样本性质。通过对2008年1月至2017年12月我国PPI和CPI月度同比数据的实证分析,我们发现该模型能较好地刻画PPI与CPI相关性的时变和带跳特征,进而也验证了该模型的应用价值。相似文献

15.

半参数空间变系数回归模型的两步估计方法及其数值模拟 总被引：5，自引：0，他引：5

魏传华梅长林《统计与信息论坛》2005,20(1):16-19,50

文章提出了关于半参数空间变系数回归模型的两步估计方法,该方法可得到模型中常值系数估计量的精确解析表达式,广泛的数值模拟表明所提出的估计方法对估计常值系数具有满意的精度和稳定性。相似文献

16.

广义线性模型下ERIC方法的调节参数选择

《统计与信息论坛》2019,(2):19-27

变量选择是处理高维统计模型的基本方法,在回归模型的变量选择中SCAD惩罚函数不仅可以很好地选择出正确模型,同时还可以对参数进行估计,而且还具有oracle性质,但这些良好的性质是基于选择出一个合适的调节参数。目前国内关于调节参数选择方面大多是对于变量选择问题的研究,针对广义线性模型基于SCAD惩罚使用新方法 ERIC准则进行调节参数的选择,并证明在一定条件下经过该准则选择的模型具有一致性。模拟与实证分析结果表明,ERIC方法在选择调节参数方面优于传统的CV准则、AIC准则和BIC准则。相似文献

17.

含缺失数据的半参数模型的稳健估计

丁先文张文袁红陈雪平《统计与决策》2022,(1)

文章在响应变量随机缺失下,基于分位数回归研究了半参数模型的稳健估计问题。首先基于B样条基函数近似技术,将模型非参数函数的估计问题转化为样条系数向量估计问题;其次,在响应变量随机缺失下,提出了一种新的插补方法,对缺失的响应变量进行多重插补;再次,基于插补后的数据集,构造出新的分位数目标函数,得到模型非参数函数以及参数向量的稳健估计;最后给出了有效算法计算多重插补估计量。通过模拟研究验证了所提方法的有效性和稳健性。相似文献

18.

在不可忽略抽样机制下目标变量的估计问题

吕萍《统计与信息论坛》2008,23(10):9-13

抽样调查是通过对有限总体的重复抽样,用样本数据对总体的目标变量进行估计,但是若样本的抽样过程与目标变量有关,则样本分布不能代表总体分布,此时用样本数据来估计总体会产生很大的偏差。针对这种在不可忽略的抽样机制下如何进行目标变量的估计问题展开讨论,详细介绍了三种处理该问题的方法并对这三种方法进行了比较,得出第三种概率密度函数的方法是处理该问题比较好的一种方法。相似文献

19.

基于排序集样本和辅助变量中位数的均值比率估计方法

乔松珊张建军孙成金《统计与信息论坛》2016,(7):11-15

排序集抽样下利用辅助变量中位数构建了总体均值的改进比率估计模型,分析了该比率估计量的偏差和均方误差,并与简单随机抽样下的比率估计比较,证明了改进后的比率估计均方误差更小。以农作物播种面积和产量为研究对象进行实例分析,研究表明,基于排序集样本和辅助变量中位数的比率估计方法可以有效提高估计精度,验证了该构造方法的可行性。相似文献

20.

纵向部分线性变系数EV模型的估计

赵明涛许晓丽《统计研究》2019,36(10):115-128

纵向数据是随着时间变化对个体进行重复观测而得到的一种相关性数据,广泛出现在诸多科学研究领域。在对个体进行观测时,测量误差不可避免,忽略测量误差往往会导致有偏估计。本文利用二次推断函数方法研究关于纵向数据的参数部分和非参数部分协变量均含有测量误差的部分线性变系数测量误差(errors-in-variables, EV)模型的估计问题。利用B样条逼近模型中的未知系数函数,构造关于回归参数和B样条系数的偏差修正的二次推断函数以处理个体内相关性和测量误差,得到回归参数和变系数的偏差修正的二次推断函数估计,然后证明了估计方法和结果的渐近性质。数值模拟和实例数据分析结果显示本文提出的方法具有一定的实用价值。相似文献