共查询到20条相似文献,搜索用时 31 毫秒
1.
本文首次将Elastic Net这种用于高度相关变量的惩罚方法用于面板数据的贝叶斯分位数回归,并基于非对称Laplace先验分布推导所有参数的后验分布,进而构建Gibbs抽样。为了验证模型的有效性,本文将面板数据的贝叶斯Elastic Net分位数回归方法(BQR. EN)与面板数据的贝叶斯分位数回归方法(BQR)、面板数据的贝叶斯Lasso分位数回归方法(BLQR)、面板数据的贝叶斯自适应Lasso分位数回归方法(BALQR)进行了多种情形下的全方位比较,结果表明BQR. EN方法适用于具有高度相关性、数据维度很高和尖峰厚尾分布特征的数据。进一步地,本文就BQR. EN方法在不同扰动项假设、不同样本量的情形展开模拟比较,验证了新方法的稳健性和小样本特性。最后,本文选取互联网金融类上市公司经济增加值(EVA)作为实证研究对象,检验新方法在实际问题中的参数估计与变量选择能力,实证结果符合预期。 相似文献
2.
对于半连续两部回归模型,考虑到每个回归部分都会遇到大量的候选变量,此时就会产生变量选择问题。文章主要研究Bernoulli-Normal两部回归模型的变量选择问题。先提出一种基于Lasso惩罚函数的变量选择方法,但考虑到Lasso估计量不具有Oracle性质,又提出一种基于自适应Lasso惩罚函数的变量选择方法。模拟结果表明:两种方法都能够对Bernoulli-Normal回归模型进行变量选择,且自适应Lasso方法的变量选择性能往往优于Lasso方法。 相似文献
3.
在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。 相似文献
4.
在数据驱动时代,变量选择广泛应用于投资组合,如何从众多资产中挑选恰当的资产并进行配比,对稳定收益、控制风险非常关键。现有选择资产的方法未考虑到控制错误发现率(FDR),不利于作出稳健的投资决策。为此,本文在Lasso分位数回归下基于Knockoff方法控制FDR,并用于求解条件风险价值(CVaR)投资组合决策模型。其中,用Lasso惩罚实现变量选择,用Knockoff方法通过模仿解释变量的相关结构构造Knockoff变量,将变量选择的FDR控制在给定水平。模型在两步迭代算法下采用线性规划求解,模拟分析从不同的误差分布、变量分布和维度下多角度展开。结果显示,与已有模型相比,基于Knockoff的Lasso分位数回归模型能良好地控制FDR且呈现出最好的预测效果。最后基于上证50指数成分股进行实证分析,利用滚动建模技术进行投资组合决策分析,发现新模型在收益指标和风险指标上均具有一定优势。 相似文献
5.
文章考虑了Cox模型的变量选择问题,将自适应Lasso引入到Cox模型中,提出了一类基于惩罚偏似然函数的自适应Lasso估计程序.通过对偏似然函数采用二阶泰勒展开式近似逼近,运用循环坐标下降法求解模型,再借助牛顿-拉普森迭代完成整个变量选择和估计过程.随机数据模拟的结果表明该方法具有优良的变量选择效果,并适用于高维数据. 相似文献
6.
文章利用贝叶斯方法研究分位数回归的组间和组内双变量选择问题。基于偏态拉普拉斯分布和贝叶斯统计推断方法,结合组间和组内系数的Spike-and-Slab先验分布,提出了分位数回归的贝叶斯双层变量选择方法,并给出易于实施的Gibbs后验抽样算法。通过大量数值模拟和实证分析验证了所提变量选择方法的有效性。 相似文献
7.
8.
变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构作筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后本文将adSGL法应用到信用卡信用评分研究,对比logistic回归,它具有更高的分类精度和稳健性。 相似文献
9.
10.
11.
为了尝试使用贝叶斯方法研究比例数据的分位数回归统计推断问题,首先基于Tobit模型给出了分位数回归建模方法,然后通过选取合适的先验分布得到了贝叶斯层次模型,进而给出了各参数的后验分布并用于Gibbs抽样。数值模拟分析验证了所提出的贝叶斯推断方法对于比例数据分析的有效性。最后,将贝叶斯方法应用于美国加州海洛因吸毒数据,在不同的分位数水平下揭示了吸毒频率的影响因素。 相似文献
12.
13.
文章首先分析了非寿险产品费率厘定中的零索赔额现象;指出了线性回归模型和广义线性模型在非寿险产品费率厘定中存在的问题和不足;分析了分位数回归模型在非寿险产品费率厘定中的优点,并结合实例,给出了实证分析.结果表明,分位数回归模型更能从整体上反映出费率厘定变量之间的关系及其对索赔额的影响. 相似文献
14.
Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。 相似文献
15.
分位数回归在风险管理中的应用 总被引:1,自引:0,他引:1
VaR已经成为金融风险度量的重要工具之一,近几年获得了重大的发展,计算VaR常用的方法主要有3种:历史模拟法HS(Historical Simulation)、方差-协方差法(Variance-Covariance Method)和蒙特卡罗模拟法MC(Monte CarloSimulation).分位数回归模型是针对解释变量的条件分位数来建模的,而资产组合的VaR实质上就是分位数,所以我们采用分位数回归模型来对VaR进行估计. 相似文献
16.
本文对混合效应模型提出了一种非参数贝叶斯分位回归方法,通过引进一种新的分层有限正态混合分布,将分位回归建模时对随机误差项的假定放宽至仅有分位点约束之下.通过对混合比例参数假设广泛灵活的Stick-Breaking先验,使得模型捕捉复杂数据分布信息的能力更强.在建立的非参数贝叶斯分层分位回归模型中引入潜变量,使模型参数估计的Gibbs抽样算法中原来每次需要计算(2M)N项函数值变为每次只需计算N项即可.蒙特卡罗模拟显示,在误差分布函数变得较为复杂时,非参数贝叶斯分位回归方法比参数方法在估计效果上有更大的优势. 相似文献
17.
18.
在超高维数据中,一方面,协变量的维数可能远远大于样本量,甚至随着样本量以指数级的速度增长;另一方面,超高维数据通常是异质的,协变量对条件分布中心的影响可能与他们对尾部的影响大不相同,甚至会出现重尾以及异常点的复杂情况。文章在协变量维度发散且为超高维的情况下研究了部分线性可加分位数回归模型的变量选择和稳健估计问题。首先,为了实现模型的稀疏性和非参数光滑性,引入了一种非凸Atan双惩罚,并采用分位迭代坐标下降算法来解决所提方法的优化问题。在选择适当正则化参数的情况下,证明了所提双惩罚估计量的理论性质。其次,通过模拟研究对所提方法的性能进行验证。模拟结果表明,所提方法比其他惩罚方法具有更好的表现,尤其是在数据存在重尾的情况下。最后,通过基于癌症筛查病人血液样本数据的实证来验证所提方法的实用性。 相似文献
19.
在给定概率水平下,为了描述具有尖峰、肥尾、有偏等特性的金融变量之间的非线性相依结构,给出了能够准确刻画金融变量上述特性的非对称Laplace分布,首次推导出了以该分布为边际分布,联合分布由高斯Copula建立的非线性分位数回归模型.实证表明:高斯Copula非线性分位数回归模型能够更全面准确的描述房地产业与银行业股票收益率之间的风险相关关系,对于预测收益率和防范金融风险具有十分重要的意义. 相似文献
20.
分位数回归是均值回归的有益补充,该方法毋须对分布函数的具体形式做出假设,且对具有异常值或厚尾分布的数据仍具有稳健性.当前,对部分线性单指数面板模型估计方法的研究主要集中于均值回归,基于此,本文考虑了固定效应部分线性单指数面板分位数回归模型,结合B-样条函数、SCAD惩罚函数和迭代加权最小二乘法,构建了模型的估计方法,证明了估计方法的一致性和渐近正态性,同时利用Monte Carlo模拟评价了所述方法在有限样本下的表现.最后,将估计方法应用于分析碳排放的影响因素. 相似文献