共查询到20条相似文献,搜索用时 140 毫秒
1.
针对混合效应模型中固定效应与随机效应同时选择问题,提出了施加多个惩罚项的回归过程,同时给出了参数估计的交替迭代算法,并证明了算法的收敛性。针对两种特殊的多惩罚回归过程,分别利用计算机模拟数据进行了比较分析,结果显示新方法在各种不同条件下均有良好的表现,尤其是能处理高维稀疏的混合效应模型。最后通过一个实际数据演示了新方法的应用。 相似文献
2.
《统计与信息论坛》2019,(1):13-19
纵向数据是一类重要的相关性数据,广泛出现在诸多科研领域。单指标模型是多元非参数回归中重要的降维方法,在纵向数据下研究单指标模型是统计研究的热点问题。针对纵向数据单指标模型,提出惩罚改进二次推断函数方法来讨论模型的参数和非参数估计问题。该方法利用多项式样条回归方法逼近模型中的未知联系函数,将联系函数的估计转化为回归样条系数的估计,然后构造关于样条回归系数和单指标系数的惩罚改进二次推断函数,最小化惩罚改进二次推断函数便可得到模型的估计。理论结果显示,估计结果具有相合性和渐近正态性,最后得到了较好的数值模拟结果和实例数据分析结果,结果显示该方法适用于半参数纵向模型的参数和非参数估计问题。 相似文献
3.
分位数回归是均值回归的有益补充,该方法毋须对分布函数的具体形式做出假设,且对具有异常值或厚尾分布的数据仍具有稳健性.当前,对部分线性单指数面板模型估计方法的研究主要集中于均值回归,基于此,本文考虑了固定效应部分线性单指数面板分位数回归模型,结合B-样条函数、SCAD惩罚函数和迭代加权最小二乘法,构建了模型的估计方法,证明了估计方法的一致性和渐近正态性,同时利用Monte Carlo模拟评价了所述方法在有限样本下的表现.最后,将估计方法应用于分析碳排放的影响因素. 相似文献
4.
5.
在含潜变量的纵向数据混合效应模型应用中,通常包含大量截尾数据,若直接采用一般贝叶斯Tobit分位回归模型,参数估计的马尔科夫链蒙特卡罗抽样算法将会极其复杂,造成计算效率低下且估计结果偏差较大。同时,在高维情形下,由于受大量未知随机效应的干扰,固定效应中关键变量的选择与系数估计变得更为困难。为了解决上述问题,文章提出了一种新的双Adaptive Lasso惩罚贝叶斯Tobit分位回归方法,主要研究响应变量左删失情形下高维纵向数据的变量选择与参数估计问题。通过将Adaptive Lasso惩罚同时引入固定效应与随机效应的先验分布中,构造了参数估计的Gibbs抽样算法。蒙特卡罗模拟结果表明,新方法较无惩罚法和Lasso惩罚法在重要变量选择及系数估计上均更占优势。 相似文献
6.
在回归问题中,惩罚特征即正则化是特征处理的常用方式。但在集成分类问题中,惩罚特征以改善训练效果的研究较少。文章提出一种基于GBDT模型训练的SHAP值对各样本特征惩罚加权,进而提升分类精度的集成模型;其中,对于测试样本的SHAP值估计,通过其与训练集的样本距离权重结合训练集的SHAP矩阵近似得到。实验结果表明:选择GBDT_SHAP值惩罚特征后,模型的预测精度均有显著提升,验证了该算法的有效性。以GBDT_SHAP_GBDT模型为例,其在多组经典数据集上的分类效果良好,且在不平衡数据集上性能突出;若干组仿真实验表明,该方法能使模型快速达到较优且较为稳定的拟合效果,鲁棒性较强。 相似文献
7.
变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构作筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后本文将adSGL法应用到信用卡信用评分研究,对比logistic回归,它具有更高的分类精度和稳健性。 相似文献
8.
本文建立了索赔次数的多风险类别混合泊松模型。首先,考虑索赔次数的零膨胀、厚尾性和异质性等特征,建立风险类别待定的开放式混合泊松模型,开放式结构使该模型对实际数据的多样特征和风险类别具有良好的自适应性;其次,定义混合权重参数的iSCAD惩罚函数,实现对权重参数的筛选;最后,借助EM算法求得模型参数,实现对各风险类别下索赔次数的估计。借助iSCAD惩罚函数,给出最优混合数,避免传统混合模型中主观选择的弊端,克服传统混合模型中结构复杂、参数估计没有显式表达式、估计结果不便于解释等问题。基于三组风险特征多样数据的实证分析,本文发现该模型可以显著改进现有模型的拟合效果。 相似文献
9.
针对具有多个来源的异质性数据,文献中通常提出复杂程度较高的模型用于描述每个数据子总体的特征,而本文着眼于刻画不同数据子总体的共性进而建立一个简单的模型。在参数估计方面,本文借鉴了普通线性模型的Maximin估计思想,提出了适用于广义线性模型的Maximin似然比估计方法及稀疏结构下的惩罚估计。该方法通过最大化所有子总体中似然比统计量的最小值,构建成一个简单而保守的模型,以减少数据来源较多而呈现的复杂性。所提方法适用于因变量服从正态分布、两点分布、泊松分布等指数族分布的情形,丰富了前人的研究成果,具有更好的实践意义。模拟分析显示,相比于经典的估计方法,Maximin似然比估计方法不仅能够有效地探寻子总体的共性,而且具有较高的样本外预测精度。本文提出的方法也适用于政府统计和经济统计中具有异质性的大型数据集。 相似文献
10.
在颇具争议的收入差距和健康关系研究中,为了降低可能存在的模型设定和遗漏变量偏误,本文提出了随机效应半参数logit模型,其中非参数的设定还可用于数据的初探性分析。随后本文提出了模型非参数和参数部分的估计方法。这里涉及的难点是随机效应的存在导致似然函数中的积分没有解析式,而非参数的存在更加大了估计难度。本文基于惩罚样条非参数估计方法和四阶Laplace近似方法建立了惩罚对数似然函数,其最大化采用了Newton_Raphson近似方法。文章还建立了惩罚样条中重要光滑参数的选取准则。模型在收入差距和健康实例中的估计结果表明数据支持收入差距弱假说,且非参数估计结果表明其具有U型形式,与实例估计结果的比较指出本文提出的估计方法是较准确的。 相似文献
11.
一、引言数据挖掘是指一个完整的过程 ,该过程从大型数据库中挖掘先前未知的 ,有效的 ,可实用的信息 ,并使用这些信息做出决策或丰富知识。数据挖掘环境可示意如下图 1。数据挖掘与传统的数据分析 (如查询、报表、联机应用分析 )的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知 ,有效和可实用三个特征。先前未知的信息是指该信息是预先未曾预料到的 ,既数据挖掘是要发现那些不能靠直觉发现的信息或知识 ,甚至是违背直觉的信息或知识 ,挖掘出的信息越是出乎意料 ,就可能越有价值。在商… 相似文献
12.
政府统计改革千头万绪,只有抓住主要矛盾才能取得事半功倍的效果。近来,以调查队的整合为标志的统计体制改革取得进展,国家统计、地方统计、部门统计三位一体的格局愈见清晰。在此之时,如能将统计标准化建设放在较为重要的位置,抓住这一统计制度的细微之处做好“文章”,则是通往“内创和谐、外树信誉、优质服务”的快捷之路。一、统计标准和统计标准化标准是衡量事物的准则,统计标准则是统计活动过程中用以衡量统计对象的准则。统计标准的内容其实十分广泛,不只是各种统计分类,统计活动过程中所运用的概念、范畴、目录、编码、表式,特别是统… 相似文献
13.
经济普查是一项国情国力的综合调查 ,调查的对象是从事第二、第三产业的全部法人单位、产业活动单位和个体经营户。与人口普查、工业普查等相比 ,经济普查调查的范围更全、涉及的领域更广。国家投入大量资金、人力、物力进行经济普查 ,得到的最终成果是经济普查数据资料。这些统计数据有 1 0 0 0余项指标 ,可谓非常全面和具体。如何开发应用这些原始数据资料 ,让经济普查数据更好、更方便地满足政府制订经济和社会发展规划的需求 ,服务于社会 ,将是摆在我们面前的一个迫切问题。有关“如何开发与利用经济普查数据”方面的讨论很多 ,有人主张… 相似文献
14.
15.
SPSS是“社会科学统计软件包”(Statistical Package forthe Social Science)的简称,是一种集成化的计算机数据处理应用软件,其简单易懂的菜单式操作方法赢得了大量用户。主成分分析是一种采取数学降维的方法,把多个变量化为少数几个综合变量且互不相关的多元统计分析方法,在实际工作中有着广泛的应用。但是,SPSS软件中没有设置独立的主成分分析模块。要进行主成分分析,则需要借助SPSS中因子分析的输出结果中的因子载荷矩阵,再通过一定的计算,来间接获得主成分分析的结果。这样,一方面用时长,不方便;另一方面由于使用者对SPSS中因子… 相似文献
16.
"十一五"国家哲学社会科学研究规划,统计学科专家评审组于2004年9月11~12日在贵阳市召开了"统计学调研暨现代统计学研究"专家座谈会.会议总结了我国统计学科的发展现状,分析了统计学科的发展趋势,基本明确了我国统计学科需要着重研究的领域和方向. 相似文献
17.
由国家化费巨大投入进行的全国第一次经济普查工作再有 1 0 0天就要开始在全国进行。这对于摸清全国现有“家底” ,包括经济的体制结构、行业结构、产品结构、生产能力和地区分布等基本情况 ,为科学地制定“十一五”规划具有十分重要的意义。为了充分利用本次普查所投入的人力、财力和组织资源 ,尤其是分布全国各地的大批经过培训的调查员队伍 ,尽可能广泛和深入地多做一些调查工作 ,对一些事关改革和发展的重大基本情况进行同时调查 ,这在我国面临“关键时期”是完全应该和必要的。所以 ,提出如下一些建议 ,供有关部门参考。一、对事关解决… 相似文献
18.
19.
美国经济学家瓦西里·列昂节夫于 1 93 6年创立投入产出模型。由于这一模型在各国宏观经济管理中发挥了重要的作用 ,因而受到世人的瞩目。 1 968年 ,联合国统计局将投入产出核算纳入SNA中 ,使其与国民收入核算一道 ,成为国民经济核算的重要组成部分。在投入产出学领域内 ,国内外许多学者都试图在列昂节夫的投入产出模型的基础上有所创新 ,使投入产出分析不仅用于中间产品的分析上 ,也不仅用于考察最终产品和总产品之间的数量关系上 ,而是能在更大的经济领域内得到更广泛的运用。刘起运教授所发表的《结构式凯恩斯乘数模型研究》(《统计研… 相似文献
20.
社会福利指数的构造已成为学界研究的热点问题。为了对社会福利指数进行正确的构造,文章首先对森所构造的福利指数的理论渊源及其局限性进行了探究;其次对国内学者所构造的社会福利指数进行了评析,指出其存在着严重的方法论上的缺陷,在此基础上,文章就社会福利指数构造的理论和方法论框架提出了基本的看法。 相似文献