共查询到20条相似文献,搜索用时 472 毫秒
1.
2.
支持向量回归(SVR)是机器学习中重要的数据挖掘方法,当前关于SVR的研究大多基于二次规划理论,同时,利用交叉验证或一些智能算法选取模型中的超参数,然而,基于二次规划理论的SVR估计方法不仅计算量较大,而且不能进行后续的统计推断分析。文章基于贝叶斯方法研究SVR,通过引入两个潜在变量将SVR的?不敏感损失函数表示为双重正态-尺度混合模型并构建似然函数,通过选取适当的先验分布获得兴趣参数和超参数的Gibbs抽样算法。为筛选重要变量和最优模型,引入0-1指示变量并选取回归参数的Spike and Slab先验来获得贝叶斯变量选择算法。数值模拟证明了所提算法的有效性,并在非正态误差下表现出很好的稳健性。最后将所提方法应用于房价数据分析,得到了有意义的结果。 相似文献
3.
为提高GM(1,1)模型的预测精度,针对GM(1,1)模型的特点,提出了将遗传算法与LS-SVM算法融合对GM(1,1)模型中的参数估计方法进行改进.该方法首先根据GM(1,1)灰色差分方程的特点,构造以背景值序列和原始序列为训练样本的灰色LS-SVM模型,将GM(1,1)模型参数的估计问题转化为灰色LS-SVM模型参数的估计问题,然后利用遗传算法对LS-SVM自身的参数进行寻优预处理,再对经过优化参数的灰色LS-SVM,依据LS-SVM算法求解回归参数,进而得到GM(1,1)模型的参数估计.将改进的GM(1,1)模型用于实际的经济预测问题,并与传统的预测方法进行比较,结果表明,方法是可行的且有效的. 相似文献
4.
5.
本文基于杭州市场2009年10月-2011年3月新开楼盘价格数据,并选取了建筑特征、邻里特征、区位特征下的21个属性特征变量,首先建立了半对数Hedonic房价模型,再运用楼盘离市中心距离这一非线性特征变量构建半参数Hedonic房价模型,最后基于5个信息量进行模型评价。分析结果表明,半参数Hedonic模型较半对数线性Hedonic模型更优,上城区、西湖区和下沙区对杭州新开楼盘房价的影响最为明显,物业费、户型面积影响也极为显著,而且这些属性特征均是正向影响楼盘房价。 相似文献
6.
基于主成分分析的汽车特征价格模型初探 总被引:1,自引:0,他引:1
特征价格模型建立过程中,特征变量的选取是一个重要问题。实证研究中,为消除特征变量问的多重共线性,研究者通常采用逐步回归分析法来筛选变量,这样进入模型的特征变量往往比较少。因此。本文将主成分分析法引入于特征价格模型。利用我国汽车数据,建立了基于汽车特征因素主成分分析的特征价格模型,不仅解决了汽车特征变量间存在的多重共线性问题,而且有效改善了用逐步回归分析法筛选变量选取较少变量的情形。 相似文献
7.
8.
文章提出了一种将偏最小二乘法(PLS)、遗传算法(GA)和支持向量回归(SVR)相结合的预测算法。首先,为了解决多元回归中存在的多重共线性问题,采用偏最小二乘法选取回归变量的主成分;然后,利用支持向量回归预测模型对数据进行训练,利用遗传算法获得更好的预测模型参数,以解决传统支持向量机预测模型中的参数选取困难的问题;最后,利用优化的预测模型对区域经济发展进行预测。结果表明,该算法在预测精度上优于其他预测模型,能够准确预测未来区域经济发展趋势。 相似文献
9.
近年来,我国消费金融发展迅速,但同时也面临着更加复杂的欺诈和信用风险,为了更好地对消费金融中借贷客户的信用风险进行监测,本文提出了基于稀疏结构连续比率模型的风控方法。相对于传统的二分类模型,该模型的特点是可以处理借贷客户被分为三类或三类以上的有序数据,估计系数的同时能从众多纷繁复杂的数据中自动筛选重要变量,并在变量筛选过程中考虑不同子模型系数的结构特征。通过蒙特卡洛模拟发现,本文所提出的稀疏结构连续比率模型在分类泛化误差和变量筛选上的表现都较好。最后将本文提出的模型应用到实际的消费金融信用风险分析中,针对传统征信信息不足的借款人,通过引入高频电商消费行为数据,利用本文提出的高维有序多分类模型能有效识别借款人的信用风险,可以弥补传统征信方法的不足。 相似文献
10.
11.
逆高斯回归模型可用于分析正偏态数据,人们通常研究解释变量对其均值参数的影响,但往往忽略了对其散度参数的影响,文章则基于解释变量对均值和散度都有影响的前提,针对联合均值和散度逆高斯回归模型,探讨模型参数的极大似然估计问题。MM算法在优化问题上具有分离参数、降低目标函数的维度、简化求解过程等优点,将MM算法应用于联合均值和散度逆高斯回归模型,能将多元似然函数彻底分解为一系列一元函数之和,从而绕开了参数估计中的矩阵求逆问题。模拟研究表明,当数据量达到100时就能得到很好的估计效果;实证分析表明,理论研究在实际应用中具有可行性。 相似文献
12.
13.
14.
基于信用卡邮寄业务响应率分析来讨论Logistic模型和分类树模型在变量选取上的区别,并尝试从几个不同角度去解释两类模型变量筛选差异的原因。笔者认为没有绝对占优势的方法,需要结合具体场景和模型的特点来选择合适的模型。分类树模型在训练集上容易过度拟合,对单个变量的影响很敏感,在进行危险因素分析时结果更能强调危险因素,对孤立点的识别率很高。Logistic模型容易受到解释变量依存关系的影响,加上分类变量的影响容易过多地选入变量或者因子,对孤立点敏感,对噪点不敏感。判别函数的差异是变量筛选差异的关键因素。 相似文献
15.
16.
区域调度是目前城市公交调度发展的新趋势。文章在适应外部环境且自身调度工作合理的基础上,以最大程度的协调区域内各线路上的公交车辆、达到区域协同工作为目的,以尽可能的减少公交乘客在主要换乘站点的等待时间之和为优化目标,建立区域协同调度模型,并针对此离散变量优化问题,提出了求解该问题的改进的遗传算法,并通过算例进行验证。 相似文献
17.
18.
19.
对含滞后变量问题的建模,有效地消除变量间的高度相关是保证模型优良性的一个重要手段.文章利用主成分析把原始变量正交变换并作为新的自变量,消除多重共线性.然后利用逐步回归筛选出对因变量有影响的变量进行回归拟合.最后针对国内生产总值对我国固定资产投资带动作用进行实证分析. 相似文献
20.
本文运用多变量动态模型系统下的Beveridge-Nelson分解方法和贝叶斯Gibbs抽样估计,估算了1985年1季度至2008年2季度期间中国的产出缺口,并且与传统的单变量估计方法测算的结果在统计属性和对货币政策调节的预测效果方面进行了比较。实证结果表明,不同产出缺口的统计属性存在差别,并且只有基于多变量系统测算的产出缺口对货币政策具有显著预测效果。这说明多变量模型估计出的产出缺口更全面地考虑了经济产出与其他相关变量的互动效应,含有的信息更为丰富,从而对宏观政策调整具有更重要的参考价值。 相似文献