文章综合考虑企业的财务和非财务因素,利用LASSO方法对企业财务困境预测指标进行筛选,然后使用决策树、随机森林、SVM、最近邻法这四种数据挖掘方法,以及常见的logistic模型,分别建立企业财务困境预测模型.结果表明:不能忽视非财务因素在企业财务困境预测中的作用;并非所有数据挖掘方法都优于常用的logistic模型;LASSO方法能在降维的同时保证企业财务困境预测的准确性,实现模型的精简.  相似文献   

文章基于递归残差的逆序特征和隔离检测研究了回归模型多参数变点的检测方法。首先,构建带有变点的回归模型,考虑到多元正向CUSUM检验能防止协变量均值与偏移量正交时损失功效,但其变点检测效果并不理想的情况,引入修正的检验统计量BCUSUM。其次,结合快速高效的隔离检测技术,提出MCPDP算法用于估计变点数目及位置。最后,模拟结果表明,所提出的方法能较好地控制检验水平,有更高的功效;评价结果显示,MCPDP算法在变点估计性能方面表现较优;实例分析表明,交通流变点符合实际交通情况,验证了该方法的有效性,且所构建的模型可以作为交通参数确定性经验关系的一种修正。  相似文献   

文章主要研究了均值变点估计问题,给出了变点的累积和型估计,证明了变点估计的相合性。利用EViews软件,分别对总体上证指数数据和变点之后的数据建立状态空间模型,通过比较预测结果的绝对百分比误差(APE),得出基于变结构的分段数据所建立的模型预测效果较好的结论。  相似文献   

在广义线性模型假设下,采用Lin的医疗费用模型,运用LASSO和SCAD方法对影响医疗费用的因素进行选择,并对两种方法的有效性进行了对比分析,从而得出影响医疗保险赔付的重要因素,解决了高维变量带来的一系列问题。实例分析中,由于两种方法注重的统计性质不同,选择出的解释变量略微不同,但通过分析发现,两种结果都具有良好的解释性,反映了影响医疗保险赔付的重要信息。  相似文献   

文章旨在研究受航空业动态定价机制影响下的机票价格序列变点估计模型,文中分析了机票价格u8序列数据的结构特点,提出了可用于高噪声数据环境下、阶梯状、带明显多变点的多阶段序列变点估计框架,该框架中级联组合了DBSCAN算法、EM-高斯混合模型聚类、凝聚层次聚类算法和基于乘积划分模型的变点估计方法等多种成熟的数据分析方法,通过对“北京-昆明”航线航班的实证分析,验证了数据分析框架的有效性和普遍适用性。  相似文献   

文章讨论了用学生t线性回归模型估计回归系数变点位置的稳健Gibbs抽样算法.利用学生t分布的正态尺度混合表示,得到各参数的满条件后验分布,通过对满条件分布抽取样本,得到变点位置及其他参数的贝叶斯估计.模拟显示该算法能有效地估计变点位置,并且当数据呈现重尾现象时,该模型较正态变点模型要稳健.  相似文献   

文章结合基函数逼近以及光滑门限估计方程,提出了一个变系数模型的快速变量选择方法。该变量选择方法可以同时进行系数估计和变量选择,并且不需要解任何凸优化问题。因此,与已有方法相比,该方法在实际应用中将大大减少计算量。  相似文献   

文章基于变系数模型,研究了模型变量选择的问题.采用B样条函数逼近模型中的系数函数,结合LASSO、SCAD和MCP罚函数,利用组坐标下降算法进行变量选择.通过模拟比较了这三种罚函数的效果.模拟结果印证提出方法的有效性,并且得到MCP和SCAD优于LASSO.  相似文献   

对于泊松序列中的变点问题,文章提出了一个快速有效的用于判断变点是否存在,以及当变点存在时确定未知变点位置的统计方法.进而,通过分析两个煤矿灾难的实际数据,阐释所提方法的准确性和有效性.  相似文献   

Logistic半参数变系数模型是半参数变系数模型的推广,它可以解决分类型因变量变系数模型的建模问题.文章利用B样条函数逼近非参数部分,引入LASSO、SCAD以及MCP惩罚函数,基于组坐标下降算法,对参数部分和非参数部分进行变量选择.最后进行了Monte Carlo模拟.  相似文献   

In this article, we consider parameter estimation in the hazard rate with multiple change points in the presence of long-term survivors. We combine two methods: maximum likelihood based and martingale based, to estimate the change points in the hazard rate for right censored survival data that accounts for long-term survivors. A simulation study is carried out to compare the performance of estimators. The method is applied to analyze two real datasets.  相似文献   

文章基于解释变量与被解释变量之间的互信息提出一种新的变量选择方法:MI-SIS。该方法可以处理解释变量数目p远大于观测样本量n的超高维问题,即p=O(exp(nε))ε>0。另外,该方法是一种不依赖于模型假设的变量选择方法。数值模拟和实证研究表明,MI-SIS方法在小样本情形下能够有效地发现微弱信号。  相似文献   

The work of this paper is based on the innovative approach of Feigin et al. (1983), who estimate parameters of lifetime distributions by equating empirical and theoretical Laplace transforms. We show that the optimal choice of the transform variable depends critically upon the number of sampling times, the way they are spaced, and how the empirical transform is formed. Two new approaches for choosing the transform variable, viz. using cross-validation or constrained optimisation, are introduced and shown to have potential for wide-ranging use.  相似文献   

We consider stochastic volatility models that are defined by an Ornstein–Uhlenbeck (OU)-Gamma time change. These models are most suitable for modeling financial time series and follow the general framework of the popular non-Gaussian OU models of Barndorff-Nielsen and Shephard. One current problem of these otherwise attractive nontrivial models is, in general, the unavailability of a tractable likelihood-based statistical analysis for the returns of financial assets, which requires the ability to sample from a nontrivial joint distribution. We show that an OU process driven by an infinite activity Gamma process, which is an OU-Gamma process, exhibits unique features, which allows one to explicitly describe and exactly sample from relevant joint distributions. This is a consequence of the OU structure and the calculus of Gamma and Dirichlet processes. We develop a particle marginal Metropolis–Hastings algorithm for this type of continuous-time stochastic volatility models and check its performance using simulated data. For illustration we finally fit the model to S&P500 index data.  相似文献   

In this article, a new class of models is proposed for modeling nonlinear and nonstationary time series. This new class of models, referred to as the periodic bilinear models, has a state space representation and can be characterized by a set of recursive equations. Condition for the stationarity is presented. Procedures for parameter estimation using the cumulants of order less than four are described and the accuracy of the proposed method is demonstrated in the Monte Carlo simulations.  相似文献   

This paper derives an expression for the likelihood function of the parameters in an autoregressive-moving average model when some values are missing from the observed time series. The estimation of the missing values and their mean squared errors is discussed. Stationary as well as nonstationary models are considered.  相似文献   

本文研究的是时间序列的聚类问题。由于现实世界中时间序列多数是非线性的,而现有的时间序列聚类问题大都是基于线性时间序列模型进行聚类的,本文提出了可以用于非线性时间序列的聚类方法。以时间序列的二维核密度估计之间的相似性作为非线性时间序列的距离度量,该距离度量方式是一种非参数的距离度量方法,考虑到了时间序列自相关结构的差异,能够粗糙地识别时间序列形状和动态相关结构的相似性。与理论研究结果相一致,我们的模拟实验结果也验证了这种距离度量的有效性。  相似文献   

In a recent paper, Paparoditis [Scand. J. Statist. 27 (2000) 143] proposed a new goodness‐of‐fit test for time series models based on spectral density estimation. The test statistic is based on the distance between a kernel estimator of the ratio of the true and the hypothesized spectral density and the expected value of the estimator under the null and provides a quantification of how well the parametric density fits the sample spectral density. In this paper, we give a detailed asymptotic analysis of the corresponding procedure under fixed alternatives.  相似文献   

针对目前Copula函数在实际中的应用问题,介绍了一种基于马尔科夫链蒙特卡罗方法(MCMC)的Copula函数估计及选取方法,并将该方法与目前常用方法进行系统比较,最后对上证综合指数和深证成分指数进行了实证分析,结果体现了该法的有效性。  相似文献   

现实生活中的时间序列,通常伴随着大量的噪声和高度的波动性。对于这些非线性时间序列,运用传统的统计和计量经济模型进行分析预测,预测结果往往不够理想。文章基于经验模态分解(EMD)和人工神经网络提出改进方法。主体思想是"先分再合":先用EMD方法分解非线性时间序列,得到一系列易于分析的独立的子系列,然后利用神经网络(FNN)对每一个子系列进行分析和预测,最后再用自适应线性神经网络(ALNN)整合并得出最终结果。结合具体房价时间序列实例,证实了这种方法的优势。  相似文献   

