首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在聚类问题中,若变量之间存在相关性,传统的应对方法主要是考虑采用马氏距离、主成分聚类等方法,但其可操作性或可解释性较差,因此提出一类基于模型的聚类方法,先对变量间的相关性结构建模(作为辅助信息)再做聚类分析。这种方法的优点主要在于:适用范围更宽泛,不仅能处理(线性)相关问题,而且还可以处理变量间存在的其他复杂结构生成的数据聚类问题;各个变量的重要性也可以通过模型的回归系数来体现;比马氏距离更稳健、更具操作性,比主成分聚类更容易得到解释,算法上也更为简洁有效。  相似文献   

2.
文章以产品族为对象,以改进后GBOM为基础,对比传统MRP,基于预测需求、客户订单、可存等变量的逻辑运算,构建了GMRP模型。通过GMRP生产活动流程分析,推导出GMRP两阶段运算过程,即面向类BOM结构节点的BOM中心算法阶段和选择树的选择子集前序遍历阶段。  相似文献   

3.
公路分货类货物运输量调查与推算方法   总被引:1,自引:1,他引:0  
为解决公路运输量分货类、区域性结构数据缺失的问题,交通运输部于2008年在全国范围内组织开展了公路运输量专项调查.文章针对目标量估计的困难,研究设计了调查方案,并给出了公路分货类货物运输量推算与方差估计方法,为专项调查数据推算解决了实际问题,并为类似于分货类等结构数据推算提供参考.  相似文献   

4.
传统的解决有序样本聚类的Fisher最优分割法对计算机存储能力要求较高,不适合由于样本长度较大时的情况.实践中常用的最优二分割法只能求得局部最优解.文章提出了一种基于遗传算法解决有序样拳聚类问题的新算法.该算法适用于多种聚类距离,适合于大样本,可以解决方向聚类问题.  相似文献   

5.
本文研究的是时间序列的聚类问题。由于现实世界中时间序列多数是非线性的,而现有的时间序列聚类问题大都是基于线性时间序列模型进行聚类的,本文提出了可以用于非线性时间序列的聚类方法。以时间序列的二维核密度估计之间的相似性作为非线性时间序列的距离度量,该距离度量方式是一种非参数的距离度量方法,考虑到了时间序列自相关结构的差异,能够粗糙地识别时间序列形状和动态相关结构的相似性。与理论研究结果相一致,我们的模拟实验结果也验证了这种距离度量的有效性。  相似文献   

6.
文章研究的学习模型是可能近似正确(PAC)模型的一个推广变形.在这一模型下,文章研究了函数类学习的样本复杂度问题.其中包含了该函数类有限和无限两种情形的讨论;证明了这一函数类的任一样本误差最小化(SEM)算法L都是其学习算法;给出了算法L的样本复杂度的一个上界,同时也给出了其估计误差的一个上界,并予以证明.  相似文献   

7.
文章针对主成分综合评价主要环节的一般性问题展开讨论,给出可行的解决方案并进行了理论分析。在总结现有关于主成分聚类分析重要文献的基础上,通过构建客观赋权的加权主成分距离为聚类统计量,有效地解决了现有聚类模型不能处理指标共线性和重要性差异悬殊的问题。对比本文拓展的聚类模型与同类模型的分类效率发现,加权主成分聚类分析蕴含的客观合理性是其优势所在的根本原因。  相似文献   

8.
研究面板数据聚类问题过程中,在相似性度量上,用Logistic回归模型构造相似系数和非对称相似矩阵。在聚类算法上,目前的聚类算法只适用于对称的相似矩阵。在非对称相似矩阵的聚类算法上,采用最佳优先搜索和轮廓系数,改进DBSCAN聚类方法,提出BF—DBSCAN方法。通过实例分析,比较了BF—DBSCAN和DBSCAN方法的聚类结果,以及不同参数设置对BF—DBSCAN聚类结果的影响,验证了该方法的有效性和实用性。  相似文献   

9.
随着企业经营风险不断上升,上市公司的财务预警问题受到多方利益相关者的关注.文章提出了建立财务预警模型的原则:选择的样本公司财务特征要尽量与被预测公司的财务特征相同,所处的经济环境类似;确定的预警指标体系必须最能反映两类样本公司财务本质特征,能区分出两类样本公司间财务上的根本差异;构建预警模型要考虑样本数据分布状况;预警模型要与定性分析结合使用.然后创构了理想距离判别,最近距离判别,极小离差主成分判别,以及模糊判别4种新预警模型.  相似文献   

10.
研究了一种附有引力影响因子的半监督K-means核函数聚类算法,并将该方法应用于多因子选股模型中。研究表明,相比传统的聚类模型,改进的模型具有较强的泛化能力,模型在处理样本线性不可分、样本分布非球状簇等问题上具有明显的优势,能选出较优的股票组合。  相似文献   

11.
现实中海量数据往往持续地产生,如何实现信息和知识的动态挖掘已成为人们关注的理论问题。根据数据集分批分步输入处理的思想,以Copula连接函数为理论基础,给出一种有效海量数据的关联分步测度算法,通过模拟实验验证了该算法的可行性,结果显示所设计的关联算法能显著提高关联效应测量的效率,并能有效地解决超海量数据关联效应的测度问题。  相似文献   

12.
目前研究的模糊C均值聚类算法(FCM)面临的最重要问题是初始值随机选取,导致其容易陷入局部最优,同时影响运算速度.而灰色预测GM(1,1)模型在形成预测公式时对初始值的选取也没有合理有效的方案.针对以上问题,文章提出坐标密度法,确定初始聚类中心,对FCM算法进行改进;接着提出运用改进的FCM求取GM(1,1)中数据的聚类中心,并把聚类中心作为初始值的方法;通过与已知算法进行比较验证了其可行性和有效性.  相似文献   

13.
欧氏距离条件下的聚类分析没有考虑指标间的相关性,基于模型的聚类方法存在多重共线性影响参数稳定性等问题,针对上述问题,文章在欧式距离条件下对变量间具有相关性的数据样本进行聚类分析时,先构建变量间相关性结构的回归相关模型,再通过差分分析对变量间的多重共线进行消除,然后做聚类分析.并以1996-2011年9个省份城市教育投入情况进行聚类分析,结果表明,给出的聚类方法是有效的.  相似文献   

14.
针对不平衡数据的分类问题,文章利用焦点损失函数可以挖掘困难样本的特性,提出了一种新的逻辑回归算法。首先,定义逻辑回归模型新的损失函数;其次,基于牛顿迭代法,设计FL逻辑回归算法;最后,在比较实验中,运用随机森林进行特征选择,以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明,与传统逻辑回归算法相比,改进后的算法提高了少数类样本的分类精度,增强了模型的整体分类性能。  相似文献   

15.
对于一类变量非线性相关的面板数据,现有的基于线性算法的面板数据聚类方法并不能准确地度量样本间的相似性,且聚类结果的可解释性低。综合考虑变量非线性相关问题及聚类结果可解释性问题,提出一种非线性面板数据的聚类方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率聚类,实证表明该方法的有效性及其对聚类结果的可解释性有所提高。  相似文献   

16.
逆高斯回归模型可用于分析正偏态数据,人们通常研究解释变量对其均值参数的影响,但往往忽略了对其散度参数的影响,文章则基于解释变量对均值和散度都有影响的前提,针对联合均值和散度逆高斯回归模型,探讨模型参数的极大似然估计问题。MM算法在优化问题上具有分离参数、降低目标函数的维度、简化求解过程等优点,将MM算法应用于联合均值和散度逆高斯回归模型,能将多元似然函数彻底分解为一系列一元函数之和,从而绕开了参数估计中的矩阵求逆问题。模拟研究表明,当数据量达到100时就能得到很好的估计效果;实证分析表明,理论研究在实际应用中具有可行性。  相似文献   

17.
文章把图论的知识运用到求二人完全信息静态博弈的纳什均衡解过程中,提出了一种新的求纳什均衡解的方法,证明了求纳什均衡解问题等价于求解有向图的汇点问题.这种方法是基于重复剔除劣策略的基础上的一种改进.在此基础上,给出了一般算法.  相似文献   

18.
在面板数据聚类分析方法的研究中,基于面板数据兼具截面维度和时间维度的特征,对欧氏距离函数进行了改进,在聚类过程中考虑指标权重与时间权重,提出了适用于面板数据聚类分析的"加权距离函数"以及相应的Ward.D聚类方法。首先定义了考虑指标绝对值、邻近时点增长率以及波动变异程度的欧氏距离函数;然后,将指标权重与时间权重通过线性模型集结成综合加权距离,最终实现面板数据的加权聚类过程。实证分析结果显示,考虑指标权重与时间权重的面板数据加权聚类分析方法具有更好的分辨能力,能提高样本聚类的准确性。  相似文献   

19.
支持向量机是在两分类的基础上发展起来的,如何将两分类成果推广到多分类中是支持向量机的一个重要问题.文章在聚类分类的基础上根据二叉树思想,提出了一种新的聚类算法来进行多分类.此方法充分利用二叉树中分两类的简便之处,将多类的聚类简化为点的聚类,从而避免了以往聚类方法中可能出现的同一类的点在聚类中变成不同类的问题,并结合选址问题中固定数目的配送点的选址算法,将原问题进行简化,对多分类问题提出了新的聚类算法.  相似文献   

20.
投资者订单决策过程是研究不完全市场信息释放的逻辑起点。订单的信息分布对市场结构设计有重要的作用。构建非对称环境中投资者订单选择策略模型,并利用高频误差修正模型对理论研究结论进行检验。研究发现中国证券市场订单具有递减信息分布。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号