首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在采用聚类方法产生训练集的基础上,运用粗集理论离散化预处理该训练集,可以更好的提高分类精度.文章运用PAM算法聚类原始样本构成训练集,再利用布尔逻辑和粗集理论结合的离散化算法离散化该训练集,并以此离散化的训练集训练分类器.实验结果证明,基于该方法在相同的数据集上分类,比仅基于PAM算法预处理的RDDTE方法产生的分类精度最高提高了15.5%,且选用更少量的训练集.  相似文献   

2.
通过分析实际问题中经济变量间往往出现多重共线性的现象,将粗集理论的约简思想引入线性回归分析,提出了基于粗集理论的线性回归模型来解决多重共线性问题,并通过实证分析来验证模型的可行性,为人们进行科学的预测和决策提供了一种新的思想和方法。  相似文献   

3.
基于聚类关联规则的缺失数据处理研究   总被引:2,自引:1,他引:2       下载免费PDF全文
 本文提出了基于聚类和关联规则的缺失数据处理新方法,通过聚类方法将含有缺失数据的数据集相近的记录归到一类,然后利用改进后的关联规则方法对各子数据集挖掘变量间的关联性,并利用这种关联性来填补缺失数据。通过实例分析,发现该方法对缺失数据处理,尤其是海量数据集具有较好的效果。  相似文献   

4.
对由多个指标组成的多元数据进行聚类分析时,数据维度的增加、各指标与总体聚类的相关性程度不一致以及各指标服从的分布不同会增加聚类的复杂性,影响聚类结果的准确性,因此需要通过合适的方法来对多元数据进行聚类分析。针对这一问题,提出改进的带粘性的层次Dirichlet过程(sticky Hierarchical Dirichlet Process)方法来实现对多元数据的降维聚类,以解决各指标服从不同分布的问题,并用粘性参数反映各指标与总体聚类之间的相关性。用MCMC方法来估计模型参数。通过对仿真模拟数据和IRIS数据集的聚类分析,证实了该方法的有效性,同时发现单个指标与总体聚类的相关性越大,则相应的粘性参数越大,从而反映该指标在总体聚类中的重要性程度越高;并且当各指标数据中有粘性较大的指标时,带粘性的层次Dirichlet过程方法明显优于其他聚类方法,能够显著提高分类的准确性。  相似文献   

5.
将DEA方法引入粗集理论中,提出一种可解决“具有多个决策属性特征”的多投入、多产出问题的方法,建立一种基于DEA的粗集决策模型,并通过研究中国生产力水平的效率问题来验证模型的合理性和有效性,为人们进行科学的决策提供了一种新的思想和方法。  相似文献   

6.
时间序列聚类是数据挖掘领域的热点问题之一。结合时间序列的特点,光滑子空间K均值聚类算法在进行稀疏型聚类的同时,可以筛选出连续的时间子区间,并基于这些子区间上的观测对时间序列聚类,其复杂度主要取决于更新聚类权重的方法。然而,现有算法中聚类权重的更新是通过凸二次规划问题求解完成的,其计算复杂度较高。文章的理论推导表明,可以通过复杂度较低的严格凸二次规划问题的求解来更新聚类权重。在此基础上,给出了计算复杂度更低的路径跟随方法来更新聚类权重。数据模拟表明了基于路径跟随方法的新算法在聚类中的有效性,及其在计算速度上的优越性。  相似文献   

7.
基于粗集-层次分析法的薪酬要素权重的确定   总被引:1,自引:0,他引:1  
文章对粗集理论进行了简单介绍,利用粗糙集理论和层次分析法各自优点,提出了基于基于粗集-层次分析法的薪酬要素权重确定的方法.该方法克服了传统薪酬要素权重确定方法的主观性,使得薪酬要素权重确定兼顾客观性和主观性.最后并通过实例进行了验证.  相似文献   

8.
距离判别理论中,通常采用重心距离来定义类与类之间的距离对待判样品进行判别。对新样品实行判别,将其归入系统聚类形成的分类,如果仍采用重心距离判别法,会由于没有与原有聚类时所用的类与类之间的距离相一致而产生误判。提出对基于系统聚类分类结果的距离判别理论方法的补充,把系统聚类中的八种类与类之间距离的概念引入到距离判别方法中。从而使距离判别中类与类距离的定义与系统聚类中相一致,通过实例分析,证明增强了距离判别的可靠性。  相似文献   

9.
基于数据分布密度划分的聚类算法是数据挖掘聚类算法中的主要方法之一。针对传统密度划分聚类算法存在运算复杂、运行效率不高等缺陷,设计出高维分步投影的多重分区聚类算法;以高维分布投影密度为依据,对数据集进行多重分区产生数据集的子簇空间,并进行子簇合并形成了理想的聚类结果;依据算法进行实验,结果证明该算法具有运算简单和运行效率高等优良性。  相似文献   

10.
基于统计模型的模糊聚类算法的时间复杂度在数据集规模超过一定数量级时是计算不可行的,解决时间复杂度的一个行之有效的方法是抽样.文章通过对静态抽样进行改进,设计了一种半静态抽样法,使样本数据集最大程度得保持原数据集的信息,并保证聚类结果的不失真性;最后通过实证分析,比较并证明了该方法是有效的.  相似文献   

11.
在社会经济系统建模和分析中,对目标系统进行分解时,适合采用模糊C均值聚类算法进行划分.由于聚类数未知,采用某个聚类有效性函数来确定时,往往聚类结果并不理想.将专家知识和科学聚类相结合,文章给出了一种针对现实社会经济系统的确定聚类数的方法,即由专家给出可供选择的聚类数集合,然后通过多个聚类有效性函数来对各个聚类数进行评价.以广东省作为目标系统,按照科技进步水平,对其21个地区进行了划分,结果表明了方法的可行性.  相似文献   

12.
针对灰色聚类指标权重确定的问题,通过定义白化权函数的分类区分度来度量各指标对聚类对象的分类所作的贡献,并据此确定分类指标的权重。在此基础上,提出了变权灰色聚类方法。结果表明,该方法能够融合聚类对象的样本信息和专家的经验,有效确定不同聚类对象的各指标权重,且适用于聚类指标的量纲不同、数量级悬殊较大的情形。最后通过一个实例说明了变权灰色聚类的实用性和有效性。  相似文献   

13.
聚类在数据挖掘、模式识别等许多领域有着重要的应用.本文介绍了聚类算法的几种分类,并例举了几种基于密度的聚类算法.最后以一种新颖的基于最大不相含核心点集的聚类算法LSNCCP为例,详细介绍整个聚类算法的工作过程.  相似文献   

14.
灰色综合聚类评估模型的研究   总被引:10,自引:1,他引:9  
一、问题的提出 灰色系统理论自1982年邓聚龙教授创立以来得到了迅速发展,灰色聚类评估分析一直是灰色系统理论讨论较多的灰色技术之一.邓聚龙教授创立的变权聚类方法,刘思峰教授提出了定权灰色聚类评估分析,肖新平提出了灰色最优聚类,许秀莉讨论了灰色聚类分析的改进措施,刘思峰还提出了基于三角白化权函数的灰色聚类评估,以上讨论从不同的方面对灰色聚类评估分析进行了研究,以上各种灰色聚类评估分析的方法,最后的集结方法都是对灰色聚类系数向量的分量的大小进行比较来判定聚类对象属于某一灰类,而在实际中,往往会遇到灰色聚类系数无显著性差异,当聚类系数无显著性差异时,以上学者的研究方法就无法判定聚类对象应属于何灰类.  相似文献   

15.
基于粗集理论的供应链协同效果评价   总被引:1,自引:0,他引:1  
运用粗集理论来约减初始评价指标体系,并计算各指标的权重,完成对供应链协同效果的综合评价。实例证明,应用粗集理论对供应链协同效果进行评价,不但能用更少的指标达到评价的目的,还可以排除主观因素对指标权重确定的影响,从而使评价结果更客观。  相似文献   

16.
数据分布密度划分的聚类算法是数据挖掘聚类算法的主要方法之一。针对传统密度划分聚类算法存在运算复杂、运行效率不高等缺陷,设计高维分步投影的多重分区聚类算法;以高维分布投影密度为依据,对数据集进行多重分区,产生数据集的子簇空间,并进行子簇合并,形成理想的聚类结果;依据该算法进行实验,结果证明该算法具有运算简单和运行效率高等优良性。  相似文献   

17.
聚类有效性指标是评价一种聚类方法划分质量和确定最佳聚类数目的重要工具.文章提出了一种新的聚类有效性指标——T指标,该有效性指标利用最小生成树思想计算类内内聚度,在计算的过程中不再与聚类中心发生直接联系.经反复实验证明新的有效性指标对各种形状分布的划分均有良好的评价表现,且能正确确定各种重叠度数据集的聚类数目.  相似文献   

18.
农业险定价中的核心问题是农业风险区划问题,为了体现农业区划中个体指标的动态发展特征,根据近邻传播改进自适应近邻传播聚类方法对数据进行优化,基于轮廓系数、归属度和吸引度得到最佳聚类中心和几何聚类中心,并将聚类转化为新数据集的聚类问题;选取代表性的棉花为例进行实证分析,通过计算生产、销售、收入、财政等指标进行棉花风险区划实例分析,计算最优棉花风险区划,结果表明对于具有动态特征的数据,本模型具有很好的有效性、实用性和解释性。  相似文献   

19.
文章提出了一种基于聚类组合和支持向量机的短期负荷预测方法.该方法首先使用SOM网络训练规格化的特征数据并获得初始聚类中心;然后将初始聚类中心作为C-均值算法的输入,使用DB指数评价聚类结果以获得最佳聚类数,通过训练可得到相似日样本;最后选择合适的参数和核函数构造支持向量机模型来进行逐点负荷预测.  相似文献   

20.
Dirichlet过程作为一种典型的变参数贝叶斯模型,基于该过程进行的聚类分析无需预先确定聚类数,聚类数作为模型中的参数由模型和数据自主计算得出,因而成为机器学习研究领域中的一个研究热点,可用于海量数据的聚类分析。文章建立Dirichlet过程无限混合模型对DNA基因表达数据展开了聚类分析。模拟测试数据集和急性白血病的DNA基因表达测试数据集的实验结果表明,Dirichlet过程无限混合模型能够准确地估计出数据中的聚类数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号