首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 234 毫秒
1.
鉴于目前传统文本聚类方法中利用文档间的相似度进行聚类存在的问题,在传统的文本挖掘基础上提出了一种新的文本聚类算法——利用单词超团的二分图文本聚类算法。该算法用文档中单词的关联模式来评估文档间的相似度及主题类别预测,并利用图划分策略来大大降低文档相似度比较算法的复杂度,同时将超团作为特征结构的扩展,可以在一定范围内减少语言信息的丢失,提高聚类效果。经实验证明该算法具有较高的有效性。  相似文献   

2.
一个文档往往包含多个主题的事件,把分散在多个文本中的同一主题事件组织起来依靠传统的文本聚类是无法实现的.本文通过对已有的CURE算法进行分析,根据事件的特征,对代表点的选取和小类合并机制进行改进,实现了一个改进的CURE算法.实验结果表明:改进后的方法在保证执行效率的情况下取得了更好的聚类效果.  相似文献   

3.
文章针对单机聚类算法的可扩展性和效率低下的不足,提出一种并行聚类算法--K-mean并行聚类算法.在基于MPI的并行环境上,通过试验验证,该算法显示出较高的效率.  相似文献   

4.
介绍了一种新的模糊聚类方法,定义了模糊熵,提出了基于最大模糊熵的模糊聚类的方法,得到了一种新的聚类算法——GCM算法。该算法的物理意义清晰,有明确的数学含义,相对于传统的FCM聚类算法,其聚类效果更好。  相似文献   

5.
基于粗糙集理论的知识约简方法和T-S模糊神经网络的非线性映射理论,针对回转窑烧结过程被控对象复杂、各参数之间相互耦合及难以建立精确数学模型的特点,提出一种RS-FNN智能控制策略。采用基于一种新的聚类有效性准则函数的模糊C均值聚类算法对连续属性进行离散化;然后利用粗糙集理论由历史数据样本提取约简规则集,对应的T-S模型具有反映数据特征的良好拓扑结构;最后T-S模型参数由梯度下降混合最小二乘法进行精调。该方法应用于铁矿氧化球团回转窑生产过程控制取得了良好效果,增强了系统容错及抗干扰的能力。  相似文献   

6.
针对有监督特征选择方法因为需要类信息而无法应用于文本聚类的问题,提出了一种新的无监督特征选择方法:结合文档频和K-Means的特征选择方法。该方法首先使用文档频进行无监督特征初选,然后再通过在不同K-Means聚类结果上使用有监督特征选择方法来实现无监督特征选择。实验表明该方法不仅能够成功地选择出最为重要的—小部分特征,而且还能提高聚类质量。  相似文献   

7.
针对多数聚类集成方法忽视潜在信息或获取潜在信息方法复杂这一缺点,提出一种基于链接的模糊聚类集成方法。该算法首先利用模糊聚类算法建立集成信息矩阵,然后使用相应的链接方法将集成信息矩阵转化为反映数据相关性的权重图,最后运用图划分技术得到最终结果。实验结果表明,新提出的算法可以有效地获取潜在信息,同时提高聚类质量。  相似文献   

8.
提出了一种通过调整减法聚类半径优选模糊规则的软测量建模方法。首先用减法聚类建立T-S模糊模型,然后通过调整聚类半径优选模糊规则数,以取得具有良好泛化性能的模型,之后利用梯度下降混合最小二乘算法精调参数。最后用该方法对初馏塔石脑油干点进行软测量建模,结果表明能较快确定优化模型,并能满足软测量建模精度要求。  相似文献   

9.
离群点发现是数据挖掘研究的一个重要方面.根据数据流的特点提出一种基于K-均值聚类和泰森多边形的离群点检测方法,先用K-均值对数据进行处理,生成中间聚类结果,然后用泰森多边形方法(VOD)对这些中间结果进行再次选择,最后找出可能存在的离群点.  相似文献   

10.
以无向非加权图为研究对象,提出了一种基于社团结构核心区域集的图聚类方法,一个社团结构核心区域集是满足五个限定条件的一组完全子图的集合。同时对聚类过程进行分析,给出具体算法描述。实验结果表明该方法能显著提高聚类的精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号