首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 40 毫秒
1.
基于WEKA平台的文本聚类研究与实现   总被引:1,自引:0,他引:1  
文本聚类是文本挖掘领域的一个重要研究分支.是聚类方法在文本处理领域的应用.本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结.另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标.在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案.  相似文献   

2.
电子商务中实现个性化推荐意味着一个用户访问Web站点时能够得到个性化的服务,网站根据用户的聚类特征,向用户在线推荐一些用户可能比较感兴趣的页面。本文给出了电子商务个性化推荐的系统结构,分析了在Web日志挖掘中应用协同过滤技术,讨论了Web页面的个性化推荐过程和推荐算法。推荐算法综合考虑了用户聚类中页面的权值和用户对页面的平均评价值两个推荐因素,实现在线页面的推荐。  相似文献   

3.
本文基于关键词集的中文文本特征表示方法,将本体和词共现的思想引入到中文文本的特征表示中,能够更加准确地表达中文文本特征,进而提高中文文本聚类的质量.  相似文献   

4.
汪克夷  齐丽云 《管理学报》2007,4(3):273-278,311
基于文本聚类技术在移动通信行业客户服务文本记录分类中的应用研究,构建了文本分类处理的概念模型。采用集合式表示方法对客户知识进行定义,通过向量空间模型进行文本转化和数据矩阵的构建,提出了TF-MI函数进行特征词的权重计算,利用层次聚类进行数据处理,并通过类别判断的4条准则进行了聚类结论分析和讨论,从而进一步强调了文本聚类技术在移动通信行业客户服务系统知识获取工作中的实用价值。  相似文献   

5.
研究了一种客户动态、静态属性数据相结合的客户分类方法。提出了客户时间序列的加权处理方法,并应用客户时间序列的统计特征作为聚类特征向量,采用混合式遗传算法对客户聚类,使每一类客户具有相似的时序特征。在此基础上将聚类结果与客户的静态属性数据相结合,对客户进一步分类。实验结果表明,与传统的基于静态属性数据的客户分类方法相比,本文的方法提高了客户分类的准确性。  相似文献   

6.
本文总结了目前基于XML文档的一些信息检索技术,并通过一种特征码技术,将海量的XML文档中内容重复的文档检索出来。利用可以将XML文档映射到关系数据库中的X-RESTORE技术管理、存储、查找XML文档,并利用它的解析器快速定位特征码。将特征码通过高效的B 树来索引,大大提高系统的处理效率。  相似文献   

7.
要将插入Word2000/XP文档中的图片另外保存起来,相信多数朋友采用的是将该文档另存为Web页的方法,但如果文档中的图片很多,而我们又只需要保存其中一幅的话,这种方法就不太适合了。其实Word2000/XP中提供了一个专门用于图片处理的工具——Microsoft Photo Editor,借助这个工具我们可以轻松地将插入Word文档中的图片单独保存,并可指定图片的格式。  相似文献   

8.
从Web服务器日志文件和客户交易数据中挖掘有意义的用户访问模式和潜在的客户群,有助于企业提供个性化信息服务和开展有针对性的电子商务活动。本文基于Web挖掘的聚类技术,提出了一种电子商务中个性化推荐系统的具体实现方案。  相似文献   

9.
虽然经典聚类算法能够有效地处理维度较低的数据对象,但随着维度的增加,算法的性能和效率就会明显下降.本文在对数据对象间的最大距离和平均距离随维数增加的变化趋势实验基础上,对聚类算法的聚类精度随数据对象维度增加的变化特征进行了实验研究.同时,利用复相关系数的倒数对属性进行加权,提出了利用复相关系数倒数阈值实现降维的方法,并取得了良好的实验结果.  相似文献   

10.
聚类系数无显著性差异下的灰色综合聚类方法研究   总被引:7,自引:2,他引:7  
在灰色聚类评估分析中,当灰色聚类系数无显著性差异时,按照已有的灰色聚类方法无法对聚类对象进行准确的聚类,而在实际研究中经常会遇到聚类系数无显著性差异这类问题。因此本文提出了一种新的灰色综合聚类方法。具体步骤是:首先计算各聚类对象的聚类系数,并对其进行归一化处理;再根据对象中每一灰类的灰色聚类系数在聚类过程中的作用,计算聚类对象的综合聚类系数;最后根据综合聚类系数对聚类对象进行聚类,确定聚类对象应属的灰类。并且证明了当聚类对象的聚类系数差异大于1-2/S时,一般灰色聚类方法与灰色综合聚类方法所得聚类结果完全相同。最后,以江苏省第二产业内部主导产业选择为例进行了实证分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号