共查询到10条相似文献,搜索用时 40 毫秒
1.
基于WEKA平台的文本聚类研究与实现 总被引:1,自引:0,他引:1
文本聚类是文本挖掘领域的一个重要研究分支.是聚类方法在文本处理领域的应用.本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结.另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标.在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案. 相似文献
2.
电子商务中实现个性化推荐意味着一个用户访问Web站点时能够得到个性化的服务,网站根据用户的聚类特征,向用户在线推荐一些用户可能比较感兴趣的页面。本文给出了电子商务个性化推荐的系统结构,分析了在Web日志挖掘中应用协同过滤技术,讨论了Web页面的个性化推荐过程和推荐算法。推荐算法综合考虑了用户聚类中页面的权值和用户对页面的平均评价值两个推荐因素,实现在线页面的推荐。 相似文献
3.
本文基于关键词集的中文文本特征表示方法,将本体和词共现的思想引入到中文文本的特征表示中,能够更加准确地表达中文文本特征,进而提高中文文本聚类的质量. 相似文献
4.
基于文本聚类技术在移动通信行业客户服务文本记录分类中的应用研究,构建了文本分类处理的概念模型。采用集合式表示方法对客户知识进行定义,通过向量空间模型进行文本转化和数据矩阵的构建,提出了TF-MI函数进行特征词的权重计算,利用层次聚类进行数据处理,并通过类别判断的4条准则进行了聚类结论分析和讨论,从而进一步强调了文本聚类技术在移动通信行业客户服务系统知识获取工作中的实用价值。 相似文献
5.
6.
7.
要将插入Word2000/XP文档中的图片另外保存起来,相信多数朋友采用的是将该文档另存为Web页的方法,但如果文档中的图片很多,而我们又只需要保存其中一幅的话,这种方法就不太适合了。其实Word2000/XP中提供了一个专门用于图片处理的工具——Microsoft Photo Editor,借助这个工具我们可以轻松地将插入Word文档中的图片单独保存,并可指定图片的格式。 相似文献
8.
从Web服务器日志文件和客户交易数据中挖掘有意义的用户访问模式和潜在的客户群,有助于企业提供个性化信息服务和开展有针对性的电子商务活动。本文基于Web挖掘的聚类技术,提出了一种电子商务中个性化推荐系统的具体实现方案。 相似文献
9.
10.
聚类系数无显著性差异下的灰色综合聚类方法研究 总被引:7,自引:2,他引:7
在灰色聚类评估分析中,当灰色聚类系数无显著性差异时,按照已有的灰色聚类方法无法对聚类对象进行准确的聚类,而在实际研究中经常会遇到聚类系数无显著性差异这类问题。因此本文提出了一种新的灰色综合聚类方法。具体步骤是:首先计算各聚类对象的聚类系数,并对其进行归一化处理;再根据对象中每一灰类的灰色聚类系数在聚类过程中的作用,计算聚类对象的综合聚类系数;最后根据综合聚类系数对聚类对象进行聚类,确定聚类对象应属的灰类。并且证明了当聚类对象的聚类系数差异大于1-2/S时,一般灰色聚类方法与灰色综合聚类方法所得聚类结果完全相同。最后,以江苏省第二产业内部主导产业选择为例进行了实证分析。 相似文献