首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于特征聚合理论和LSI的文本分类新方法
引用本文:王金凤.一种基于特征聚合理论和LSI的文本分类新方法[J].北京理工大学学报(社会科学版),2004,6(5):92-94.
作者姓名:王金凤
作者单位:天津大学,天津,300072
摘    要:根据特征聚合理论和隐含语义索引理论(LSI)提出了一种文本分类新方法,该方法应用特征聚合理论和LSI理论来构造向量空间模型,大大削减了特征向量的维数,同时增强了稀有词的作用,并在特征向量中引入了语义成分,从而提高了分类的速度和精度。

关 键 词:特征聚合  LSI理论  文本分类  向量空间模型
文章编号:1009-3370(2004)05-0092-03
收稿时间:2004/6/16 0:00:00
修稿时间:2004年6月16日

A New Method of Text Categorization Based on Feature Aggregation and LSI
Wang Jin-feng.A New Method of Text Categorization Based on Feature Aggregation and LSI[J].Journal of Beijing Institute of Technology(Social Sciences Edition),2004,6(5):92-94.
Authors:Wang Jin-feng
Institution:1.Tianjin university, Tianjin 300072
Abstract:The paper put forward a new method of text categorization based on FA and LSI. The new method establishes vector space model of term weight by the theory of FA and LSI, which decreases the dimension of vector, and enhances the function of the words from the viewpoint of categorization effect, and then the semantic factor is enhanced. Therefore the new method advances largely the speed and the precision of text categorization
Keywords:Feature aggregation  LSI  Text categorization  VSM  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《北京理工大学学报(社会科学版)》浏览原始摘要信息
点击此处可从《北京理工大学学报(社会科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号