首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于概率潜在语义分析和Adaboost算法的文本分类技术研究
引用本文:刘苗,谢邦昌.基于概率潜在语义分析和Adaboost算法的文本分类技术研究[J].统计与决策,2010(19).
作者姓名:刘苗  谢邦昌
作者单位:1. 中国人民大学,统计学院,北京,100872
2. 辅仁大学,应用统计研究所,台北,24205
摘    要:文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐舍在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器.实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类.

关 键 词:文本自动分类  概率潜在语义分析(PLSA)  TEM迭代
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号