首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于极限学习机的中文文本分类方法
引用本文:程东生,范广璐,俞雯静,伍飞,曾伟波.基于极限学习机的中文文本分类方法[J].重庆理工大学学报(社会科学版),2018(8).
作者姓名:程东生  范广璐  俞雯静  伍飞  曾伟波
作者单位:国家电网公司国网安徽省电力有限公司;国网信息通信产业集团有限公司福建亿榕信息技术有限公司
摘    要:针对当前中文文本分类方法难以平衡分类精度和学习效率的问题,提出了一种基于极限学习机(ELM)的中文文本分类方法,该方法包括预处理模块、文本特征提取模块、特征融合模块和基于极限学习机的分类模块。在分类模块中,提出采用单隐层神经网络作为分类器并使用ELM算法来训练分类器,有效地平衡模型性能和学习效率。同时分别针对不同的特征训练分类器,集成不同分类器的输出得到最后的分类结果,有效提高了平衡分类精度,并在电网档案管理系统的档案归类任务中对该模型进行应用评估。实验结果表明,该模型不仅有较高的分类精度,而且在训练和测试两个阶段模型的计算都具有较低的代价。所提方法适用于海量数据下的中文文本分类场景,具有重要的研究意义和推广价值。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号