基于隐马尔科夫模型的文本分类 |
| |
引用本文: | 刘晓飞,邸书灵.基于隐马尔科夫模型的文本分类[J].石家庄铁道学院学报(社会科学版),2013(1):101-105,110. |
| |
作者姓名: | 刘晓飞 邸书灵 |
| |
作者单位: | 石家庄铁道大学 信息科学与技术学院;石家庄铁道大学 信息科学与技术学院 |
| |
摘 要: | 文本分类经过多年的发展,已经产生了很多成熟高效的算法。将隐马尔科夫模型用于文本分类,对每个文本类构建一个隐马尔科夫模型,χ2检验获得类别特征词集,其状态转移表示按照一指定顺序对类别特征词集进行遍历,状态输出符号为特征词的词频,隐马尔科夫模型的状态转移过程隐含的表示了属于该类的文本的形成过程。具有最大概率的HMM分类器就是所属的类别。该算法不仅将特征词考虑进去,而且还将词频信息融入隐马尔科夫模型中,实验结果表明该方法分类效率较高。
|
关 键 词: | 文本分类 隐马尔科夫模型 信息增益 χ2检验 泊松分布 |
收稿时间: | 2012/10/10 0:00:00 |
Text Categorization Based on Hidden Markov Model |
| |
Authors: | Liu Xiaofei and Di Shuling |
| |
Institution: | School of Information Science and Technology,Shijiazhuang Tiedao University;School of Information Science and Technology,Shijiazhuang Tiedao University |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《石家庄铁道学院学报(社会科学版)》浏览原始摘要信息 |
| 点击此处可从《石家庄铁道学院学报(社会科学版)》下载免费的PDF全文 |