基于MMSeg分词的多部主题词表联合标注研究与实现 |
| |
作者姓名: | 陈晓燕 |
| |
作者单位: | 绍兴职业技术学院 |
| |
摘 要: | 为了解决多部主题词表联合标注中标注词条数量大、子串较多等问题,本文提出了基于MMSeg分词的标注方法.采用MMSeg分词算法将待标注文本先切分形成词串再进行标注,并改进了分词词典从而支持子串的标注,保证了较高的召回率.还就相关内容进行了研究并给出了具体实现.运行结果表明基于MMSeg分词的多部主题词表联合标注在标注速度、召回率和精确率方面均达到了实用要求.
|
关 键 词: | 分词词典 MMSeg算法 标注 消歧 主题词表 |
本文献已被 CNKI 等数据库收录! |
|