首页 | 本学科首页   官方微博 | 高级检索  
     

基于MMSeg分词的多部主题词表联合标注研究与实现
作者姓名:陈晓燕
作者单位:绍兴职业技术学院
摘    要:为了解决多部主题词表联合标注中标注词条数量大、子串较多等问题,本文提出了基于MMSeg分词的标注方法.采用MMSeg分词算法将待标注文本先切分形成词串再进行标注,并改进了分词词典从而支持子串的标注,保证了较高的召回率.还就相关内容进行了研究并给出了具体实现.运行结果表明基于MMSeg分词的多部主题词表联合标注在标注速度、召回率和精确率方面均达到了实用要求.

关 键 词:分词词典  MMSeg算法  标注  消歧  主题词表
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号