首页 | 本学科首页   官方微博 | 高级检索  
     

汉语自动分词和词性标注一体化系统
作者姓名:沈达阳 孙茂松
作者单位:[1]汕头大学计算机科研所 [2]清华大学计算机系
摘    要:
作为高层次信息处理技术的一个重要方向,自然语言理解一直是人工智能界所关注的核心课题之一。“汉语分词”就成为中文信息处理的一个研究课题。国内外从事汉语自动分词系统研究已有十几年,迄今尚无真正成熟的实用系统面世。自动分词研究中的两个主要的困难:1未登录词的辨识,2歧义切分字段的处理。所谓未登录词就是分词系统的词典中没有收录的词。汉语词汇是一个开放的集合,无论建立多么庞大的词典,都不可能穷举所有的词。所谓歧义切分字段。就是指汉语句子中的某些字段,如果纯粹根据词表作机械的字符串匹配,则它可能存在多种切分的形式。关…

关 键 词:汉语自动分词 词性标注 汉字处理 信息处理
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号