首页 | 本学科首页   官方微博 | 高级检索  
     

现代汉语复句中短语字段的自动识别初探
作者姓名:李琼  胡金柱  俞小娟
作者单位:1. 华中师范大学,语言研究所,湖北,武汉,430079
2. 华中师范大学,计算机科学系,湖北,武汉,430079
摘    要:为了建立一个面向中文信息处理的现代汉语复句深加工语料库,我们必须进行书逗短语字段的自动识别工作,目的是把这些字段排除在分句层次分析的范围之外。这项工作建立在自动分词和词性标注的基础上,主要分三个阶段进行,每个阶段都需要运用规则和统计相结合的方法。第一、二阶段的规则只包含句法因素,第三阶段的规则还需要运用一定的语义特征、搭配知识。

关 键 词:短语字段  形式标志  语义  规则  统计
文章编号:1001-5744(2008)01-0006-05
修稿时间:2007-08-28
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号