现代汉语复句中短语字段的自动识别初探 |
| |
作者姓名: | 李琼 胡金柱 俞小娟 |
| |
作者单位: | 1. 华中师范大学,语言研究所,湖北,武汉,430079 2. 华中师范大学,计算机科学系,湖北,武汉,430079 |
| |
摘 要: | 为了建立一个面向中文信息处理的现代汉语复句深加工语料库,我们必须进行书逗短语字段的自动识别工作,目的是把这些字段排除在分句层次分析的范围之外。这项工作建立在自动分词和词性标注的基础上,主要分三个阶段进行,每个阶段都需要运用规则和统计相结合的方法。第一、二阶段的规则只包含句法因素,第三阶段的规则还需要运用一定的语义特征、搭配知识。
|
关 键 词: | 短语字段 形式标志 语义 规则 统计 |
文章编号: | 1001-5744(2008)01-0006-05 |
修稿时间: | 2007-08-28 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|