首页 | 本学科首页   官方微博 | 高级检索  
     

结构性文本主题词规则化提取:对经验结果的理性预测
引用本文:李永康. 结构性文本主题词规则化提取:对经验结果的理性预测[J]. 中南大学学报(社会科学版), 2001, 0(4)
作者姓名:李永康
作者单位:郴州师范专科学校外语系 湖南郴州423000
摘    要:基于统计的主题词提取会产生信息冗余或数据稀疏等情况 ;而基于句法规则的主题词提取技术 ,又因为大量不规范语句而无法析出正确的主题词。目前普遍采取的统计与规则互补办法 ,虽然发挥了两种体系的优势 ,但仍未能有效解决 :( 1 )主题词在文本中的分布 ;( 2 )低频或隐性主题词的提取 ;( 3)主题词信息的权重与排序等问题。根据我们的直觉与语料库检验 ,文本主题词的分布是不平均的。如果我们能通过对文本标注 ,从而提取出富含主题词的语句 ,那么 ,根据现有的自然语言处理技术 ,建构一套主题词规则化提取的数学模型和算法是可能的 ,这将为文本主题词统计结果提供可靠的预见和补充

关 键 词:主题词  置标语言  句法  规则

Rules of extraction of topic expressions in structural text: a rational anticipation
LI Yong kang. Rules of extraction of topic expressions in structural text: a rational anticipation[J]. Journal of Central South Huiversity: Social Science, 2001, 0(4)
Authors:LI Yong kang
Abstract:In the extraction of topic expressions(
Keywords:from a given text   the conventional way of combining the statistics based and syntax based techniques can overcome some shortcomings of any of the two systems. Yet   some problems such as the distribution of topic expressions   the extraction o
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号