首页 | 本学科首页   官方微博 | 高级检索  
     检索      

正则表达式在语料库研究中的应用
引用本文:吴进善.正则表达式在语料库研究中的应用[J].河南理工大学学报(社会科学版),2015,16(1):68-72.
作者姓名:吴进善
作者单位:北京外国语大学中国外语教育研究中心,北京100089;河南师范大学外国语学院,河南新乡453007
基金项目:河南省软科学研究计划项目,河南省教育厅人文社科研究项目
摘    要:语料库技术的关键在于通过对大规模真实文本的自动化分析处理,探索自然语言的内在规律。计算机程序编辑中广泛使用的正则表达式技术,因其强大的文本批处理能力,被逐渐应用于语料库开发和复杂检索等相关技术中。本文的研究目的在于厘清正则表达式的起源、概念和构造,并以任务驱动的方法,以几款常用的语料库工具为例,探讨正则表达式在文本清理、语料标注和检索等技术环节中的具体应用,从而进一步推动正则表达式在语料库研究中的普及和应用。

关 键 词:正则表达式  语料库研究  文本处理  语料标注  索引分析

The Application of Regular Expression in Corpus Research
WU Jinshan.The Application of Regular Expression in Corpus Research[J].Journal of Jiaozuo Institute of Technology(Social Sciences),2015,16(1):68-72.
Authors:WU Jinshan
Institution:WU Jinshan;National Research Center for Foreign Language Education,Beijing Foreign Studies University;Faculty of International Studies,Henan Normal University;
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号