首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
PowerGREP软件是一个强大的文本处理软件,它的设计原来为计算机编程等服务,并非用于语料库语言学领域.但是它的功能可以在信息提取、语料库建设等方面完美地服务于语料库语言学.该文从信息提取、词汇搭配统计、语料库标注中的格式转换等角度对该软件进行介绍.  相似文献   

2.
PowerGREP软件是一个强大的文本处理软件,它的设计原来为计算机编程等服务,并非用于语料库语言学领域。但是它的功能可以在信息提取、语料库建设等方面完美地服务于语料库语言学,该文从信息提取、词汇搭配统计、语料库标注中的格式转换等角度对该软件进行介绍。  相似文献   

3.
在全球华语大发展、大融合的背景下,基于多媒体语言资源建设的理念,建设全球华语语料库有其必要性;其和国内汉语语料库一起,构成全球汉语的语料库一体化系统。全球华语语料库在设计和构建上,需要从建设原则、语料来源与获取方法、语料库的构成比例、信息字段和存储格式等方面考量。在全球华语语料库的深加工方面,可以从选取核心库,分词标注词性、人工校对,基本字词信息统计,音视频资源标注处理,编误标注等方面拓展。基于网格平台,全球华语语料库可以包含如下功能系统:子语料库生成系统、网络版字词检索系统、网络版全文例句检索系统、音视频资源点播系统等。  相似文献   

4.
主要介绍了对应语料库的概念、类型以及编制的具体方法,从语料的选取、收集、整理、对齐和标注等方面详细阐述了小型英汉对应语料库的编制步骤和注意事项。  相似文献   

5.
近年来语料库标注的标准化得到了前所未有的关注。该领域的研究成果使创建、表示和操作标注数据的标准方法更加清晰。面对新形势,ISO/TC37/SC4将实际应用标准与最佳实践相结合,提出了LAF(Linguistic Annotation Frame work)。LAF体现了语料库标注标准化的必然趋势,在创建和使用标注语言资源的过程中发挥着越来越重要的作用。  相似文献   

6.
语料库中语料的标注   总被引:2,自引:0,他引:2  
语料标注是实现原始语料机读化的关键环节 ,也是语料库语言学领域的一个重要研究课题。本文结合国内外的有关研究成果以及国外的部分大型英语语料库的标注实践 ,介绍与讨论了语料标注的原则、模式以及类型 ,以供国内在建设英语语料库的过程中借鉴。  相似文献   

7.
用XML格式标注的电子文本具有清晰易读、传播方便、平台通用、检索迅速等优点。我们使用XML格式进行了一些古籍的信息标注工作,并研制了基于XML的软件Mark&Search,该软件能较好完成古籍信息的标注与检索。  相似文献   

8.
由于自然语言的语义存在不确定性,形式化很困难,因此语义处理成为自然语言处理的瓶颈所在.基于大规模标注语料库的语义处理已经成为发展趋势,语料标注本质上就是语言知识(包括语义)形式化.现有句法标注模型主要包括基于短语结构语法(PSG)和基于依存语法(DG)的句法标注模型,还存在一些局限性.文章在现有句法标注模型的基础上结合认知语法(CG)的有关理论提出改进思路,以探索新的句法标注模型.  相似文献   

9.
通过本项研究,我们对100万词级现代蒙古语语料库做了短语标注,建立了现代蒙古语基本短语库。这一成果,对今后建立一个面向信息处理的、具有较强通用性的蒙古语语义分类和描述体系,提供了必要的前提条件。局部测试结果表明,标注软件对简单句子标注基本短语的召回率和准确率分别达到了92.93%和86.79%。今后有必要深入研究语义信息的获取、语法信息的细化以及蒙古语短语的歧义结构种类、产生歧义结构的原因等问题。  相似文献   

10.
本文针对目前标注工具在标注功能和语法篇章方面的不足,提出一个基于云计算平台的协作性标注框架。该框架充分发挥协作性平台的特性,建构于强大的数据库结构基础上,在标注过程中对功能和语篇信息提供即时可视化呈现,有望解决当前功能语料库标注的一部分难题,并为计算机辅助语言学习和教学作出一定贡献。  相似文献   

11.
为揭示汉语网络新闻评论文档在情感表达上的特性,基于评价理论的态度系统,采用语义标注方法,试图从多角度揭示汉语情感语义表达的参数特征。研究发现汉语情感语义的表达呈现多参数性特征。该情感语料库不仅可为目前汉语情感计算提供结构性情感语义资源、方便机器学习、利于观点抽取和整合工作,还将会为现有计算机和语言学领域的汉语情感标注提供一种多参数的操作方法。  相似文献   

12.
针对学术期刊中部分论文在参考文献与注释著录中存在的问题,分析了学术期刊论文中参考文献与注释的区别与联系,根据学术期刊编辑规范提出了关于参考文献和注释的科学、规范的著录格式及应注意的问题。  相似文献   

13.
教育信息化2.0时代,利用多模态语料库语言学方法,通过语料库建设及其数据挖掘进行教学音视频流反思,已成为课堂教学和教师发展研究的重要手段。在遵循语料库建设基本原则基础上,聚焦“教师自身发展”专门用途外语课堂教学多模态语料库MCCT的创建,强调建库目的。与此同时,介绍建库过程,概述文字转写、语料切分与标注等具体做法,总结深加工后MCCT特点及其应用开发。目的是为高校教师利用多模态语料库方法进行教学、科研和自身发展提供理念思路、技术参考和典型样例。  相似文献   

14.
研究以1 000多篇英文论文的小型语料库为基本语料,试图将修辞结构理论、体裁分析理论与语言语块理论整合为一体,对学术语类语篇的模块标注进行研究。研究试图探讨如何融合3个主要理论,即以修辞结构理论为主线,如何整合修辞结构理论、体裁分析理论与语言语块理论来指导语篇模块标注,同时在理论上进行了可行性论证。  相似文献   

15.
语科库作为自然发生的语言资料的集合 ,它反映了某一种语言的用法特征及其多样性 ;它为词典编篡提供了翔实可靠的依据。利用英语语言学研究的成果 ,结合语料库中常见的词性标注方法 ,对运用于双语词典编纂的 CONU L EXID语料库系统中的语料词性标注问题进行了初步的探讨。  相似文献   

16.
段玉裁在《说文解字注》(简称《段注》)中引用的文献方言和清代活方言十分丰富。这些材料既是我们方言研究和汉语史研究宝贵的语料,也有助于我们了解段氏的一些语言学观点和语言研究的方法。  相似文献   

17.
语料库和语料库方法的出现对社会语言学书面语研究起到了重要的促进作用,用语料库进行社会语言学研究还有很多改进的空间。利用国家语委语料库检验134个汉语音译词的变化情况得到的结果说明,这些汉语音译词被汉语固有词代替的结论基本上符合现代汉语的语料实际,这表明语料库方法对社会语言学的语言变化趋势分析具有重要作用,而119个音译词查不到频次说明语料库存在不足之处。建设社会语言学需要的语料库,就要全面了解语料库的作用以及对语料库的需求。社会语言学研究所需要的语料库除了具有一般语料库所具有的特点外,还应该包含丰富完整的社会语言学信息,其中部分信息应该通过标注手段获得。有了好的语料库,利用语料库和语料库方法研究社会语言学,将会进一步推动社会语言学研究中定量研究与定性研究的完美结合。  相似文献   

18.
目前现代蒙古语语料库的标注虽然有《现代蒙古语语料库标注规范》为指导,但该规范在非蒙古文字符、专有名词、外来词的转写规则方面存在一定空白,非单字单位的标注问题尚未细化。本规范以信息处理用为目的,根据现代蒙古语的特点及规律,研究蒙古文语料库标记单位的合并或切分规则。本标注规范的研究遵循了中国电子技术标准化研究所等单位联合起草的《信息处理用蒙古文词语标记》,及内蒙古大学的《现代蒙古语语料库标注规范》。本研究今后需在大规模语料库基础上不断的完善。  相似文献   

19.
作为黄老道家的集大成之作,《淮南子》在英语世界的译介与传播是中华典籍外译的重要组成部分,然而学界对其英译研究的关注明显不足,研究方法仍以内省式、定性研究为主,缺乏实证性研究视角.文章基于语料库翻译学范式,以《淮南子》原文、白话译文及现有两个英文全译本建立汉英平行语料库,涉及语料收集、对齐、标注、检索等步骤,并对其应用于...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号