首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
中国西南地区尔苏语使用人口少,语言传承面临断代的危险。抢救保护和传承濒危的尔苏语言迫在眉睫。通过采集有 声语料,建立数据库,创建尔苏拼音方案,用ELAN、FLEX等软件标注,构建由原始音频文件、国际音标标注、汉语翻译标注、尔 苏语标注的语料库,并利用语料库编撰尔苏语词典和尔苏语学习有声教材。尔苏语语料库的建立能有效典藏尔苏语言。  相似文献   

2.
汉语分词在汉语文本处理过程中是一个十分特殊而重要的组成部分。传统的基于词典的分词算法存在着很大的缺陷,它们无法对未登陆词进行很好的处理。而基于概率的算法只考虑了训练集语料的概率模型,对于不同领域的文本的处理效果不尽人意。本文提出了一种基于上下文信息提取的概率分词算法,它能够将预切分文本的上下文信息加入分词概率模型中,以上下文信息指导文本的切分。这种切分算法结合经典n元模型以及EM算法,在开放测试环境中取得了比较好的效果。  相似文献   

3.
文章基于语料库的计算机辅助英语教学的理论基础,在构建小型视听语料库的实践基,础上,探索了一种基于视听语料库以帮助艺术类学生有效、自主地学习英语的方法;初步探讨了教学用语料库的分类,并总结了一些技术心得。包括利用影视字幕文件提取语料和小型视听语料库的参数设定。  相似文献   

4.
基于作文语料与测试语料对留学生汉语集合量词的习得情况进行考查发现:汉语集合量词二语习得偏误类型主要有误代、遗漏、误加三种。从母语负迁移、目标语规则泛化、普遍认知、教材误导4个角度全方位考查并精准定位偏误生成的具体原因。结合偏误分析和汉语跟3种外语对比研究成果,基于汉语母语者BCC语料库,概括出汉语集合量词使用的一些具体规则,进而考查集合量词习得顺序,描绘“集合量词难度等级与习得阶段对应表”,提出“可分离性标准”以区别“双”“对”“副”,希望能切实促进汉语二语习得研究与国际中文教育。  相似文献   

5.
根据中古汉语的基本特点,结合现有语料库的建设经验,阐述中古汉语语料库选取语料的若干原则:语料样本的代表性、文本类型的平衡性、语料之间的关联性与区别度、入库文献的特色性;讨论建立中古汉语语料库分词规范、分词词表的可行性,初步构建"信息处理用中古汉语分词规范"的整体框架。  相似文献   

6.
语料库和语料库方法的出现对社会语言学书面语研究起到了重要的促进作用,用语料库进行社会语言学研究还有很多改进的空间。利用国家语委语料库检验134个汉语音译词的变化情况得到的结果说明,这些汉语音译词被汉语固有词代替的结论基本上符合现代汉语的语料实际,这表明语料库方法对社会语言学的语言变化趋势分析具有重要作用,而119个音译词查不到频次说明语料库存在不足之处。建设社会语言学需要的语料库,就要全面了解语料库的作用以及对语料库的需求。社会语言学研究所需要的语料库除了具有一般语料库所具有的特点外,还应该包含丰富完整的社会语言学信息,其中部分信息应该通过标注手段获得。有了好的语料库,利用语料库和语料库方法研究社会语言学,将会进一步推动社会语言学研究中定量研究与定性研究的完美结合。  相似文献   

7.
教育信息化2.0时代,利用多模态语料库语言学方法,通过语料库建设及其数据挖掘进行教学音视频流反思,已成为课堂教学和教师发展研究的重要手段。在遵循语料库建设基本原则基础上,聚焦“教师自身发展”专门用途外语课堂教学多模态语料库MCCT的创建,强调建库目的。与此同时,介绍建库过程,概述文字转写、语料切分与标注等具体做法,总结深加工后MCCT特点及其应用开发。目的是为高校教师利用多模态语料库方法进行教学、科研和自身发展提供理念思路、技术参考和典型样例。  相似文献   

8.
语料库语言学在词汇和话语研究中的运用   总被引:2,自引:1,他引:1  
语料库语料在语言研究中起着非常重要的作用。和偶获、内省和诱发语料相比,语料库语料在语言研究方面更能显示出优越性。使用语料库来研究词汇,既可以加深原有的研究力度,又可以拓宽原有的研究视角,而且有助于我们对语言结构和心理语言过程有更加深刻的理解。就话语研究的领域而言,我们也可以使用语料库语料来分析各类话语。  相似文献   

9.
语料库在对外汉语教学中的应用   总被引:3,自引:0,他引:3  
以语料为基础的语言研究方法及其成果语料库,在对外汉语教学与研究方面可以得到广泛的应用。现代汉语语料库不仅可以为编制教学大纲提供定量依据,为编写教材提供真实的语言素材,为编纂教学专用辞书提供语料和语言信息,还有助于研究语言形式的语境意义和用法,有助于发现第二语言学习和习得的规律,有助于发现和修正语言规律,促进汉语研究和教学的发展。因此,有必要加强我国语料库建设及其在对外汉语教学与研究中的应用。  相似文献   

10.
运用《现代汉语频率词典》提供的数据,对《现代汉语词典》所有古语词进行了全面考察。结论:数量近5000,近97%是实词;《现代汉语词典》所收古语词广泛,有些已很少使用;《现代汉语频率词典》的收词应更宽泛些,切分语料的方法应更科学些。  相似文献   

11.
利用北大CCL语料库丰富的语料对“狗”字在现代汉语中的义项分布情况进行了重新分析,发现《现代汉语词典》(第6版)动物词“狗”漏收了“低下、低贱”;“坏”;“坏人,骂人的话”;“奉承,巴结”;“中国的十二生肖之一”等5个义项。  相似文献   

12.
目前基于语料库的翻译教学研究得到了广泛的关注,而平行语料由于可以直接呈现翻译中的原文及其译文,在翻译教学中有其独特的价值。本文尝试把Babel在线英汉平行语料库引入翻译教学中,对英语被动句翻译教学中推行数据驱动学习(DDL)的方式与效果进行了研究。研究表明,在教师的指导下,学生通过分析在线平行语料库中提取的真实译例,可以总结出更接近翻译实际的翻译方法策略;同时利用在线平行语料库有利于促进学生自主学习,激发其学习兴趣,改善教学效果。  相似文献   

13.
基于内省、基于词典的同义词习得方法有许多不足之处,把语料库引进课堂,让英语专业学生用语料库的方法习得同义词的教学实践表明:基于语料库的同义词习得方法确实能激发学生的学习兴趣,能引导他们去探究问题,寻求新的发现。通过对实验收集的数据进行分析,我们发现,这种语料库的方法能显著提高英语专业学生同义词水平。  相似文献   

14.
传统的旅游文本翻译研究往往局限于个别词句、篇章段落的个案分析.而基于语料库的研究则能使我们利用真实自然的旅游语料客观描述旅游文本的文体特征和语篇功能,在现代语言学和翻译学理论指导下,对英汉两种语言的旅游文本进行对比分析,能够完整系统地描写出汉语旅游文本翻译的原则和方法.为此,我们采用定性与定量相结合的研究方法,从研究旅游文本本质入手,得出建立英汉旅游文本可比语料库、英语旅游文本可比语料库和汉英旅游文本平行语料库有利于旅游文本翻译的确当,从而能有效推动我国旅游业的发展.  相似文献   

15.
新疆汉语方言语音语料库的建设   总被引:1,自引:0,他引:1  
随着普通话的普及,新疆汉语方言正朝着萎缩的方向发展。文章从新疆汉语方言语音语料信息的收集、整理、加工以及数据库的建立和信息的使用等方面阐述了具体的构想方案,同时指出了它是一项艰苦繁杂的工作,应得到国家和当地政府的资助.需要一支高素质的稳定的语音语料库鉴别专家方可完成。  相似文献   

16.
本文在借鉴国内外现有理论和方法的基础上,从计算语言学角度,结合汉语代词自身的特点,提出一种基于语料库和基于规则相结合的研究设想,以探讨汉语代词所指确定的一般性方法,为计算机理解汉语代词提供一种有效可行的处理模式。  相似文献   

17.
专门用途的英汉语平行语料库目前在双语平行语料库的发展中具有很大潜力,但是各专业领域的双语平行语料库均处于探索构建的初期阶段.对农林英汉术语平行语料库建设的背景和意义做了分析,探讨了建库思路、语料收集及标记加工技术.希望为农林领域从业者、译员、论文写作者的相关工作提供帮助,同时能够提高本校翻译硕士农林英汉翻译课程的质量和学生的农林英汉语翻译能力,并为今后建设更大规模的农林英汉语平行语料库提供借鉴.  相似文献   

18.
提出了一种基于随机森林的N1+N2结构语法关系分类判定方法,在自建熟语料库的基础上,为每个短语结构建立用于分类决策树的7个特征,使用C4.5方法生成决策树,构造随机森林算法,通过投票原则给出最终判断结果。经训练集学习后,在含有1 020条语料的测试集中进行测试,正确率达到94.8%。结果表明:使用随机森林算法进行汉语短语结构语法关系分类判定是行之有效的。  相似文献   

19.
基于语料库研究方法,文章从历时层面考察了“掉”的语义演变路径及语法化进程。语料分析发现,“掉”历经了古代汉语的语义扩大及现代汉语的语义缩小,语法化现象首次出现于宋代,至清代较为显著,在现代汉语中得到进一步凸显“。掉”在现代汉语中仍然存在语义滞留现象,语法化还不够彻底,处于后期加速阶段。  相似文献   

20.
汉语国际教育迅速发展,与之相应的研究却跟不上快速发展的步伐,其最主要的问题在于缺乏科学且可靠的汉语中介语语料库支持。国内中介语语料库存在的问题主要在于缺乏高质量且真实的口语语料资源和跨学科视角、语料数据来源存在局限性、缺少建设学习者的历史语料库、语料库数据尚不能充分共享等五个方面。中介语语料库建设具有复杂动态和非线性涌现的特征。基于大数据思维,"新一代汉语中介语语料库"的设计原则应增设词网技术、学习者特征、社会语言学特征三项;建设原则应遵循真实性、广泛性、历史性、跨学科、课内外、全媒体、无障碍共享等七项原则;实施方法应配置新一代互联网信息的管理系统和抽取系统、网络智能挖掘技术及网络代理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号