首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在汉语的语音处理、文本处理、信息检索与挖掘以及机器翻译这几个方面,自然语言处理技术经历了从受限的基于规则的方法到大规模的基于统计的方法的转变,再到深度学习和多种技术融合的发展过程。进而,出于对资源共享、统一规划和评测标准的重视,中文语言资源联盟等众包平台已经成为资源建设的重要支撑与发展方向。最后,中文信息处理要取得长足的发展,不仅要紧跟国内外的最新技术,还要结合汉语的特点,探索出具有独创性的中文信息处理的研究路线。  相似文献   

2.
随着国际交流的深入,越来越多的中国人需要把中文简历翻译成英文。但是,简历汉语的特殊性使机器翻译还存有许多不足,导致汉译英的简历表达不尽如人意。要解决这一问题,就有必要对简历中汉语的词汇、句法和语义等进行限制,并建立翻译句模,以简化句子结构,减少或消除汉语表达的歧义,从而提高机器翻译系统的译文质量。受限汉语和句模在机器翻译中的应用,可以推广到饭店订餐和房间预订等受限领域的机器翻译系统中。  相似文献   

3.
浅谈蒙古族学生学习汉语时蒙古语的负迁移作用   总被引:1,自引:0,他引:1  
由于蒙古语和汉语在语音、语义、语法等多方面具有不同之处,蒙古语对蒙古族学生的汉语学习起着负迁移作用.本文通过蒙汉语的对比,主要阐述了蒙古语和汉语的不同点,蒙古族学生学习汉语过程中蒙古语的负迁移,以及如何克服干扰的对策.  相似文献   

4.
文章论述了基于规则的英汉机器翻译试验系统中词典的设计思想和构造方法 ,以一部综合英语词汇学、句法学、语义学、语用学等语言学知识和汉语语言学、英汉比较语言学等知识于一体的英汉转换词典代替传统的基于多部词典的机器翻译方法。试验表明该词典在解决英语词汇歧义、结构歧义、提高汉语译文准确率等方面较为有效  相似文献   

5.
元杂剧中使用了不少蒙古语词。本文对元杂剧中蒙古语的使用情况进行了初步探讨、分析与归纳:将两个蒙古语词对举使用;将蒙汉双语中的等价同义词对比使用,相互解释、相互说明;将一个蒙古语词的一半翻译成汉语,另一半保留蒙古语;将两个蒙古语词组合成短语使用;在汉语的动词后加上蒙古语的后缀;在句首用蒙古语的语气词或叹词。  相似文献   

6.
隐喻现象是思维及语言的中心问题,而隐喻的机器理解若不能得到有效解决,将会成为制约自然语言理解和机器翻译技术发展的瓶颈,因此,隐喻的计算化研究成为自然语言处理的一个重要问题.相对于英语隐喻计算研究,汉语隐喻计算研究才刚刚起步.根据本体、喻体和相似性关系三者的认知结构,可以把汉语隐喻分为九种类别;在此基础上,隐喻网络模型的建构为汉语隐喻句的机器识别和分类算法提供了形式化方法;此外,从解决逻辑全知问题和隐喻的语义真值角度提出的汉语隐喻逻辑系统,则为汉语隐喻句的释义提供了很好的支持.在今后的研究工作中,还需加强隐喻分类识别研究,建立隐喻属性知识库,构建汉语隐喻的认知类比描述与转绎系统,改造汉英机器翻译系统并对面向隐喻的搜索引擎进行升级.  相似文献   

7.
鉴别元明戏曲中的蒙古语 ,应该注意的情况有 :古今蒙古语的读音、用法发生的局部变化 ;戏曲作家在使用汉字记录蒙古语音或摹拟其音记为汉字的过程中 ,失之准确 ;尤其是汉族作家往往错误地使用蒙古语义 ;蒙古语与汉语互相借用或辗转借用 ,两者之间的源流关系遂模糊不清 ;一些蒙语虚词 ,诸如语气助词、叹词 ,有时被当作汉语的习惯用语 ;戏曲作家还随意把蒙古语词拆开 ,使用一部分 ,或将蒙古语的句子、词拆开 ,中间嵌进汉语  相似文献   

8.
蒙古语连动句是动词谓语句的一种变体,而汉语连动句是动词谓语句的一种句式;蒙古语连动句的几个谓语之间的组合关系是由动词连接形负荷的,而汉语是由语序来负荷的;蒙古语连动句几个谓语之间不能出现任何句子成分,以此与并列谓语加以区别,而汉语连用的几个动词均可带宾语或补语,但其间一般没有关联词语和语音停顿。  相似文献   

9.
也说元代指物名词后加“们(每)”的由来   总被引:1,自引:0,他引:1  
文章从梵语、蒙古语对汉语影响力的大小,汉语中动、植物名词与"们(每)"组合句出现的差异两个方面,论证了是汉语自身因素导致了元时汉语中出现了指物名词与"们(每)"的组合.  相似文献   

10.
无论在汉语教学还是在机器翻译中,趋向动词都是一个公认的难点。虽然研究越来越深入,但真正面向对外汉语教学及机器翻译的应用研究并不多见。文章仅在相关研究的基础上,有针对性地研究一个趋向动词——“下来”的句法特点、语义特点和各个意义出现的条件及形式标志,以求探索趋向动词研究的新路子,为第二汉语教学及机器翻译提供参考。  相似文献   

11.
基于规则和统计的机器翻译方法歧义问题比较分析   总被引:1,自引:0,他引:1  
文章通过对SYSTRAN和GOOGLE两个机译系统90句商务英语英汉翻译译文的比较分析,从词义歧义和句法歧义两方面,研究基于规则(RBMT)和基于统计(SMT)两种机器翻译方法的消歧处理的优与劣。研究表明,基于统计方法词义消歧强于基于规则方法,而句法消除歧义能力相当。词义歧义问题主要集中在动词多义词和名词多义词,而句法歧义问题则集中在定语、状语和从句。动词与介词搭配,名词与介词搭配作定语和状语,以及具有商务内涵的动词和名词,成为机器翻译的难点。  相似文献   

12.
基于统计的离群数据挖掘与分析   总被引:1,自引:0,他引:1  
在数据空间中不可避免地存在着一些严重偏离整体样本集合的其它观测值,这些离群数据对数据挖掘与分析结果具有重要影响.通过对各种基于统计算法的总结与比较,按一元到多元的探索性离群分析思路,设计了一般分布下的Grubbs离群检测法和基于似然的混合模型离群点检测方法,并对多维数据的统计检测技术进行了讨论.结果表明,在离群检测与分析中恰当地利用统计方法在低维数据中的有效性进行探索性数据分析是可行的.  相似文献   

13.
普通语言学理论与机器翻译   总被引:1,自引:0,他引:1  
国内机器翻译始终未能获得较大成功的主要原因是自然语言理解没有获得决定性的突破,而与之相关的普通语言学理论研究成果并没有和机器翻译有机结合。本介绍了Charles C.Fries对机器翻译的普通语言学理论研究,并认为:对于国内机器翻译理论研究和语言学工作来说,共同的任务是如何结合汉语语法和词法的特点,对其进行多角度,全方位的研究,找出其基本规律和属性,并对其尽量形式化,这无疑将是国内机器翻译理论研究的重要趋势。  相似文献   

14.
作为一项历时5年探索机器翻译译后编辑自动化研究的重大阶段性成果,该项目采用汽车技术文献作为研究对象,通过对10万个英汉翻译句对做机器译文和人工标准译文的对比分析,发现机译典型错误并进行数据统计分析。介绍该研究所依据的机译错误分类标准,并以实例加以说明,得出的机译错误分析数据统计显示,机译错误率超过八成,其中词汇类错误占七成。本研究探索的机器翻译译后编辑新思路,对于降低机器翻译人工成本、 提高机译效率和质量具有较高的实际价值和理论意义。  相似文献   

15.
格语法在英汉机器翻译系统中的应用研究   总被引:3,自引:0,他引:3  
简要回顾了机器翻译的历史。针对机器翻译译文质量的改善与提高,提出了一种基于格语法的内涵表分析法的自然语言处理方法,给出了一种基于语义的内涵表的形式表达方式,以及英汉机器翻译系统中语句处理过程:句子切分、格框架的建立与语句嵌入、简单句的翻译、简单句组合。该方法充分利用了格语法理论以语义为主,语义与句法相结合的特点。通过实例语句的处理,表明了所提出的方法在机器翻译中的可行性与有效性。  相似文献   

16.
赫夫曼树编码是信息论中重要的数据编码方式。根据赫夫曼编码的算法构造最优二叉树,可以得到总长最短的二进制编码。本文首次依据赫夫曼编码的思想设计机器翻译中的解码算法,基本思想是:在栈解码的基础上,不再是在原有结点上扩展新的假设,而是合并原有的假设,最后构造一棵完整的二叉树。这种方法开辟了机器翻译解码的新途径,有望提高机器翻译解码的效率,节约存储空间。  相似文献   

17.
英汉、汉英机器翻译探析   总被引:1,自引:0,他引:1  
汉语和英语是属于2种完全不同语系的语种,所以机器在分析转换这两种语言时碰到了许多难点。本文用实例分析机器翻译在冠词、多义词、定语、时态、名词单复数、省略或隐含成分等的处理中出现的错误,并提出了改进机器翻译技术的思路。  相似文献   

18.
文章对"直译体"代表作<元朝秘史>译文中作为语法化后位成分"行"表示方位处所和表示受事、对象的两种特殊用法进行了分析,并以此为一力证探讨了汉语青海方言与蒙古语的关系.初步结论为蒙古语的影响渗透是现代青海方言语法特点形成的主要原因.  相似文献   

19.
《汉语大词典》是古今汉语词语总汇型的辞书,其词条构成在宏观层面蕴含着丰富的可供挖掘的信息.基于词语首见年代对《汉语大词典》词条进行归类统计,可以获得各个时期新产词语的情况,从而反映出汉语词汇系统的量化发展过程.以《汉语大词典》词条首见年代为视角,力求量化和呈现出不同时期的复音词新产趋势,发现和发掘《汉语大词典》在历史词汇研究领域的宏观学术价值,竭力为词汇学的研究提供基础数据和新型思路.  相似文献   

20.
从“羊”一词词源看不同语言的文化联系   总被引:2,自引:0,他引:2  
蒙古语和突厥语的“羊”一词具有同源关系 ,它们都来源于 qorin (圈 )的动词 ;汉语的“羊”同“”同源 ,“养”同“羊”也同源。根据“院”、“园”、“垣”同“”之间的语音联系 ,认为“羊”也来源于“院”、“园”、“垣”等。由此看来 ,蒙古语和汉语的“羊”的共同点是在词源上都与“圈养”保持词源关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号