首页 | 本学科首页   官方微博 | 高级检索  
     检索      

统计机器翻译基于赫夫曼编码的解码算法
引用本文:陈丽江,陈小荷.统计机器翻译基于赫夫曼编码的解码算法[J].东南大学学报(哲学社会科学版),2011,13(6):93-96,128.
作者姓名:陈丽江  陈小荷
作者单位:南京师范大学文学院,江苏 南京,210097
基金项目:江苏省2010年度研究生科研创新计划(CX10B_063R); 南京师范大学2010年度优秀博士研究生学位论文培育项目(2010bs0006)成果之一
摘    要:赫夫曼树编码是信息论中重要的数据编码方式。根据赫夫曼编码的算法构造最优二叉树,可以得到总长最短的二进制编码。本文首次依据赫夫曼编码的思想设计机器翻译中的解码算法,基本思想是:在栈解码的基础上,不再是在原有结点上扩展新的假设,而是合并原有的假设,最后构造一棵完整的二叉树。这种方法开辟了机器翻译解码的新途径,有望提高机器翻译解码的效率,节约存储空间。

关 键 词:统计机器翻译  解码  赫夫曼编码  二叉树

On the decoding algorithm for statistical machine translation based on Huffman coding
CHEN Li-jiang,CHEN Xiao-he.On the decoding algorithm for statistical machine translation based on Huffman coding[J].Journal of Southeast University(Philosophy and Social Science ),2011,13(6):93-96,128.
Authors:CHEN Li-jiang  CHEN Xiao-he
Institution:CHEN Li-jiang,CHEN Xiao-he
Abstract:Huffman coding is an important data encoding method for information theory.By constructing an optimal binary tree structure according to Huffman coding algorithm,we get the binary encoding with the shortest length.This paper for the first time designs the decoding algorithm for SMT based on Huffman coding;unlike the original stack decoding algorithm,we no longer expand the hypothesis,but merge two hypotheses and finally construct a complete binary tree.This new approach is expected to improve the performanc...
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号