汉字编码的内在质量和单码率——“动态重码率”容易产生错误导向 |
| |
作者姓名: | 段利华 |
| |
作者单位: | 大理医学院!671000 |
| |
摘 要: | 每一套汉字编码方案,都实现了一个从汉字集到编码集的映射。本文讨论映射关系,强调编码内在质量和学习效率的重要性。汉字集到编码集的映射国内汉字操作系统的汉字库目前基本采用GB2312-80标准,大多数编码方案的汉字集均为H。编码集(B)的确定是汉字编码方案的一个关键,其元素由方案选用的码元和码长确定。一套汉字编码方案实现了一个从集合H到集合B的映射,记为:B=F(H)或Y=F(x)1、最大码长的确定本文以码无为26个英文字母为例,讨论理论最大码长和实现最大码长问题。要实现方案的高效快速,就要为编码集提供较为宽松的编码空间。理想的方…
|
关 键 词: | 汉字编码 动态重码率 汉字处理 单码率 |
本文献已被 CNKI 维普 等数据库收录! |
|