《说文解字》语料库的XML标注设计 |
| |
引用本文: | 胡佳佳.《说文解字》语料库的XML标注设计[J].社会科学论坛,2011(7):214-223. |
| |
作者姓名: | 胡佳佳 |
| |
作者单位: | 北京航空航天大学虚拟现实技术与系统国家重点实验室; |
| |
摘 要: | 《说文解字》含有关于先秦文献语言和文字的多方面的资料。深入的研究它,是研究汉民族语言文字学史的重要内容。现有电子版《说文》大多只是《说文》原文文本的电子化,应用价值有限。要想更好地应用计算机研究《说文》,就必须对其文本进行详细标注,而标注规范的合理性和可用性,决定了标注的价值。本文选择XML作为标记语言,在详细分析《说文》内容结构的基础上,设计了符合其特点的XML标注规范(Schema);并在对《说文》全文进行XML标注基础上开发了更加符合用户需求的全文检索工具。
|
关 键 词: | 《说文解字》 语料库标注 XML 标注规范 |
本文献已被 CNKI 维普 等数据库收录! |
|