摘 要: | 文章一方面叙述西藏的多样性语言现象,另一方面尝试用一种计算机自动聚类方法对西藏的语言进行分类。文章采用编辑距离计算方法的编码和赋值,以及聚类算法和树形图呈现。实验采集了西藏的藏语及其方言,还有门巴、珞巴、僜人等族群的非藏语语言共计49种,包括目前尚未识别的一些地方话。实验结果表明:西藏地区分布着藏语和非藏语的藏缅语,藏语包括传统分类的卫藏和康方言,卫藏又可分为前藏、后藏、阿里和南部次方言;非藏语的藏缅语有门巴族语言、珞巴族语言、义都系语言,以及藏东和藏东南语言系属不明的地方话。与传统分类相比,文章中所用机器语言或方言自动分类相当合理,可信度很高。
|