共查询到8条相似文献,搜索用时 0 毫秒
1.
汉语自动分词和词性标注一体化系统 总被引:5,自引:0,他引:5
作为高层次信息处理技术的一个重要方向,自然语言理解一直是人工智能界所关注的核心课题之一。“汉语分词”就成为中文信息处理的一个研究课题。国内外从事汉语自动分词系统研究已有十几年,迄今尚无真正成熟的实用系统面世。自动分词研究中的两个主要的困难:1未登录词的辨识,2歧义切分字段的处理。所谓未登录词就是分词系统的词典中没有收录的词。汉语词汇是一个开放的集合,无论建立多么庞大的词典,都不可能穷举所有的词。所谓歧义切分字段。就是指汉语句子中的某些字段,如果纯粹根据词表作机械的字符串匹配,则它可能存在多种切分的形式。关… 相似文献
2.
民国时期为我国汉语语文辞书古今转型的关键时期,《王云五大辞典》是该时期第一部采用现代汉语语法体系为字词标注词性的白话词典,本文对《王云五大辞典》的词类划分依据和词性标注特点进行了较为系统的剖析,并与其他代表性辞书的词性标注加以对比,总结《王云五大辞典》在词性标注理念的时代创新性,也指出其字词词性标注中存在的不足,供当前的辞书编纂参考借鉴。 相似文献
3.
4.
5.
江荻 《暨南学报(哲学社会科学版)》2022,44(3):10-23
本文回顾了学界对汉语方言之间相互关系的三种计量方法:特征统计、词源统计和词汇相似度计量,指出这三种计量方法采用的是非整体的、语音和词汇上受限的考察方法。文章阐述了一种更适用的计算模型,即Levenshtein Distance算法(莱文斯坦距离,或称编辑距离),该方法对语言或方言之间线性字符串的语音相似性和词汇对应性具有协调功能,并蕴含特征比对和词源概率效用。本文自动分区实验汇集了南方吴、闽、粤、湘、客、赣、徽、淮8个分区的78个方言,官话方言有东北、北京、冀鲁、胶辽、中原、兰银、西南108个方言,共计186个汉语方言点。每个方言收集了斯瓦迪士100个基本词,并对方言之间展开相似性计算。计算结果与传统分区基本一致,但更为精准。 相似文献
6.
7.
程祥徽 《浙江树人大学学报》2001,1(2):52-54
在20世纪最后20年汉语风格学蓬勃发展阶段,澳门语言学工作者有幸筹办了两次重要学术会议并发表了一批风格学、语体学著述,为汉语风格学的建设作出了贡献。21世纪澳门语言研究仍将因地制宜,在包括风格学、语体学在内的应用语言学研究方面继续努力,多做微观的风格现象的探索,争取获得更新的成果。 相似文献
8.
这是一个经济的时代,这是一个科技的时代,这是一个“资本”的时代,这是一个西方强势文化的时代。经济利益正在成为整个社会成员追求的目标,科技制作正在成为一个时代的时尚,“资本”像酒精一样刺激着公众的神经,西方强势文化漂浮在时装店、快餐厅、屏幕上、言词间……微笑与眼泪可以批量制作,乳房与硅胶莫辨真假,对心灵的探寻被冠以“×××工程”的字样,汉字组装的洋文谱写着“错把杭州作汴州”的乐章……一句话,“人”在被政治革命扭曲后,又在经济浪潮的冲击下“退场”。在这样的一个时代,80年代中期蜂拥而入的西方文学批评新方法,被制作… 相似文献