共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
汉语自动分词和词性标注一体化系统 总被引:5,自引:0,他引:5
作为高层次信息处理技术的一个重要方向,自然语言理解一直是人工智能界所关注的核心课题之一。“汉语分词”就成为中文信息处理的一个研究课题。国内外从事汉语自动分词系统研究已有十几年,迄今尚无真正成熟的实用系统面世。自动分词研究中的两个主要的困难:1未登录词的辨识,2歧义切分字段的处理。所谓未登录词就是分词系统的词典中没有收录的词。汉语词汇是一个开放的集合,无论建立多么庞大的词典,都不可能穷举所有的词。所谓歧义切分字段。就是指汉语句子中的某些字段,如果纯粹根据词表作机械的字符串匹配,则它可能存在多种切分的形式。关… 相似文献
5.
6.
7.
汉语书面语分词连写是有关全社会信息化的大事 总被引:2,自引:0,他引:2
汉语的书面语是按句连写的,词间无间隙,因此在汉语书面语的处理中,例如统计、分析、理解等,我们首先遇到的问题是词的切分,把按句连写转换为按词连写。所以,词的正确切分是进行汉语书面语处理的必要条件,它的任何错误都将使处理结果受到影响,有时是严重的影响。 相似文献
8.
汉语句型分析与频度统计的研究,是清华大学中文系承担的国家自然科学基金资助项目。完成后已通过了国家教委组织的专家鉴定。 课题分为实验模型和系统实现两个阶段进行。第一阶段对大约二十五万字的真实语科进行了第一次大规模的分析和统计,在国内 相似文献
9.
10.
11.
词库是中文信息处理系统中的重要数据结构,汉语词汇处理在中文信息处理技术中有着重要的应用价值。词库也是校对工作使用的基础,词库的设计是否合理,直接关系到整个校对工作的性能。因此,本文阐述校对工作所使用词库的组织与设计。一、汉语字词的分布规律 一般人日常使用的汉字大约在五、六千个,尽管由这些字所组成的汉语词汇相当庞大,但经统计发现,人们使用频率相当高 相似文献
12.
江荻 《暨南学报(哲学社会科学版)》2022,44(3):10-23
本文回顾了学界对汉语方言之间相互关系的三种计量方法:特征统计、词源统计和词汇相似度计量,指出这三种计量方法采用的是非整体的、语音和词汇上受限的考察方法。文章阐述了一种更适用的计算模型,即Levenshtein Distance算法(莱文斯坦距离,或称编辑距离),该方法对语言或方言之间线性字符串的语音相似性和词汇对应性具有协调功能,并蕴含特征比对和词源概率效用。本文自动分区实验汇集了南方吴、闽、粤、湘、客、赣、徽、淮8个分区的78个方言,官话方言有东北、北京、冀鲁、胶辽、中原、兰银、西南108个方言,共计186个汉语方言点。每个方言收集了斯瓦迪士100个基本词,并对方言之间展开相似性计算。计算结果与传统分区基本一致,但更为精准。 相似文献
13.
14.
采用汉语作为人机通信的表示形式时,对其分析理解并要求快速转成相应的系统命令时, 存在着对接口句“理解的逼近”,文中对此提出了对汉语命令接口的一种快速理解算法,且进行了一些讨论,该算法已应用于交互式COBDG系统的治语接口CIM中。 相似文献
15.
16.
韩国汉语之热,在世界范围内是少有的。在我国的对外汉语推广战略中,韩国具有举足轻重的地位。然而韩国的汉语教材却存在许多问题和不足,既不能满足在韩国兴起的"汉语热"要求,也严重地制约着汉语在韩国的进一步推广。对韩国汉语教材市场进行调研,开发出具有针对性和本土化的汉语教材,对汉语国际推广无疑是十分重要的。 相似文献
17.
借鉴汉语分词规范,《信息处理用现代蒙古语切分规范》需遵循面向信息处理为主,面向语言学为辅,符合语言学理论,以人为本,定量及定性相结合等指导思想及科学性和严谨性、完整性、一致性、通用性等制订原则。其体例采用语法角度的分词法,切分范围包括14类基本词和10类非词单位。汉语分词规范概述部分的标点符号、习用语、缩略语、非汉字符号等内容,及具体说明部分的名词、数词等内容需加以深入研究;与《信息处理用现代蒙古语切分规范》有关的构词法可分为词法构词法、复合词缩略法、句法构词法、重叠法、仿叠法5种;蒙古语二字、三字复合词有多种类型,其切分比较复杂。 相似文献
18.
19.
文章详细描述了大学生创业网的设计思路和方法.系统利用C#语言设计,采用中文分词算法的正向最大匹配方法实现创业方和投资方的精确匹配,并给出了页面控件多级嵌套和验证码设计的有关技术.为大学生创业提供了良好的信息交互平台,具有很好的实际应用价值. 相似文献
20.
技术发展路径的选择问题本质上是利益分配问题。技术选择过程中各利益攸关方究竟能在多大程度上实现自身利益,取决于各利益攸关方对技术选择决定权的大小。在市场机制下的技术选择博弈中,社会公众虽是技术发展路径选择的利益攸关方,却很难直接参与到技术发展路径选择的决策中来。基于可持续发展目标的技术发展路径选择就是要从社会公众的总福利最大化目标出发,寻找到一条能够平衡经济效益、生态效益和社会效益的技术发展路径。通过对我国1990-2011年技术发展绩效的评估,明确了我国技术发展路径选择的方向:我国应当逐步向平衡发展型技术发展路径过渡并形成相匹配的制度安排。 相似文献