首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
本体的模块化是解决本体重用的有效技术手段.针对本体的数量越来越多、内容越来越丰富带来的本体应用障碍,提出建立本体重用机制,将符合规范的本体引入到系统,实现多个本体驱动的语义标注.文章还介绍了标注过程中的冲突检测、标注结果可视化展示和导出等功能.实践表明系统提供了极大的灵活性和本体可重用性.  相似文献   

2.
针对数据稀疏问题,采用适应度函数较灵活的遗传算法做语义的自动标注;以《同义词词林》的层次式结构为依据,提出了利用语义层次的提升来改善适应度函数中参数的估计质量;定义了语义层次的两个基本概念;阐述了语义提升的原理,并采用选择受限策略来解决因语义提升而引起的模型辨别力下降问题;实现了用于语义标注的遗传算法。实验表明该算法在语义标注中能适应不同训练数据量,具有一定的可行性。  相似文献   

3.
语言研究和实践都表明结构与意义是不可分离的。在语义-语法交界面上,名词短语起一定的语义作用,即充当一定句法角色(主语、宾语等)的名词短语担当各种语义角色,如施事、受事和工具等。语义角色是构建句子意义的关键因素。语义角色与句法角色相互独立又相互关联。  相似文献   

4.
在语义角色精细化理论框架下讨论了英语中的题元角色与论元之间的关系。对题元准则存在的问题进行了分析,介绍了佩里尼的语义角色精细化理论,区分了精细化角色和概括性角色。精细化角色和概括性角色之间存在一条精细化轨道,连接下位的精细化题元关系和上位的语义角色的同时,把精细化题元关系和论元的句法功能联系起来。在任何谓词结构内,每个可见论元都必须充当特定的语义角色,每个语义角色都必须指派给一个可见论元。并对角色精细化题元关系为题元准则具体问题的消解方案进行了讨论。  相似文献   

5.
在完成自动分词和词性标注工作的基础上,进行分句层次和关系的自动划分和标注,以期建设一个面向中文信息处理的大规模复句"精加工"语料库.可以利用词性信息制定一系列规则去实现部分非分句的自动识别和标注,同时建设一个短语库,把短语语言片段收录其中.  相似文献   

6.
从语法研究的一个平面来看 ,语义角色是名词性成分在句模结构中担当的角色 ,它主要由动词规定。语义角色是一个层次分明的体系 ,可逐层分级分类。根据它是否必须在句法结构中出现 ,分为强制性语义角色。其中强制性语义角色为十四个 ,非强制性语义成分为十一个 ,每种语义角色都有自己的句法、语义特点。  相似文献   

7.
《史记》对于汉语史研究具有重要价值,本文选取其中秦汉以后纪传材料作为研究对象,将双宾动词后面的体词性成分处理为宾语。与多数学者从双宾动词角度去分析双宾句式不同,本文主要从语义角色角度来考察《史记》中的双宾句式,将其划分为九类:VNP与事NP受事、VNP受事NP与事、VNP夺事NP受事、VNP受事NP夺事、VNP使事NP受事、VNP受事NP工具、VNP受事NP原因、VNP受事NP数量、VNP受事NP处所,分别考察了它们在《史记》中的表现,另外也做了相应的历史考察,得出了一些结论。  相似文献   

8.
语义分析是当前计算语言学研究的一个重要任务,也是促进自然语言处理迈向新的阶段的主要挑战。 在彝语言文字 信息处理中,对彝语语句的语义标注是亟须解决的问题之一。 研究选用特征结构理论框架,以彝语主谓谓语句的语义标注为 切入点进行初步探索,用形式化手段表示彝语主谓谓语句的十一种语义关系类型,并归纳整理出彝语主谓谓语句的特征结构 模型。 研究表明,特征结构理论标注效率和标注精度较高,可以比较全面的描述彝语的复杂语义信息,为探索适合彝语语言 事实的语义标注策略提供了一个可参考的解决方案。  相似文献   

9.
由于自然语言的语义存在不确定性,形式化很困难,因此语义处理成为自然语言处理的瓶颈所在.基于大规模标注语料库的语义处理已经成为发展趋势,语料标注本质上就是语言知识(包括语义)形式化.现有句法标注模型主要包括基于短语结构语法(PSG)和基于依存语法(DG)的句法标注模型,还存在一些局限性.文章在现有句法标注模型的基础上结合认知语法(CG)的有关理论提出改进思路,以探索新的句法标注模型.  相似文献   

10.
动宾语义搭配框架的描述主要包括三大要素——语义角色、语义类别和语义特征。具体地说就是,考察某个动词所能搭配的宾语语义角色有哪些,分别由哪个或哪些语义类别的名词充当,需要的时候应该给名词附加哪些语义特征。  相似文献   

11.
12.
针对织物疵点的语义分割任务中因数据集规模限制,而导致网络出现的严重过拟合问题,课题组提出了针对织物的语义生成网络。语义生成网络使用随机产生的语义标签生成对应的织物缺陷图像,相较于传统数据增强方法,语义生成可生成全新图像,更贴近实际缺陷分布,并且可通过判别器对生成图像进行筛选;课题组将语义生成的图像作为语义分割网络的输入,相应的随机语义标签作为目标,免去标注过程,扩充语义分割网络的训练样本,提升网络性能;对于语义分割网络,提出尺寸自适应Dice损失函数,解决样本不平衡问题,提升网络对小尺寸的检测能力。实验结果表明:尺寸自适应Dice损失函数使得模型精度提高11.1%,使用BEGAN扩充的数据集相较于传统方法扩充的数据集训练得到的模型精度提高7.4%。  相似文献   

13.
在对名词性宾语语义角色的分类标准进行界定的基础上,系统考察了英汉语单及物构块中名词性宾语语义角色类型及其异同,并从原型受事理论、状性宾语和代体宾语三个角度来解释出现这种异同的深层机制。  相似文献   

14.
树库是一种经过句法标注的语言资源,其中包含丰富的词汇、句法和语义知识。因此,近年来基于树库的语言学研究逐渐增多。文章概述了当前树库研究的建库方法和应用范围,内容涉及树库的标注、存储和检索以及树库在计算语言学和理论语言学中的应用。最后指出了现有研究的不足和亟待解决的问题,以及如何拓展基于树库的语言学研究。  相似文献   

15.
机用义项库在词义标注中的作用及其完善   总被引:1,自引:0,他引:1  
计算机词义标注一般都沿用传统词典的义项,随着研究的深入,对传统词典义项的设立提出了新的要求.有学者提出了以句法功能为主要依据来辨析义项.我们的研究注重词义语义特征的提取,共建构了七个资源库,互相之间主要围绕着词义语义特征展开,义项库在计算机词义标注中居于关键位置.机用义项库与传统词典义项相比,在词义标注目的、对语料的覆盖力、义项间语义关系、义项的可识别性、计算机处理能力的适应性及不同属性的义项义频的差距等方面,都存在着相当大的差别.从而,可以对基于传统词典义项上形成的机用义库提出改造与完善的若干原则与方法.  相似文献   

16.
对藏文文献的开发和利用无疑是藏学研究的基础性工作。本文指出了藏文文献开发中存在着思想重视不够、经费投入不足、缺乏协调等方面的问题,对此,提出应当采取成立协调机构、编制地区性的藏文联合目录和全国性古籍总目、利用科技手段共同开发利用藏文文献等举措。并指出,这对于发展藏学研究事业,弘扬藏族优秀传统文化,增进民族自豪感,提升民族自信心,促进藏族文化的传播与交流,推进藏族地区和藏族社会的全面发展与进步,都具有极其重要的意义。  相似文献   

17.
众包标注质量控制研究   总被引:1,自引:0,他引:1  
众包是近年来流行的一种分布式商业模式,采用众包方式获取标注是一种快速廉价获取海量数据标签的有效方式,由于众包平台中普遍存在不认真完成任务的作弊用户,众包标注质量难以保证.为有效提高众包标注准确性,通过学习标注者的可靠性,实现基于标注者的可靠性进行动态任务分配,采用贪婪的预测模型实现对多个标注者提交的标签进行聚集,获得高质量的众包标注结果.实验结果表明,该方法能获得比基准算法更高的标注准确性,有效实现众包标注质量控制.  相似文献   

18.
《现代汉语规范词典》在词性标注上迈出了艰难而可喜的一步,不少地方很有特色,但也存在一些问题。通过对该词典中词性标注现象的分析,发现主要存在三方面的问题:(1)没有区别词与非词;(2)某些性质相同的词词性不统一;(3)把区别词归入形容词或名词,归属不一致。  相似文献   

19.
藏文文献目录学的产生是在吐蕃文字创制后逐步发展起来的,大致经历了三个阶段,数字化目录学是目前藏文文献目录学发展的方向。  相似文献   

20.
目前现代蒙古语语料库的标注虽然有《现代蒙古语语料库标注规范》为指导,但该规范在非蒙古文字符、专有名词、外来词的转写规则方面存在一定空白,非单字单位的标注问题尚未细化。本规范以信息处理用为目的,根据现代蒙古语的特点及规律,研究蒙古文语料库标记单位的合并或切分规则。本标注规范的研究遵循了中国电子技术标准化研究所等单位联合起草的《信息处理用蒙古文词语标记》,及内蒙古大学的《现代蒙古语语料库标注规范》。本研究今后需在大规模语料库基础上不断的完善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号