首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
随着网络技术的发展,网上的信息资源越来越丰富,充分利用这些资源成为当前数据挖掘领域的研究热点.文章分析了基于XML的Web数据抽取模型,详细论述了如何利用XML技术从Web页面中抽取数据.  相似文献   

2.
领域本体在信息抽取系统有着重要作用。该文介绍了本体、领域本体的基本概念,并探讨了领域本体与信息抽取的关系。提出了信息抽取系统中领域本体的设计准则和实施步骤,实施步骤包括领域本体需求分析、收集本体信息、构建领域本体框架、形式化编码、确认和评价等。在信息抽取原型系统中实现了显示器领域本体,并将该领域本体应用到信息抽取中的命名实体识别、抽取模式获取和主题概念提取等任务中,应用结果表明该方法、步骤是可行的。  相似文献   

3.
提出基于弱监督学习的属性抽取方法,利用知识库中已有结构化的属性信息自动获取训练语料,有效解决了训练语料不足问题。针对训练语料存在的噪声问题,提出基于关键词过滤的训练语料优化方法。提出n元模式特征提取方法,该特征能够缓解传统n-gram特征稀疏性问题。实验数据源来自互动百科,从互动百科信息盒中抽取结构化属性信息构建知识库,从百科条目文本中自动获取训练数据和测试数据。实验结果表明,关键词过滤能有效提高训练语料的质量,与传统n-gram特征相比,n元模式特征能够提高属性抽取的性能。  相似文献   

4.
中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础。目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题。针对这一问题,提出了基于对抗学习与多特征融合的中文电子病历实体关系联合抽取模型AMFRel (adversarial learning and multi-feature fusion for relation triple extraction),提取电子病历的文本和词性特征,得到融合词性信息的编码向量;利用编码向量联合对抗训练产生的扰动生成对抗样本,抽取句子主语;利用信息融合模块丰富文本结构特征,并根据特定的关系信息抽取出相应的宾语,得到医疗文本的三元组。采用CHIP2020关系抽取数据集和糖尿病数据集进行实验验证,结果显示:AMFRel在CHIP2020关系抽取数据集上的Precision为63.922%,Recall为57.279%,F1值为60.418%;在糖尿病数据集上的Precision、Recall和F1值分别为83.914%,67.021%和74.522%,证明了该模型的三元组抽取性能优于其他基线模...  相似文献   

5.
进入知识社会,大量芜杂的信息使得读者陷入了尴尬的境地,笔者针对此种情况,从数学的角度来进行特定模型的语义抽取研究,通过相似值的计算、过滤及最大墒值的自动提取等环节来为用户自动抽取简洁的信息需求内容,并设计出一套科学合理的计算模式,以期对相关领域的理论研究及实践发展有所贡献.  相似文献   

6.
为摆脱中文自动分词过程中对庞大 词库和复杂分词处理程序的依赖,提出了中文关键词信息的提取方法,该方法采用基于2-grams的短语标引来进行中文关键词的抽取。首先采用2-grams方法提取出权重较大的2元关键词,再抽取能充分标引文章内容的短语关键词,以提高对文档内容的表达能力。  相似文献   

7.
随着互联网和通讯网的迅猛发展,网络文本成为信息的主要载体及人们生活中不可或缺的主要信息来源,文本挖掘技术的研究意义和实用价值越来越突出.另一方面,随着Web2.0时代的到来,出现了越来越多的由用户创作的网络数字内容.用户数字内容的大量产生和传播使得短文本计算、Web文本信息抽取、文本情感分析等逐渐成为Web文本挖掘研究的热点问题.  相似文献   

8.
为摆脱中文自动分词过程中对庞大词库和复杂分词处理程序的依赖,提出了中文关键词信息的提取方法.该方法采用基于2-grams的短语标引来进行中文关键词的抽取,首先采用2-grams方法提取出权重较大的2元关键词,再抽取能充分标引文章内容的短语关键词,以提高对文档内容的表达能力.  相似文献   

9.
UML及其在构件抽取中的应用   总被引:2,自引:0,他引:2  
UML是面向对象技术的一个重要应用,是近代软件工程环境中对象分析和设计的重要工具.该文首先介绍了UML,然后提出了基于UML的构件抽取的方法及策略,为在开发基于构件的应用系统中进行构件的抽取提供了一种可行的解决方案.  相似文献   

10.
利用先进的网络信息采集技术,提高网络信息采集的效率,是当前网络信息采集的一个研究热点。该文简要介绍了网络信息采集的原理、方法及技术等问题,论述了网络信息挖掘、信息抽取、信息过滤及信息推送这四种主要的网络信息采集技术,展望了网络信息采集技术的发展前景。  相似文献   

11.
网络环境下学习模式变迁、特征及其问题研究   总被引:4,自引:1,他引:3  
网络环境下的学习模式正在经历着重要变迁。信息技术和建构主义理论的结合促进了远程学习模式、自主学习模式、协作学习模式、探究学习模式以及其他基于网络的学习模式的出现,与此同时网络环境下学习模式呈现出许多传统学习模式不具备的新特征。此外,网络环境下的学习模式对教育者、网络教育资源提供者以及学习者提出了更高的要求。  相似文献   

12.
信息共享是实现供应链管理的基础,信息技术是有效进行供应链管理的重要工具。利用企业应用集成的思想,提出了基于EAI的供应链管理信息集成的框架结构和基于Web Services的供应链设计。它可以实现客户对供应商的查找和发现,并在此基础上实现供应商和客户之间的业务往来,以达到信息共享。  相似文献   

13.
GIS技术为考古信息的空间认识提供一种有效的方法,在考古学的应用中具有十分广阔的发展前景。GIS技术在考古工作中的应用,首先是构建于GIS信息处理平台之上的考古空间信息处理系统的完善;其次是应用GIS技术开展基于空间关系的考古信息的整合、分析;第三,是考古空间地理信息的可视化展示和多模式输出。GIS与RS、GPS、WEB、VR等其他相关信息技术的紧密结合,将是GIS在未来考古工作中应用的主要发展方向。  相似文献   

14.
Web导航菜单是用户从互联网获取信息的主要工具之一。但是当前Web导航菜单的设计普遍采用着"树型"的逻辑结构,这种结构的单向导航特点会导致用户查找信息的时间大大增加。本文在Web导航菜单设计过程中应用了形式概念分析(FCA)技术,将Web文档抽象为形式概念,将Web文档的特征描述为形式属性,使得最终的Web导航菜单成为"概念格"的逻辑结构。实验表明,用户浏览Web页面的时间得到了极大地节省。  相似文献   

15.
在对SECI模型的知识转化过程和场域,以及Web3.0的技术特征和应用进行简要分析的基础之上,参考Mohamed Amine Chatti提出的Web2.0驱动的SECI模型,本文将Web3.0与SECI模型进行整合,使Web3.0支持SECI模型的实现,得出一种基于Web3.0的SECI模型。  相似文献   

16.
提出并实现了一个基于安全套接字层 (SSL)技术的安全Web课件系统。该系统可为Web客户机和服务器的应用层通信应用软件提供数据加密、信息完整性、实体鉴别和防抵赖等安全服务  相似文献   

17.
企业信息门户的信息构建   总被引:4,自引:0,他引:4  
企业信息门户是企业信息交流的重要平台,通过信息构建的企业信息门户可以更为有效地利用企业的信息资源。通过对企业信息门户和信息构建的介绍,论述了企业信息门户建设的重点是信息构建,在信息构建理念的基础上对企业信息门户的建设提出了一套建设思路。  相似文献   

18.
对于网络中最新出现的W eb3.0概念,传媒学界还存在较大的分歧。如何实现W eb2.0到W eb3.0的跨越性转变,成为摆在互联网研究学者面前的一个崭新命题。文章对互联网从W eb1.0到W eb2.0的发展历程进行了梳理,并对未来W eb3.0的发展趋势进行展望。  相似文献   

19.
互联网的高速发展 ,给人们的生活带来了极大的便捷 ,但同时也存在着诸如“垃圾邮件”和“黄毒网站”等负面问题。针对这些问题 ,世界各国都对计算机安全进行立法保护 ,我国也进行了一系列立法工作 ,打击计算机犯罪。但目前仍存在一些空白区域 ,特别是在网络卫生方面。因此 ,有必要专门制订一部《网络卫生法》。  相似文献   

20.
创建动态图表一般都需要第三方软件,OWC提供的是一个既便宜又简单的适宜创建动态图表的环境,除了在涉及第三方工具软件外,OWC图表还提供完全客户化的环境,以便用户描绘图表并分析数据.该文主要介绍如何在ASP.Net中使用C#创建OWC动态图表,及如何在ASP.Net中引用数据库数据创建图表的方法,其中对于所涉及的工具作了比较.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号