首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对现有迷因识别方法常忽视网络实体作用的情况,提出一种结合图卷积网络的迷因识别方法。提取图像中网络实体信息,利用图卷积网络对网络实体模态和文本模态进行融合,结合外源词典从多角度衡量网络实体和迷因文本之间的关系,构建跨域图;通过注意力模块对文本和图像模态进行交互,结合自蒸馏技术提高模型对信息的利用率。实验结果表明:该方法在Hateful Memes和MAMI数据集上的准确率分别达到76.03%和73.9%,性能优于现有的SOTA模型。  相似文献   

2.
领域本体在信息抽取系统有着重要作用。该文介绍了本体、领域本体的基本概念,并探讨了领域本体与信息抽取的关系。提出了信息抽取系统中领域本体的设计准则和实施步骤,实施步骤包括领域本体需求分析、收集本体信息、构建领域本体框架、形式化编码、确认和评价等。在信息抽取原型系统中实现了显示器领域本体,并将该领域本体应用到信息抽取中的命名实体识别、抽取模式获取和主题概念提取等任务中,应用结果表明该方法、步骤是可行的。  相似文献   

3.
提出基于弱监督学习的属性抽取方法,利用知识库中已有结构化的属性信息自动获取训练语料,有效解决了训练语料不足问题。针对训练语料存在的噪声问题,提出基于关键词过滤的训练语料优化方法。提出n元模式特征提取方法,该特征能够缓解传统n-gram特征稀疏性问题。实验数据源来自互动百科,从互动百科信息盒中抽取结构化属性信息构建知识库,从百科条目文本中自动获取训练数据和测试数据。实验结果表明,关键词过滤能有效提高训练语料的质量,与传统n-gram特征相比,n元模式特征能够提高属性抽取的性能。  相似文献   

4.
在知识图谱的构建过程中,传统方法先进行命名实体识别,再进行关系抽取,导致任务间关联信息的丢失,而且忽略了实体间的重叠关系。为此,基于能识别重叠关系的Bi-LSTM+CRF模型,通过参数共享实现两个任务联合学习,充分利用任务间联系来优化结果。公开数据集上的实验结果表明:所提出模型在实体识别上取得了78. 4%的f1值,在非重叠关系和重叠关系的抽取上取得了50. 5%和45. 0%的f1值。为验证该方法可后续用于金融知识图谱构建,提取了小型金融数据集来验证其在金融数据上的泛化能力。  相似文献   

5.
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%。该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能。  相似文献   

6.
基于CPSC-2018十二导联数据,提出了一种U-Net网络和注意力机制结合的心电图分类算法。首先,针对数据集数据长度长短不一的问题,对数据进行等长处理和归一化处理。然后,利用U-Net网络中跳层连接和编码解码方式,对预处理后较长的数据进行处理。在U-Net网络解码的最后一层加入注意力机制对抗噪声,提升模型的有效信息关注度和准确性。最后,利用CPSC-2018数据集进行验证。实验结果表明:所提模型能够取得较好的分类效果,识别房颤(AF)和右束支传导阻滞(RBBB)心律失常的精准率、召回率、F1值都可以达到90%以上,平均F1值可以达到82.5%。  相似文献   

7.
在中文垃圾邮件过滤系统中,基于内容过滤的Na?ve Bayes算法得到了广泛应用。本文将多种特征结合构建邮件文本向量,应用八种文本分类特征选择方法在Na?ve Bayes算法上进行实验验证,通过准确率和召回率结合的综合性能指标F1值进行性能评价,结果表明,采用类别区分词、优势率、信息增益、期望交叉熵、CHI统计和文本证据权等六种特征选择方法应用于多特征结合邮件文本向量的过滤取得了较好的垃圾邮件过滤性能,反垃圾邮件效果较好。  相似文献   

8.
提出了一种用平滑型排序支持向量机(Rank-sSVM)抽取博客文章摘要的方法。使用该排序算法抽取的摘要,反映了评论者的意见和博客文集的特性。自动摘要过程中,首先经人工从文章选择重要句子标记为摘要,作为训练对象;再由机器生成表示文章语句的特征集,共14个特征,包含标签、评论等博客文章独有的信息;最后用Rank-sSVM学习人工摘要后,将文章所有句子排序,选取最靠前的若干语句构成摘要。该方法在一个中文博客数据集上取得良好效果。  相似文献   

9.
在实际应用中,少数类样本往往包含重要信息,而传统机器学习方法通常对少数类样本的分类准确率低,且误分类代价较高。针对不平衡文本数据的情感分类问题,以三支采样(three-way sampling, 3WS)与过采样为基础,提出了三支过采样算法(three-way SMOTE,3WOS)和三支边缘过采样算法(three-way borderline-SMOTE,3WOBS),3WOS能够更好地识别边界区域上的数据,3WOBS可以增强边界区域所蕴含的信息。首先,将文本数据构建为超球,获得超球边缘的支持向量。其次,3WOS对边缘上的支持向量直接进行过采样以生成合成新样本并更新样本集,3WOBS则在生成合成新样本后根据给定条件判断是否获得该新样本并更新样本集。最后,将更新的样本集放在不同的基分类器上进行对比实验。实验采用了3个不平衡数据集,并保证了不同的不平衡比。同时,在数据集训练过程中引入粒计算思想,确保模型的鲁棒性。实验结果表明,3WOS-ITSC与3WOBS-ITSC准确率较高且代价低于其他模型,为不平衡文本分类问题提供了新思路。  相似文献   

10.
为探究医生电子病历系统间接使用行为与工作绩效之间的关系,文章基于社会网络理论、技术接受模型和感知风险理论提出间接系统使用与工作绩效关系的研究假设和理论模型。通过方便抽样的方法对安徽省6家三甲公立医院的医生开展线上问卷调查,共获得506份有效数据。采用SmartPLS 3.0进行信效度检验和模型分析,结果显示,医生的电子病历系统间接使用行为发生率为77.6%,感知有用性正向影响医生的间接系统使用行为,感知易用性负向影响间接系统使用行为,感知风险对间接系统使用行为无显著影响,间接系统使用行为正向影响医生的任务绩效和医患沟通质量,关系强度正向调节间接系统使用行为与医生任务绩效和医患沟通质量之间的关系。医院管理者应理解医生对电子病历系统间接使用行为的合理性,建立间接系统使用制度,强化医院信任文化建设,规范医生的间接使用行为,优化电子病历系统功能。  相似文献   

11.
食品安全网络舆情本体学习研究   总被引:1,自引:0,他引:1  
食品安全网络舆情本体在一定程度上可以提升舆情信息的抽取与检索效率,但海量的文本信息使得该领域本体的构建需要借助本体学习技术。本体学习的主要任务是概念获取以及概念间关系获取。研究中概念的获取采用了基于领域相关度和领域均匀度综合评价方法,概念间关系的获取采用了基于关联规则的概念间关系分析方法。考虑到中文词语的构成,在关联规则分析的基础上,进一步采用了基于词距判定的概念间关系分析方法,这可在一定程度上识别新概念及概念间关系。最后采集了229篇“立顿茶包”事件相关文档,采用上述方法构建了领域本体。  相似文献   

12.
在虚拟的网络世界里,顾客无法获取产品或服务的真实信息,与线下实体零售商相比难以鉴别真实状况。而电子零售商的线上服务质量是可以被消费者直接感知的,消费者会根据自己感知的服务效果作出购买决定,从而对电子零售商的品牌作出评价。基于SERVQUAL多维度量表,构建线上服务质量五维度量表,即易用性、可靠性、反应性、安全性以及履行性,并建立五个维度与电子零售商品牌权益的关系模型,提出其关系研究假设,运用SPSS软件对数据进行因子分析、回归分析等,确定服务质量五维度对电子零售商品牌权益的影响程度,并据此对电子零售商品牌权益提升提出科学合理的建议,旨为相关领域研究提供一定的补充。  相似文献   

13.
后结构主义与超文本理念   总被引:4,自引:0,他引:4  
后结构主义与电子超文本技术相互应和, 推动了20世纪下半叶文本形态与文本观念的变革。德里达的解构主义,罗兰巴特关于“引人写作之文”的论述, 福柯关于知识考古学、权力网络和全景敞视主义等观点,都和超文本理论息息相通。深入考察后结构主义和超文本理念的关系,有助于认清社会思潮和信息科技之间的相互作用。  相似文献   

14.
为了解决主数据集成、web数据集成中的真值发现问题,提出了一种基于模糊偏序关系支持度计算模型的真值发现算法(FA-SDCM)。针对已有算法中,以描述相似度替代描述支持度进行计算,忽视了描述所含真值信息的不对称性问题,在分析描述本身特性的基础上,提出了描述蕴含概念,定义了基于模糊偏序关系的支持度计算模型,较好地解决了描述所含真值信息的不对称性问题。在考虑了数据源可信度及描述之间支持度对真值发现影响的基础上,基于迭代思想,提出了FA-SDCM算法。在Books-Authors数据集上进行实验,结果表明FA-SDCM算法比Vote算法与Truth Finder算法具有更高的准确率。  相似文献   

15.
生活垃圾的有效分类处理是改善社会环境的一项重要措施,传统的垃圾分类算法已经不能满足当前垃圾分类的要求。为了提高生活垃圾分类性能,在深入研究卷积神经网络中不同层次具有不同特征的基础上,提出一种面向生活垃圾图像分类的多级特征加权融合算法。构建基于ResNet的特征提取网络,通过多分支网络结构提取并处理图像不同层次的特征信息,在特征融合过程中分析自适应权重融合和固定权重融合对图像分类性能的影响,选取更优的加权融合方法对多级特征进行融合,从而获取更丰富的生活垃圾图像特征信息,提高垃圾分类准确率。实验结果表明,该算法在华为生活垃圾图像数据集上的分类准确率最高可达97.53%,优于其他算法,具有一定的实用价值。  相似文献   

16.
分别以文献[15]的AM1、PM3、PM5和DFT方法计算的5种量子化学参数作为自变量,采用ε-支持向量机(ε-SVM)建立关于苯酚类化合物毒性A(pc)的定量构效关系(QSAR)模型,对50种苯酚类化合物的毒性做QSAR研究.研究结果表明,不论是对训练集的拟合及交叉验证结果还是对外部数据的预测结果,ε-SVM模型的相关系数平方、标准偏差及平均绝对误差都较文献[15]的MLR模型具有更好的效果,泛化能力更强,表明ε-SVM用于建立关于苯酚类化合物毒性A的QSAR模型,较原文献采用的多元线性回归(MLR)模型更为有效.  相似文献   

17.
针对传统的银行反欺诈模型已无法满足欺诈检测要求的及时性与准确性的问题,本文提出了一种基于知识图谱的反欺诈模型。该模型基于多源信息和高维衍生特征的大数据,构建知识图谱,对信贷个体进行全方位画像,分析关联关系,并抽取网络属性。从四大方面、两大维度挖掘风险特征,四大方面指个人基本信息、账户信息、征信和行为信息,两大维度指个人节点和网络结构。最后将风险特征代入LightGBM,判断是否为欺诈类型,并得到对应概率。实验表明,相比于仅使用个人自身特征的模型,使用个人特征加网络特征的模型效果更好,AUC和F1分数分别提升5.18%和5.71%。因此,该方案能够有效地为银行对个人信贷进行欺诈评估。  相似文献   

18.
【目的/意义】大数据时代下,人工智能、区块链等信息技术得到了迅速发展。电子健康记录(Electronic Health Records,EHRs)涵盖了大量医疗的关键信息,基于EHRs的智能算法在提升智慧医疗水平方面发挥着重要作用,该领域吸引了众多国内外学者的兴趣,取得了丰硕的成果。【设计/方法】通过整理Web of Science和CNKI两大核心数据库的EHRs的相关研究文献,结合国家政策背景和国内外EHRs数据库的发展现状,用可视化图表分析了国内外EHRs相关研究的现状和发展趋势,并基于智能算法在EHRs的应用进行分类,展示了智能算法与EHRs相结合的研究成果。【结论/发现】通过回顾性研究,揭示了EHRs与深度学习、大数据、强化学习和区块链等人工智能技术的关系,发现我国在EHRs数据库建设与利用方面的不足,并对此提出可改进的相关建议与对策。  相似文献   

19.
患者对医生缺乏足够的信任,是造成当前医患关系紧张的一个重要原因。从期望角度看,患方信任中包含着能力期望与道德期望两个基本维度,分别对应着对医生的医术(妙手)评价与医德(仁心)评价。对2016年4月18日至2017年4月16日共52周的网络自媒体(微博、博客、论坛)文本大数据和2013年中国社会状况综合调查(CSS2013)数据进行分析后发现,二者一致证明能力期望和道德期望均会显著影响患者对医生的信任。与能力因素相比,道德因素对患方信任的影响作用更大;即使考虑了医疗安全感的中介作用,道德因素的间接效应也不输于能力因素。这种对医德的格外强调,既与传统文化影响下的医生角色期待有关,也同市场经济下患者的"消费者赋权"及其对医患权力关系的重构紧密相联。  相似文献   

20.
构建要素自由交互与平等交流的新型工农城乡关系是我国未来经济发展的新增长点,畅通国内大循环的关键所在,2035年远景目标的重要内容.基于要素流动视角,发现劳动力要素双向流动梗阻、土地要素流动城乡有别、资本要素双向流动动力不足以及数据信息要素交换传递不畅是影响新型工农城乡关系构建的症结.因此,需要以新思维,寻求新突破,以城乡一元化思维,健全城乡融合发展体制机制;以乡村建设行动为契机,推进要素市场化改革;以"双循环"为抓手,促进城乡要素双向流动;以县域城镇化为重点,完善城乡要素统一市场.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号