首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,加权算法MINWAL(O)则需要多次扫描数据库,使得在通信网环境下挖掘关联规则的难度非常大。该文提出了一种高效的基于加权频繁模式树的通信网告警关联规则挖掘算法,算法性能测试表明,该算法与已有的加权关联规则挖掘算法相比较,节约了大量的存储空间,提高了算法的挖掘速度,对通信网的故障诊断和故障定位有着积极的意义。  相似文献   

2.
现有的数据挖掘算法和模型主要是基于大型数据库或数据仓库的环境,大多采用集中式处理.而目前绝大部分的大型数据库都是以分布式的形式存在的,因此,提出新的分布式关联规则挖掘算法是非常必要的.针对FDM算法中可能造成频繁项集丢失的缺点,提出了一种改进的分布式关联规则挖掘算法DARM,该算法同时也减少了各分站点间的通讯量,从而提高了整个挖掘算法的效率.  相似文献   

3.
本文研究了关联规则的经典算法——Apriori算法,对Apriori算法进行了核心思想及主要步骤等的介绍,之后以超市事务数据库为例,详细说明了该算法应用。  相似文献   

4.
根据日常商务数据的特点,提出了商业应用系统中进行数据挖掘的改进的Apriori算法和对点击流数据进行挖掘的改进的多支持度关联规则算法,并结合具体实例进行了分析.分析结果表明,2种改进的算法可以有效地提高系统数据挖掘的效率.  相似文献   

5.
针对传统协同过滤算法过分依赖用户历史评分数据及评分数据存在严重稀疏性问题的情况,提出一种基于关联规则的协同过滤改进算法。该算法设置相似度阈值,计算近邻用户与目标用户之间的相似度,选取相似度最高的近邻用户组成邻居集,若邻居集中的所有近邻用户与目标用户的相似度都高于阈值则按照传统协同过滤进行评分预测,否则引入关联规则的算法对目标用户进行评分预测。首先,对利用Apriori算法输出的关联规则进行拆分,得到一对一、多对一两种形式的规则;其次,基于支持度和置信度构建推荐度计算方法;再次,形成引入关联规则的算法;最后,根据阈值选择相应的算法进行评分预测,将评分高的项目推荐给用户。实验结果表明:所提出的算法与传统协同过滤算法、基于用户平均值填充的协同过滤算法相比,在MAE、RMSE上都有明显下降,可以在一定程度上提高推荐质量。  相似文献   

6.
提出了一种关联规则挖掘大项集生成的并行和分布式处理的计算框架的算法,该算法以大规模事务数据库为基础,将数据有效地分片后作分布或者并行处理,通过节点之间的通信降低了节点间传输的数据量。通过算法实例验证了算法的正确性和可行性,可以在分布式或者并行环境里实现高效的数据挖掘。  相似文献   

7.
关联规则挖掘是数据挖掘中最活跃的研究方法之一.以高校教务信息管理系统为应用背景对采用改进的Apriori算法成绩数据库进行分析,得出课程相关性规则,在此基础上建立试卷质量综合包含评价指标体系,为高校试卷质量评价提供科学依据.该评价体系使不同专业的学习效果具有综合可比性,突破以往单一的平均成绩进行评价的局限性.  相似文献   

8.
提出一种将Apriori算法与散列技术和事务压缩技术相结合的改进算法,研究了散列函数的构造及其对算法效率的影响,分析了事务压缩技术的原理及其实现方法,用实例给出了原算法与改进算法的实现步骤,结果表明,新算法减小了存储空间,提高了算法的效率,并改进了数据挖掘技术的性能。  相似文献   

9.
提出了一种基于权函数的改进型关联规则算法——CWA priori算法。该算法利用决策属性在挖掘中的作用,归约数据源中无价值或价值较小的记录,从而缩短程序运行时间和节约数据存储空间,较好地改进了算法性能。实验结果证明CWA priori算法的效率明显高于A priori算法。  相似文献   

10.
运用KMV模型计算违约距离,作为度量我国上市公司信用风险的指标,并利用Apriori算法挖掘上市公司之间的信用风险传染.结果表明关联规则挖掘能直观有效地描述上市公司之间的信用风险传染,产生强关硖规则的上市公司之间信用风险传染较为明显.  相似文献   

11.
提出了基于链表的关联规则挖掘算法的基本思想,只需要扫描数据库一次.不产生候选项目集,也不使用逐层迭代的方法,利用链表的特性来提高挖掘效率.  相似文献   

12.
一种Apriori的改进算法   总被引:3,自引:0,他引:3  
在Apriori算法算法基础上提出改进的方法,通过减少产生候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时问的开销。  相似文献   

13.
图书馆如何分类排架,方便读者寻找感兴趣的图书,对构建以读者为中心的图书馆,具有重要的实践意义.在分析了关联规则数据挖掘技术的基础上,结合国家图书馆RFID技术应用实践,探讨了利用Apriori关联规则数据挖掘技术对读者借阅的图书分类信息进行关联挖掘的方法.从国家图书馆业务自动化集成系统中随机抽取读者借阅历史数据,编写了java程序,对样本数据进行了挖掘,并对挖掘结果进行了分析.研究表明,国家图书馆读者借阅文学、历史和技术类图书文献较多,关联度高,适当调整这几类书籍排架位置将会方便读者借阅.  相似文献   

14.
提出了基于散列技术的关联规则挖掘算法的基本思想,只需扫描数据库一次,不产生候选项目集,也不使用避层迭代的方法,利用散列文件组织的特性来提高挖掘效率.  相似文献   

15.
提出一种基于序列模式的告警关联分析模型,实现对攻击告警的分析。该模型预处理部分利用网络拓扑信息和告警属性相似度隶属函数对原始告警进行过滤和融合;在WINEPI算法的基础上,考虑告警数据库增长的情况,提出一种告警的增量式序列模式挖掘算法,用于关联规则发现;在线关联模块匹配规则库形成攻击场景图,并预测未知攻击事件。使用2000 DARPA攻击数据集测试表明,该模型能够明显改善入侵检测系统的性能,验证了模型和算法的有效性。  相似文献   

16.
介绍了关联规则挖掘算法Apriori及其在研究生专业课程间的关联规则发现中的应用,所发现的规则用于辅助新研究生进行个人学习计划制定。可减少研究生在个人学习计划制定中的盲目性,提高所选课程与学科专业研究方向的吻合度。  相似文献   

17.
从地理信息系统(GIS)的角度研究空间关联规则的挖掘算法,以GIS智能分析和辅助决策为主要应用,从单一数据层中的空间概念层次关系研究空间关联规则的挖掘算法,利用该算法对龙海市土地利用进行空间拓扑关系挖掘,得到一些有意义的空间关联规则,例如is_a园地∧adjacent_to交通用地→有居民区,以及is_a水域∧adjacent_to耕地^intersects交通用地→有居民区。  相似文献   

18.
针对高校图书推荐存在数据稀疏性和推荐结果质量不高的问题,提出了一种基于协同过滤的高校图书推荐算法.该算法利用图书分类号代替具体图书,应用改进的布尔型相似度计算方法,根据学院分组计算用户相似度,解决了数据稀疏性问题,提高了算法效率.通过定义课程计划、用户兴趣域和流行图书的影响力,建立了图书类别的评价模型.根据类别评价确定各类别推荐数量,提高了推荐结果的质量和多样性.实验结果表明,算法能够有效识别用户感兴趣的图书类别,并且图书推荐质量更好.  相似文献   

19.
采用关联规则挖掘网络数据包可以发现数据包中各属性字段间的频繁关系,通过模式的学习与训练可以发现网络用户的异常行为模式。采用作用度的Apriori-lift算法削减了Apriori算法的挖掘结果规则,使网络入侵检测系统可以快速的发现用户的行为模式,而且能够快速的锁定攻击者。Apnori—li蹲法提高了基于关联规则的入侵检测系统的检测性能。  相似文献   

20.
针对数据水平分布的关联规则隐私保护挖掘算法中隐私受损和挖掘效率较低的问题,提出一种由半诚实第三方参与的安全多方计算方法和快速分布式关联规则挖掘方法相结合的TSum FDM挖掘算法。为了防止水平分布下各个站点信息的泄漏,该算法引入半诚实的第三方参与计算过程,利用安全求和协议产生全局频繁项集。首先,每个站点接受的是上一个站点经过安全求和协议加密后传来的信息,并在计算过程中每个站点加入第三方随机生成的参数来隐藏实际被支持的频繁项集,最后将生成的结果传给第三方进行计算求得全局频繁项集,进而得到关联规则。实验结果表明,TSum FDM挖掘算法在保证水平分布各站点数据隐私不被泄露的前提下能够快速有效地挖掘关联规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号