首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 343 毫秒
1.
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的Top-N最频繁项集挖掘算法。同样,给出了几个命题和推论,并把它们用于该文算法以提高性能,实验结果表明,所提算法的规则有效率和时间性能优于NApriori算法和IntvMatrix算法。  相似文献   

2.
针对数据水平分布的关联规则隐私保护挖掘算法中隐私受损和挖掘效率较低的问题,提出一种由半诚实第三方参与的安全多方计算方法和快速分布式关联规则挖掘方法相结合的TSum FDM挖掘算法。为了防止水平分布下各个站点信息的泄漏,该算法引入半诚实的第三方参与计算过程,利用安全求和协议产生全局频繁项集。首先,每个站点接受的是上一个站点经过安全求和协议加密后传来的信息,并在计算过程中每个站点加入第三方随机生成的参数来隐藏实际被支持的频繁项集,最后将生成的结果传给第三方进行计算求得全局频繁项集,进而得到关联规则。实验结果表明,TSum FDM挖掘算法在保证水平分布各站点数据隐私不被泄露的前提下能够快速有效地挖掘关联规则。  相似文献   

3.
数据挖掘中数量关联规则挖掘的关键是连续属性离散化问题,本文基于规则约束,以兴趣度为依据,对数量关联规则的区间合并算法进行了研究。  相似文献   

4.
现有的数据挖掘算法和模型主要是基于大型数据库或数据仓库的环境,大多采用集中式处理.而目前绝大部分的大型数据库都是以分布式的形式存在的,因此,提出新的分布式关联规则挖掘算法是非常必要的.针对FDM算法中可能造成频繁项集丢失的缺点,提出了一种改进的分布式关联规则挖掘算法DARM,该算法同时也减少了各分站点间的通讯量,从而提高了整个挖掘算法的效率.  相似文献   

5.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,加权算法MINWAL(O)则需要多次扫描数据库,使得在通信网环境下挖掘关联规则的难度非常大。该文提出了一种高效的基于加权频繁模式树的通信网告警关联规则挖掘算法,算法性能测试表明,该算法与已有的加权关联规则挖掘算法相比较,节约了大量的存储空间,提高了算法的挖掘速度,对通信网的故障诊断和故障定位有着积极的意义。  相似文献   

6.
采用关联规则挖掘网络数据包可以发现数据包中各属性字段间的频繁关系,通过模式的学习与训练可以发现网络用户的异常行为模式。采用作用度的Apriori-lift算法削减了Apriori算法的挖掘结果规则,使网络入侵检测系统可以快速的发现用户的行为模式,而且能够快速的锁定攻击者。Apnori—li蹲法提高了基于关联规则的入侵检测系统的检测性能。  相似文献   

7.
适用于协议特征提取的关联规则改进算法   总被引:2,自引:0,他引:2  
借鉴关联规则挖掘的思想,引入序列项目集的概念,使算法能够处理集合事物和具有序列特性的项目;通过递推的方法依次得出不同长度的特征字段,并利用偏移属性集加以约束去除无效字段,有效控制约束频繁集的规模;最后依据选择策略从约束频繁集中选出最终的特征字段。实验结果表明只要选取合适的参数,用该方法提取协议特征是行之有效的。  相似文献   

8.
针对传统协同过滤算法过分依赖用户历史评分数据及评分数据存在严重稀疏性问题的情况,提出一种基于关联规则的协同过滤改进算法。该算法设置相似度阈值,计算近邻用户与目标用户之间的相似度,选取相似度最高的近邻用户组成邻居集,若邻居集中的所有近邻用户与目标用户的相似度都高于阈值则按照传统协同过滤进行评分预测,否则引入关联规则的算法对目标用户进行评分预测。首先,对利用Apriori算法输出的关联规则进行拆分,得到一对一、多对一两种形式的规则;其次,基于支持度和置信度构建推荐度计算方法;再次,形成引入关联规则的算法;最后,根据阈值选择相应的算法进行评分预测,将评分高的项目推荐给用户。实验结果表明:所提出的算法与传统协同过滤算法、基于用户平均值填充的协同过滤算法相比,在MAE、RMSE上都有明显下降,可以在一定程度上提高推荐质量。  相似文献   

9.
作为一种模糊关联规则挖掘算法,FP-growth算法在执行效率上明显优于Apriori算法。但是由于模糊属性的不足和空间复杂度较大,导致FP-growth算法在处理大型事务数据库,例如图书馆数据库时,无法实现有效的多层关联规则挖掘。因此,提出一种改进的FP-growth关联规则算法,能够快速向读者进行个性化图书推荐。首先,该算法把大型图书事务数据库根据首项的事务,划分为若干子数据库,并构建相应的子FP-tree结构;然后,采用实时过滤掉层次树中不是频繁项的父项来缩小扫描空间。实验结果表明:相比Apriori算法和标准FP-growth算法,提出的改进FP-growth关联规则算法在运行效率方面有明显提升,为图书的推荐工作提供了科学依据。  相似文献   

10.
本文讨论了基于 OL AP的关联规则挖掘的结构和相关技术。基于 OL AP的关联规则挖掘是 OL AP技术和高效的关联规则挖掘算法的结合。  相似文献   

11.
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数目常常是巨大的。该文介绍了原关联规则的概念,证明了传统算法挖掘出的关联规则集中的任何规则,均可以由原关联规则导出,而原关联规则的数目远远小于传统算法挖掘出的关联规则数目。文中给出产生原关联规则的算法并举例说明算法的执行过程。  相似文献   

12.
在一条成绩记录中包含了项目和与这些项目相关的成绩数值信息,这些数值信息可作为关联规则的一种约束而存在.基于上述问题,提出了一个基于模糊数值约束的关联规则挖掘方法,实际挖掘结果表明这种方法是有效的.  相似文献   

13.
论保障措施的实施要件   总被引:2,自引:0,他引:2  
中国按照WTO协议要求公布的《保障措施条例》与WTO的《保障措施协议》比较而言 ,该条例在保障措施实施要件的规定上与协议基本一致 ,但由于协议自身对实施要件的规定有待进一步具体化 ,因此 ,仅仅在立法层面与协议保持一致是不够的 ,有必要结合WTO的有关案例对保障措施的实施要件做深入研究 ,使中国对于这项法律制度能够充分认识、正确运用 ,从而达到在国际贸易中维护自身权益的目的  相似文献   

14.
一种Apriori的改进算法   总被引:3,自引:0,他引:3  
在Apriori算法算法基础上提出改进的方法,通过减少产生候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时问的开销。  相似文献   

15.
会计政策选择贯穿于企业整个会计过程。而它并不单纯是会计技术、方法问题 ,更本质的是涉及非会计技术因素 ,是一种经济利益的博弈规则和利益分享的要求 ,是企业管理当局处理、协调各方面的矛盾 ,分配经济利益的重要措施。选择不同的会计政策 ,会产生不同的会计信息 ,进而产生不同的利益分配格局。  相似文献   

16.
介绍了关联规则挖掘算法Apriori及其在研究生专业课程间的关联规则发现中的应用,所发现的规则用于辅助新研究生进行个人学习计划制定。可减少研究生在个人学习计划制定中的盲目性,提高所选课程与学科专业研究方向的吻合度。  相似文献   

17.
运用KMV模型计算违约距离,作为度量我国上市公司信用风险的指标,并利用Apriori算法挖掘上市公司之间的信用风险传染.结果表明关联规则挖掘能直观有效地描述上市公司之间的信用风险传染,产生强关硖规则的上市公司之间信用风险传染较为明显.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号