首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
频繁项目集发现一直都是关联规则研究领域中最繁项目集发现算法,该算法的特别之处在于事先利用有向图进行的一次数据预处理,在预处理过程中将数据库预先存贮为每个结点都有一个域来记录其支持度的项目集邻接网络,从而把复杂的频繁项目集的发现问题转化为简单的图中搜索问题,这就大大提高了频繁项目集发现过程的效率.同时为了有效地解决预处理过程中的项目集支持度计算问题,采用了一种纵向的数据库表示格式.最后对所采用的算法给出实验结果.  相似文献   

2.
研究了入侵检测中关联规则挖掘技术,在Apriori算法的基础上,提出了一种新的算法,该算法将FP-tree映射成为FP-array,那么绝大部分运算是运用布尔逻辑运算完成的,解决了频繁构造条件FP一树的巨大处理开销,从而大大提高关联规则挖掘效率。  相似文献   

3.
武坤  魏涛 《科学咨询》2009,(11):36-37
数据挖掘是当前数据库技术领域的重点研究内容,其中关联规则挖掘算法尤为引人注目.目前,关联规则及挖掘算法研究的热点主要是如何提高发现频繁项集的效率,而对如何由频繁项集生成关联规则却很少涉及.对由频繁项集生成关联规则的过程进行改进,将会有效提高生成关联规则的效率.  相似文献   

4.
一种基于粗糙集理论的规则获取算法   总被引:17,自引:0,他引:17  
获取规则是数据挖掘中的一项重要技术 ,根据粗糙集理论及决策值归纳函数的概念 ,可以把不相容的决策系统转化为相容的决策系统 ,并提出规则参数的合并方法 .在此基础上 ,利用决策矩阵和决策函数 ,提出了一种在决策系统中获取规则的算法 .同传统的算法相比 ,该算法得出的规则集没有信息丢失的现象发生 .最后以例子作了说明 .  相似文献   

5.
人工蜂群算法是一种模拟蜜蜂群智能搜索行为的随机优化算法,已被成功用于解决许多优化问题。该文针对基本人工蜂群算法在收敛速度和局部寻优方面存在的缺点,提出了一种具有平衡能力的改进算法。此算法在观察蜂阶段引入惯性权重,使用随着迭代次数动态变化的惯性权重因子来平衡种群的局部搜索和全局探测能力,防止算法陷入局部最优和加快寻优速度;在侦察蜂阶段(scout bees),则利用正弦函数搜索操作,正弦函数服从均匀分布,能很好地搜索全部范围,以提高种群多样性。通过对5个基准测试函数进行仿真实验,并与原算法进行比较,结果表明,改进的算法在收敛速度和搜索精度上基本优于人工蜂群算法。  相似文献   

6.
基于粗集理论的一种归纳学习算法   总被引:2,自引:0,他引:2  
归纳学习是粗集理论的主要应用领域.本文基于粗糙集理论,针对相容决策表,提出一种新的归纳学习算法.与以往的方法相比,这种算法比较简单,能够全面地获取规则且没有冗余.此外,还讨论了不相容决策表的学习,给出了具有较高可信度的规则挖掘过程.  相似文献   

7.
一种改进的TSP问题启发式算法   总被引:6,自引:0,他引:6  
旅行推销商问题(TSP)属于组合优化领域中一个典型的NP Hard问题。本文在最近城市搜索法的基础上,提出一种改进的启发式算法———两端延伸最近城市搜索法,这种方法能够很快得到最优解(近优解),且大大降低了计算复杂度。同时,对TSP问题进行了分类,并给出相应的启发式解法。  相似文献   

8.
文章针对目前电子商务信息机密性保障机制的安全缺陷,提出了每次会话都重新协定一个对称密钥,利用离散对数不能求解的理论基础和实现方法来替换有安全缺陷的部分,从而进一步提高了电子商务信息的安全性。  相似文献   

9.
提出了一种改进的直接概率准则匹配算法,该算法以贝叶斯估计、马尔科夫过程和蒙特卡洛理论为基础,通过对状态样本在搜索区域采样来模拟概率的分布。仿真结果说明改进PMF算法在搜索区域分辨率一定的情况下,能够利用基本导航信息和水下地形信息对航行器的位置进行估计。  相似文献   

10.
本文的重点在于探索一种进行数据挖掘的方法,从而让数据挖掘更加高效而精准。本文设想,如果将网络上的各种信息按照某种编码的方法进行排序,那么这些信息就可以利用二分查找法来进行数据挖掘,以提高数据搜索速度。具体的实现方法有待进一步的研究与探索。  相似文献   

11.
数据缺失会显著降低信用评估模型的准确性和可用性,尤其是多变量同时有数据缺失时。本文针对模型应用阶段的多变量数据缺失问题,提出了一种新的数据填补算法。该算法由两阶段构成:准备阶段和数据填补阶段。在准备阶段,算法基于朴素贝叶斯方法以初始数据集进行训练,对每个可能缺失的变量构建起相应的单变量预测估计模型;而数据填补阶段则借鉴了EM算法的思想,利用前期的单变量预测估计模型,对给定的多变量数据缺失样本进行交替迭代,逐步填补更新。理论证明,该算法具有单调收敛性。以人人贷数据集和UCI提供的德国和澳大利亚两个信用评估基准数据集为例,将其与众数填补法、EM填补法进行性能对比实验,结果表明本文方法的数据还原性能和填补后信用评估准确性都明显更优。这为解决信用评估时的数据多变量缺失问题提供了一种更好的处理方法。  相似文献   

12.
Surveillance of hospital-acquired infections, especially those caused by antibiotic resistant bacteria, is an important component of hospital infection control. A computer program for this purpose experienced a combinatorial computational explosion in time and space when processing data describing certain multi-drug resistant organisms. The blowup occurred while the program was generating frequent sets, a common phase in data mining algorithms. We present a modified algorithm for computing frequent sets that more efficiently handles the computational burden. The algorithm's proof of correctness involves the concepts of closure, independent sets, and circuits in a space more general than a matroid. Of central concern in the theory are inferences about a closure operation that can be obtained from limited information about the circuits.  相似文献   

13.
We present an O(n3)-time randomized approximation algorithm for the maximum traveling salesman problem whose expected approximation ratio is asymptotically , where n is the number of vertices in the input (undirected) graph. This improves the previous best.Part of work done while visiting City University of Hong Kong.  相似文献   

14.
A data flow machine is said to be synchronized if for any vertex u in the underlying data flow graph, all inputs to vertex u arrive at the same time. An unsynchronized data flow machine with an acyclic underlying data flow graph can be transformed into a synchronized system by adding unit delay buffers to the system. This synchronization process can increase pipelining and throughout. Since the addition of delay buffers introduces hardware and area costs, it is desirable to insert the minimum number of delay buffers to synchronize a given data flow machine. Due to important applications in computer design, various delay buffer minimization problems have been studied by many researchers. Several optimal algorithms and heuristic algorithms have been proposed for slightly different models. In this paper, we introduce the concept of extensions of a directed acyclic graph to generalize and formalize several delay buffer minimization problems studied in the literature and present a polynomial time algorithm for computing the minimum delay buffer synchronization of a given data flow machine. Examples are provided to illustrate our algorithm and to show that our algorithm requires fewer delay buffers than previously published optimal algorithms for various models.  相似文献   

15.
利用上凸函数对决策树算法的改进   总被引:1,自引:0,他引:1  
针对决策树分类方法的计算效率进行深入研究,根据信息增益计算的特点,引入了上凸函数的概念,用于提高决策树分类过程中信息增益的计算效率。利用我们所提出的“一致性定理”和“特殊一致性定理”,从理论上证明了利用上凸函数对信息增益计算进行改进后,构造的决策树与原决策树具有相同的分类准确率。同时我们通过对大数据集的实验,发现在相同规模的数据集下,改进后的决策树算法比原算法有更高的计算效率,并且这种计算效率的提高有随着数据集规模的增加而增加的趋势。  相似文献   

16.
突发公共事件信息具有海量、分散、多样和复杂等特性。现代化管理信息系统的信息采集、存储、分析和管理功能可以提高突发公共事件的处理效率和决策水平。本文探讨了国内外基于数据挖掘和智能知识的突发公共事件信息管理研究情况及如何建立一个系统的公共事件信息管理框架,为突发公共事件的变化趋势进行预测和事件信息收集、处理、知识获取、事件评估、决策和应急管理工作提供科学依据和支持。  相似文献   

17.
最短时限运输问题及解法   总被引:17,自引:0,他引:17  
提出了存在于实际中的最短时限运输问题,研究了其解的最优性充分条件,并给出了求解这一问题的具体步骤,最后用实例说明了解法的可操作性,该解法是解决这一类问题的一个好算法。  相似文献   

18.
Breakpoint graph decomposition is a crucial step in all recent approximation algorithms for SORTING BY REVERSALS, which is one of the best-known algorithmic problems in computational molecular biology. Caprara and Rizzi recently improved the approximation ratio for breakpoint graph decomposition from to + 1.4348 + , for any positive . In this paper, we extend the techniques of Caprara and Rizzi and incorporate a balancing argument to further improve the approximation ratio to + 1.4193 + , for any positive . These improvements imply improved approximation results for SORTING BY REVERSALS for almost all random permutations.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号