首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
研究了入侵检测中关联规则挖掘技术,在Apriori算法的基础上,提出了一种新的算法,该算法将FP-tree映射成为FP-array,那么绝大部分运算是运用布尔逻辑运算完成的,解决了频繁构造条件FP一树的巨大处理开销,从而大大提高关联规则挖掘效率。  相似文献   

2.
Web使用挖掘在网站优化中的应用研究   总被引:1,自引:0,他引:1  
针对互联网用户访问Web服务器产生的日志,结合Web使用挖掘相关理论,采用Apriori算法挖掘用户的频繁访问模式.首先进行数据预处理以保证数据的质量及提高挖掘的效率;然后对预处理后的数据采用Apriori算法进行关联规则挖掘,找出其中的频繁访问模式;最后分析结果,总结规则,提出建议.  相似文献   

3.
武坤  魏涛 《科学咨询》2009,(11):36-37
数据挖掘是当前数据库技术领域的重点研究内容,其中关联规则挖掘算法尤为引人注目.目前,关联规则及挖掘算法研究的热点主要是如何提高发现频繁项集的效率,而对如何由频繁项集生成关联规则却很少涉及.对由频繁项集生成关联规则的过程进行改进,将会有效提高生成关联规则的效率.  相似文献   

4.
常规的电力企业财务信息异常数据挖掘方法以集群挖掘与分段挖掘为主,同一类别的异常数据挖掘效率较低,影响财务数据整合效果。因此,本文设计了基于关联规则算法的电力企业财务信息异常数据智能挖掘方法。此方法标注电力企业财务信息数据挖掘异常点,建立电力企业财务信息数据集,逐步探查数据集中的异常数据,并将异常数据汇总到一个数据单元中,形成财务信息数据异常点。本文基于关联规则算法挖掘电力财务异常频繁项集,在电力财务数据异常点中,挖掘出存在价值的信息,确保异常数据挖掘的准确性。采用对比实验,验证了该方法的数据挖掘准确性更高,能够应用于电力企业财务管理工作中。  相似文献   

5.
一、引言数据挖掘是当前数据库技术领域的重点研究内容,其中关联规则挖掘算法尤为引人注目。目前,关联规则及挖掘算法研究的热点主要是如何提高发现频繁项集的效率,而对如何由频繁项集生成关联规则却很少涉及。对由频繁项集生成关联规则的过程进  相似文献   

6.
本文针对DBSCAN算法在计算速度方面的瓶颈,提出了一种新的基于内存的并行DBSCAN算法:合理划分数据库,各个处理器并行聚类,之后合并聚类结果,可以达到很好的聚类结果效果和计算效率。通过对一台双核计算机的实验,发现实验速度可以提高50%左右。  相似文献   

7.
CLOSET算法是一种挖掘频繁闭项集的有效算法。本文分析了CLOSET算法在闭合性检查以及剪枝效率方面的一些不足,并针对这些问题,引入共生项集的概念,利用共生项集的一些性质,提出了一种基于共生项集的改进算法。  相似文献   

8.
一种求解时变条件下有宵禁限制最短路的算法   总被引:1,自引:0,他引:1  
在组合优化过程中,往往需要获得从起点到终点之间的最短路.由于道路、天气、交通条件等因素的影响,使得网络具有很强的时变特性.同时,对于网络中的节点往往有宵禁的限制.对时变条件下有宵禁限制并有到达时间限制的最短路进行了研究,建立了软、硬宵禁限制下的数学模型,给出并证明了时变条件下获得有宵禁限制最短路的最优条件,并设计了求解的多项式算法,通过此算法可以获得时变条件下有宵禁限制的最短路.同时,算法和模型还考虑了不同的起点出发时间,使路径决策者可以根据自身的情况,选择合适的出发时间和路径.最后给出了一个应用算例,分析了宵禁对于获得的最短路的影响.  相似文献   

9.
项目调度是实现项目资源优化配置的重要手段。项目执行时往往面临大量不确定因素,并呈现出典型的多模式特性,给项目调度带来了很大挑战。鉴于此,本文研究活动工期不确定条件下的多模式资源受限项目调度问题,建立了该问题的马尔科夫决策过程模型。为了高效求解上述模型,设计了基于Rollout的近似动态规划算法。该算法可以在项目执行过程中根据最新的项目状态动态给出调度方案,从而有效优化项目期望工期。在所提算法中,利用“活动—模式”列表与并行调度机制相结合的启发式算法构建基准策略,并设计了基于离散时间马尔科夫链的动态仿真,以进一步提升算法性能。基于公开的项目调度问题库PSPLIB,通过大规模计算实验分析了本文算法的性能,探讨了多种因素对调度效果的影响。  相似文献   

10.
频繁项目集发现一直都是关联规则研究领域中最繁项目集发现算法,该算法的特别之处在于事先利用有向图进行的一次数据预处理,在预处理过程中将数据库预先存贮为每个结点都有一个域来记录其支持度的项目集邻接网络,从而把复杂的频繁项目集的发现问题转化为简单的图中搜索问题,这就大大提高了频繁项目集发现过程的效率.同时为了有效地解决预处理过程中的项目集支持度计算问题,采用了一种纵向的数据库表示格式.最后对所采用的算法给出实验结果.  相似文献   

11.
基于蚁群算法的群体用户兴趣导航路径发现   总被引:3,自引:0,他引:3  
在电子商务的发展进程中,如何准确理解用户访问网站的行为是一个紧迫的问题.Web使用挖掘是解决该问题的重要研究方法.发现用户的兴趣导航模式是Web使用挖掘的一个重要研究领域,也是优化Web站点框架设计的根本方法.在本文中,我们把Web用户看成是人工的蚂蚁,应用蚁群算法来发现用户的导航模式.首先,建立了一个Web站点模型;然后基于蚁群算法和Web日志数据建立了一个用户导航模型;最后,设计了一个算法,将所有的访问用户视为整体来挖掘他们偏好的导航路径.实验结果表明该方法能准确反映出用户的浏览兴趣.  相似文献   

12.
Surveillance of hospital-acquired infections, especially those caused by antibiotic resistant bacteria, is an important component of hospital infection control. A computer program for this purpose experienced a combinatorial computational explosion in time and space when processing data describing certain multi-drug resistant organisms. The blowup occurred while the program was generating frequent sets, a common phase in data mining algorithms. We present a modified algorithm for computing frequent sets that more efficiently handles the computational burden. The algorithm's proof of correctness involves the concepts of closure, independent sets, and circuits in a space more general than a matroid. Of central concern in the theory are inferences about a closure operation that can be obtained from limited information about the circuits.  相似文献   

13.
医疗决策案例中非连续性属性信息大量存在,含该类信息的案例知识发现是多属性案例决策的关键和难点。该文研究了含非连续性属性信息案例中的决策知识发现,将条件概率和GAs融合技术整合到案例推理方法之中,开发了KNN的延伸方法--CRMGACP法。该方法的核心是基于Gas进行权重获取和基于融合条件概率的改进相似度算法进行案例知识获取。在某大型综合医院收集数据,获取有效数据300条,基于VC++开发实现的BC-CBRsys平台进行了实验研究,结果表明CRMGACP比其他常见方法具有更好的性能,在多个统计指标上展示出显著的优势。显然,改进的案例决策方法克服了含非连续性信息案例决策知识难以获取的问题,在临床决策领域具有广阔的前景。  相似文献   

14.
本文针对传统关联规则挖掘算法产生大量冗余规则,提出了对关联规则结果进行二次挖掘,并设计了算法对挖掘出的关联规则进行聚类,然后基于已有领域知识对聚类后的关联规则进行新颖度评价,对于新颖度较高价值较大的关联规则可以存储于领域知识库用于决策使用或再次挖掘过程。该算法有效的减少的规则的数量,提高了规则的新颖性和精确度,对商业应用具有很高的价值。文章最后使用UCI开源数据进行了实验分析,并验证了该算法的有效性。  相似文献   

15.
This paper proposes a new nested algorithm (NPL) for the estimation of a class of discrete Markov decision models and studies its statistical and computational properties. Our method is based on a representation of the solution of the dynamic programming problem in the space of conditional choice probabilities. When the NPL algorithm is initialized with consistent nonparametric estimates of conditional choice probabilities, successive iterations return a sequence of estimators of the structural parameters which we call K–stage policy iteration estimators. We show that the sequence includes as extreme cases a Hotz–Miller estimator (for K=1) and Rust's nested fixed point estimator (in the limit when K→∞). Furthermore, the asymptotic distribution of all the estimators in the sequence is the same and equal to that of the maximum likelihood estimator. We illustrate the performance of our method with several examples based on Rust's bus replacement model. Monte Carlo experiments reveal a trade–off between finite sample precision and computational cost in the sequence of policy iteration estimators.  相似文献   

16.
We adapt the expectation–maximization algorithm to incorporate unobserved heterogeneity into conditional choice probability (CCP) estimators of dynamic discrete choice problems. The unobserved heterogeneity can be time‐invariant or follow a Markov chain. By developing a class of problems where the difference in future value terms depends on a few conditional choice probabilities, we extend the class of dynamic optimization problems where CCP estimators provide a computationally cheap alternative to full solution methods. Monte Carlo results confirm that our algorithms perform quite well, both in terms of computational time and in the precision of the parameter estimates.  相似文献   

17.
中国股市弱有效吗?——来自数据挖掘的实证研究   总被引:8,自引:0,他引:8  
已有的有效性检验方法大都基于某个全局性的数学模型,忽略了序列中某些局部模式的预测作用,由此得出“市场有效”的结论有失偏颇。本文采用一种新的时间序列数据挖掘方法TSEOPM,寻找时间序列中具有预测作用的局部征兆模式,并用其实证我国沪、深A股市场近年来收益的短期可预测性,结果表明基于局部征兆模式获得的收益显著好于非征兆模式,通过历史价格分析可以带来一定的短期超额收益,因而说明我国股市还没有达到弱有效。  相似文献   

18.
A major restriction on the use of decision analysis in practice is the frequent difficulty of determining a decision maker's multiattribute utility function. The assessment process can be complex and tedious and generally involves: (1) identifying relevant independence conditions, (2) assessing conditional utility functions, (3) assessing scaling constants, and (4) checking for consistency. Some of the assessment and modeling complexities encountered include an assessor's inability to respond in a quantitatively meaningful and consistent way to hypothetical gambles and an analyst's problem in selecting an appropriate functional form that accurately characterizes the conditional utility assessments. A simplified procedure that mitigates these difficulties is proposed. This procedure facilitates the determination of scaling constants by obtaining (via mathematical programming) a multiattributed measurable value function which is converted to a multiattributed utility function. The methodology can be developed advantageously to produce an interactive software package for use as an assessment aid.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号