共查询到20条相似文献,搜索用时 15 毫秒
1.
一、引言数据挖掘是当前数据库技术领域的重点研究内容,其中关联规则挖掘算法尤为引人注目。目前,关联规则及挖掘算法研究的热点主要是如何提高发现频繁项集的效率,而对如何由频繁项集生成关联规则却很少涉及。对由频繁项集生成关联规则的过程进 相似文献
2.
Web使用挖掘在网站优化中的应用研究 总被引:1,自引:0,他引:1
针对互联网用户访问Web服务器产生的日志,结合Web使用挖掘相关理论,采用Apriori算法挖掘用户的频繁访问模式.首先进行数据预处理以保证数据的质量及提高挖掘的效率;然后对预处理后的数据采用Apriori算法进行关联规则挖掘,找出其中的频繁访问模式;最后分析结果,总结规则,提出建议. 相似文献
3.
常规的电力企业财务信息异常数据挖掘方法以集群挖掘与分段挖掘为主,同一类别的异常数据挖掘效率较低,影响财务数据整合效果。因此,本文设计了基于关联规则算法的电力企业财务信息异常数据智能挖掘方法。此方法标注电力企业财务信息数据挖掘异常点,建立电力企业财务信息数据集,逐步探查数据集中的异常数据,并将异常数据汇总到一个数据单元中,形成财务信息数据异常点。本文基于关联规则算法挖掘电力财务异常频繁项集,在电力财务数据异常点中,挖掘出存在价值的信息,确保异常数据挖掘的准确性。采用对比实验,验证了该方法的数据挖掘准确性更高,能够应用于电力企业财务管理工作中。 相似文献
4.
研究了入侵检测中关联规则挖掘技术,在Apriori算法的基础上,提出了一种新的算法,该算法将FP-tree映射成为FP-array,那么绝大部分运算是运用布尔逻辑运算完成的,解决了频繁构造条件FP一树的巨大处理开销,从而大大提高关联规则挖掘效率。 相似文献
5.
使用Web数据挖掘技术对用户需求进行分析,其中实现Web信息个性化使用的是关联规则,这一规则能够为用户提供个性化服务,目前已成为Web应用技术的研究热点。该文分析了应用于个性化推荐的Web页面关联规则的特点,对Web数据挖掘技术常用的关联推荐算法进行探讨,内容主要涉及到Web数据挖掘技术、关联推荐算法的思路、算法分析。 相似文献
6.
7.
8.
9.
FP-Gfowlth是频繁模式挖掘的经典算法,能够在不产生候选集的情况下生成所有的频繁模式,效率与Apri-ori算法相比有巨大提高,然而FP-Growth算法在挖掘频繁模式过程中需要递归构建大量的条件FP-tree,并分别针对这些条件FP-tree进行挖掘,时间及空间效率不高,在实际应用中存在很大局限性.计算机集群是由多台普通计算机设备通过特定方式结合在一起构成的并行处理系统,属于分布式计算环境,具有计算能力强大、性价比高、灵活等优势.本文提出一种面向计算机集群的并行挖掘算法Gridify FP-Growth,该算法以FP-Growth为基础,通过任务划分的形式.将计算任务分配到计算机集群中各个计算节点上执行,充分利用各个节点的计算资源,最后汇总各节点的计算结果.实验证明Gridify FP-Growth算法不会牺牲计算的准确性,并可以大幅度缩短计算时间,有效缓解计算大规模数据库时的内存压力. 相似文献
10.
在数据库中挖掘定量关联规则的方法研究 总被引:12,自引:3,他引:9
数据挖掘技术是实现智能决策支持系统的一个重要手段 ,关联规则是数据挖掘的一个重要内容 .传统的 Apriori算法仅适用于挖掘数据间的定性关联关系 ,但数据间的定量关联关系对决策更有帮助 .属性值的离散映射是挖掘定量关联规则的一个重要环节 ,离散映射中属性值区间的划分粒度是影响数据挖掘质量的一个重要因素 .本文结合粗集理论提出了一个确定属性值划分粒度的方法 ,在此基础上设计出一个挖掘定量关联规则的算法 :Apriori 2 ,利用Apriori 2可以挖掘出大量对决策有帮助的定量关联规则 相似文献
11.
为预测经营活动中的客户需求,提出一种基于正相关关联规则的数据挖掘模型.挖掘统计数据的频繁2_项集并对挖掘结果剪枝处理,按照特征需求重要性大小,计算得出重要客户需求,再运用BP神经网络进行需求权值预测.实例表明该方法可减少关联规则数量和挖掘工作量,对需求的预测具有现实意义. 相似文献
12.
随着信息时代的飞速发展,被审计单位财务和业务数据量爆炸式增长,审计技术必须不断发展和创新以适应信息时代审计的新要求.本文在这一背景下,对审计技术的创新作了探索性的研究,主要通过Benford法则和Apriori算法的关联数据挖掘的技术手段在审计中的应用,探讨了如何在被审计单位海量数据中进行挖掘分析,从而发现有业务意义的强规则,通过这些强规则解释数位发生偏离的原因,从而快速发现审计疑点. 相似文献
13.
针对评价指标数据的特点,构造了一种基于云模型的数值型关联规则挖掘算法,并将其运用于企业转型战略风险预警。首先运用云模型约简评价指标;然后,采用属性空间软划分方法对定量型属性的定义域进行划分,使定量型关联规则挖掘转换为定性关联规则挖掘,此基础上提取规则模版;最后采用有规则约束的Apriori算法挖掘云关联规则,并对检验样本风险等级进行判别。实证分析结果表明,与标准BP神经网络模型相比,该模型是一种更为有效和实用的战略风险预警工具。 相似文献
14.
利用股票的大量历史数据发现规律从而预测股票走势,成为热门的研究课题。为了能更好地观察国内申万行业指数间的联动性与轮动性,同时针对股票的滞后性效应问题,有学者提出了一种基于时间序列的关联规则挖掘算法。文章通过关联规则及其算法,挖掘出我国2010年3月到2022年6月申万行业指数交易数据间的关联现象,从而获得有意义的关联规则,为后期制定投资策略打下基础。 相似文献
15.
针对高校网上选课工作中遇到的一些实际矛盾,本文将关联规则挖掘算法应用于选课指导系统中,对系统中存储的大量数据进行挖掘,从中提取出潜在的有用的信息,为高校选修课的开设及学生选课行为提供决策支持. 相似文献
16.
17.
电子商务中基于Q学习的动态交叉销售方法 总被引:1,自引:0,他引:1
动态交叉销售是电子商务中的一种新型营销手段.在已知关联规则和商品库存水平的情况下,要研究两个决策问题:(1)如何选择交叉销售的商品组合(2)如何为商品组合确定合理的价格,从而使经销商获得最大收益.首先将动态交叉销售映射为事件驱动的马氏决策过程模型,其次结合关联规则理论提出了知识驱动的 Q-学习算法,K-Q-learning,用该算法来求解动态交叉销售问题具有较高的效率和效用. 相似文献
18.
中国股票关联网络拓扑性质与聚类结构分析 总被引:4,自引:0,他引:4
复杂网络理论是研究股票市场内在结构和功能的有力工具,股票关联网络的拓扑性质和聚类结构对于理解网络的形成机制、发生在网络上的动力学行为具有重要意义.以中国上证180指数和深证100指数成分股票为研究标的,运用最小生成树算法和平面最大过滤图算法构建相应的股票关联网络,分析网络的基本拓扑统计性质和聚类结构.实证研究表明,平面最大过滤图关联网络为小世界网络,各关联网络内股票的影响强度服从幂律分布,股票之间存在的异类匹配模式揭示了市场内股票价格波动传导的过程,对最小生成树关联网络和平面最大过滤图关联网络的宗派和派系聚类分析能有效地挖掘股票之间的聚类结构信息,总体上看平面最大过滤图算法优于最小生成树算法,且实证结论对沪深股票市场具有普适性. 相似文献
19.
20.
将遗传网络规划用于解决数据挖掘中的关联规则问题。相对于传统的关联规则挖掘算法,基于遗传网络规划的方法通过其中的遗传算子能够以递增的方式发现关联规则,从而避免了传统方法需要将全部数据库遍历才能得到规则的局限性。通过将要挖掘的关联规则定义为事务间的关联规则,以解决股票市场中的价格预测问题。 相似文献