共查询到18条相似文献,搜索用时 62 毫秒
1.
文章在对复杂数据组织形式的关联规则挖掘详细描述的基础上,探讨了其他学科领域对关联规则的理解及相应的研究方法,最后提出了关联规则的前沿研究问题和未来的发展趋势。 相似文献
2.
一、引言数据挖掘(Data Mining)是近年来随着人工智能和数据库技术的发展而出现的一门新兴学科。它是从大量的数据中筛选出隐含的、可信的、新颖的、有效的信息的高级处理过程。关联规则(Association Rule)是其中重要的研究课题,是数据挖掘的主要技术之一,也是在无指导学习系统 相似文献
3.
针对关联规则挖掘中Apriori算法在生成频繁项集时的不足,文章在对原始数据集预处理的基础上,提出了进一步修剪频繁项集修剪优化策略,减少了频繁项集的数目,提高了连接速度;另外通过增加项数统计字段和对不再使用的子项在数据库中标记或删除等方法使数据库数据规模不断减少,从而缩小搜索范围,提高扫描速度。 相似文献
4.
5.
宫颈癌是全世界女性发病率和死亡率位居第二的恶性肿瘤,文章对宫颈癌样本数据集进行关联规则的Apriori算法分析,得到准确有效的关联规则,为宫颈癌的筛查和诊断提供一种新的思路。结果表明:年龄、性行为、吸烟情况、荷尔蒙避孕药服用情况、节育环放置情况均会导致不同支持度和置信度的性病或癌症的发生,且性病发生和癌症诊断这两者之间也存在着紧密的联系和规则。 相似文献
6.
7.
对一个关联规则序贯抽样算法的改进与效率分析 总被引:1,自引:0,他引:1
本文提出Apriori和ASAR相结合的算法APASAR,给出该算法的理论停止时间的结果和证明,然后通过模拟实验比较APASAR,ASAR和BSAR三种不同算法的运行效率. 相似文献
8.
关联规则挖掘概述 总被引:3,自引:0,他引:3
中国人民大学统计学系数据挖掘中心 《统计与信息论坛》2002,17(5):4-9
文章讨论了关联规则的概念与分类 ,采用简单实例介绍了关联规则判断标准以及计算机实现过程等几方面内容 ,全面介绍了关联规则的相关知识 相似文献
9.
一、引言数据挖掘 (DataMining)是近年来数据库应用领域中相当热门的议题。数据挖掘一般是指在数据库中 ,利用各种分析方法与技术 ,将过去所累积的大量繁杂的历史数据进行分析、归纳与整合等工作 ,提取有用的信息 ,找出有意义并且对使用者有兴趣的样式 ,提供给企业管理阶层作为决策参考的依据。数据挖掘并不只是一种技术或是一套软件 ,而是一种结合数种专业技术的应用。我们对数据挖掘应有一个正确的认知 ,就是它并不是一个无所不能的魔法 ,而只是从资料中发掘出各种假设 (Hypothesis) ,它并不查证、确认这些假设 ,也不判断这些假设的价值… 相似文献
10.
11.
12.
13.
基于大数据规则挖掘的交通拥堵治理研究 总被引:4,自引:0,他引:4
随着中国城市机动车保有量的急剧增多,交通拥堵已经成为现代城市病。交通拥堵在道路网络中呈现向四周放射的传导特性,拥堵路段倾向于将拥堵扩散传导到其他相邻路段,该特性此前未被系统研究过,综合比较各种方法的适用性,从时间和大数据规则挖掘角度对拥堵建模;使用时间序列规则挖掘算法建立交通拥堵传导规律模型,并基于传导规则预测未来交通流状况;更重要的是,挖掘出来的拥堵传导规则直观可用,能够用于建立拥堵预警防治机制,完善道路路网建设规划中不合理的部分,从而达到提升交通效率的目的。研究结果证明本模型能够较好达到研究目的,挖掘出的拥堵传导规则可以精确分析交通拥堵状况并预测未来交通流状况,因此可以为交通拥堵治理决策提供重要参考。 相似文献
14.
文章试图将统计思想与(Rough)粗糙集理论相结合,针对事务性数据库属性项压缩问题提出了一些行之有效的方法,即基于重要性的属性压缩、基于相依性的属性压缩、属性项的广义线形分析及压缩、基于多重相关性的属性项压缩,以此达到数据库压缩之目的。 相似文献
15.
Data mining seeks to extract useful, but previously unknown, information from typically massive collections of non-experimental, sometimes non-traditional data. From the perspective of statisticians, this paper surveys techniques used and contributions from fields such as data warehousing, machine learning from artificial intelligence, and visualization as well as statistics. It concludes that statistical thinking and design of analysis, as exemplified by achievements in clinical epidemiology, may fit well with the emerging activities of data mining and 'knowledge discovery in databases' (DM&KDD). 相似文献
16.
17.
18.
现实中海量数据往往持续地产生,如何实现信息和知识的动态挖掘已成为人们关注的理论问题。根据数据集分批分步输入处理的思想,以Copula连接函数为理论基础,给出一种有效海量数据的关联分步测度算法,通过模拟实验验证了该算法的可行性,结果显示所设计的关联算法能显著提高关联效应测量的效率,并能有效地解决超海量数据关联效应的测度问题。 相似文献