期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

来升强朱建平《统计与信息论坛》2005,20(3):16-20,32

文章在对复杂数据组织形式的关联规则挖掘详细描述的基础上,探讨了其他学科领域对关联规则的理解及相应的研究方法,最后提出了关联规则的前沿研究问题和未来的发展趋势。相似文献

2.

郑晶晶朱建平《统计与信息论坛》2006,21(1):93-96

一、引言数据挖掘(Data Mining)是近年来随着人工智能和数据库技术的发展而出现的一门新兴学科。它是从大量的数据中筛选出隐含的、可信的、新颖的、有效的信息的高级处理过程。关联规则(Association Rule)是其中重要的研究课题,是数据挖掘的主要技术之一,也是在无指导学习系统相似文献

3.

关联规则挖掘中查找频繁项集的改进算法

张启徽《统计与决策》2015,(4):32-35

针对关联规则挖掘中Apriori算法在生成频繁项集时的不足,文章在对原始数据集预处理的基础上,提出了进一步修剪频繁项集修剪优化策略,减少了频繁项集的数目,提高了连接速度;另外通过增加项数统计字段和对不再使用的子项在数据库中标记或删除等方法使数据库数据规模不断减少,从而缩小搜索范围,提高扫描速度。相似文献

4.

基于Apriori算法的关联规则数据挖掘研究

王培吉赵玉琳吕剑峰《统计与决策》2011,(23)

关联规则挖掘是数据挖掘中重要的研究课题,Apriori算法是关联规则挖掘的最有影响的算法。针对Apriori算法中频繁项集产生效率低和产生无用规则、丢失有用规则两个核心问题,文章给出了分辨矩阵、分辨向量、兴趣度、含负属性项关联规则并提出了改进的Apriori算法。该算法能有效提高频繁集的产生效率和产生更为合理的关联规则。相似文献

5.

基于关联规则的医疗数据挖掘研究

陈治吴娟娟《统计与决策》2020,(6):174-177

宫颈癌是全世界女性发病率和死亡率位居第二的恶性肿瘤,文章对宫颈癌样本数据集进行关联规则的Apriori算法分析,得到准确有效的关联规则,为宫颈癌的筛查和诊断提供一种新的思路。结果表明:年龄、性行为、吸烟情况、荷尔蒙避孕药服用情况、节育环放置情况均会导致不同支持度和置信度的性病或癌症的发生,且性病发生和癌症诊断这两者之间也存在着紧密的联系和规则。相似文献

6.

数据挖掘中关联规则的提升及其应用 总被引：3，自引：0，他引：3

下载免费PDF全文

朱建平谢邦昌《统计研究》2004,2(12):34-6

一、关联规则的统计意义关联规则挖掘的研究是近几年研究较多的数据挖掘方法,在数据挖掘中的各种方法中应用的也最为广泛.关联规则的概念首先是由Agrawal,R.,Imieliski,T.and Swa-mi,A.(1993)提出,关联规则挖掘的主要对象是事务数据库. 相似文献

7.

对一个关联规则序贯抽样算法的改进与效率分析 总被引：1，自引：0，他引：1

王星《统计与决策》2005,(6):8-10

本文提出Apriori和ASAR相结合的算法APASAR,给出该算法的理论停止时间的结果和证明,然后通过模拟实验比较APASAR,ASAR和BSAR三种不同算法的运行效率. 相似文献

8.

关联规则挖掘概述 总被引：3，自引：0，他引：3

中国人民大学统计学系数据挖掘中心《统计与信息论坛》2002,17(5):4-9

文章讨论了关联规则的概念与分类 ,采用简单实例介绍了关联规则判断标准以及计算机实现过程等几方面内容 ,全面介绍了关联规则的相关知识相似文献

9.

数据挖掘与其他技术的比较 总被引：4，自引：0，他引：4

下载免费PDF全文

朱世武崔嵬张尧庭谢邦昌《统计研究》2003,20(7):58-4

一、引言数据挖掘 (DataMining)是近年来数据库应用领域中相当热门的议题。数据挖掘一般是指在数据库中 ,利用各种分析方法与技术 ,将过去所累积的大量繁杂的历史数据进行分析、归纳与整合等工作 ,提取有用的信息 ,找出有意义并且对使用者有兴趣的样式 ,提供给企业管理阶层作为决策参考的依据。数据挖掘并不只是一种技术或是一套软件 ,而是一种结合数种专业技术的应用。我们对数据挖掘应有一个正确的认知 ,就是它并不是一个无所不能的魔法 ,而只是从资料中发掘出各种假设 (Hypothesis) ,它并不查证、确认这些假设 ,也不判断这些假设的价值… 相似文献

10.

数据挖掘的聚类方法 总被引：3，自引：0，他引：3

万星火檀亦丽《统计与决策》2005,(18):125-126

聚类是数据挖掘领域中的一个重要研究课题.本文介绍了数据挖掘领域中对聚类分析的典型要求、主要规则及数据挖掘领域中的聚类的有效性衡量. 相似文献

11.

流式数据挖掘的现状及统计的研究趋势

下载免费PDF全文

朱建平来升强《统计研究》2007,24(7):84-87

摘　　要:本文对近年来在国内外学术界涌现出的流式数据挖掘的研究成果进行剖析,分析了流式数据挖掘的研究现状。在此基础上,提出了统计学在流式数据挖掘研究中的发展趋势,以便更好地促进统计学和数据挖掘的结合,拓展统计学方法的研究思路。相似文献

12.

基于聚类关联规则的缺失数据处理研究 总被引：2，自引：1，他引：2

下载免费PDF全文

方匡南谢邦昌《统计研究》2011,28(2):87-92

本文提出了基于聚类和关联规则的缺失数据处理新方法,通过聚类方法将含有缺失数据的数据集相近的记录归到一类,然后利用改进后的关联规则方法对各子数据集挖掘变量间的关联性,并利用这种关联性来填补缺失数据。通过实例分析,发现该方法对缺失数据处理,尤其是海量数据集具有较好的效果。相似文献

13.

基于大数据规则挖掘的交通拥堵治理研究 总被引：4，自引：0，他引：4

周辉宇《统计与信息论坛》2017,(5):96-101

随着中国城市机动车保有量的急剧增多,交通拥堵已经成为现代城市病。交通拥堵在道路网络中呈现向四周放射的传导特性,拥堵路段倾向于将拥堵扩散传导到其他相邻路段,该特性此前未被系统研究过,综合比较各种方法的适用性,从时间和大数据规则挖掘角度对拥堵建模;使用时间序列规则挖掘算法建立交通拥堵传导规律模型,并基于传导规则预测未来交通流状况;更重要的是,挖掘出来的拥堵传导规则直观可用,能够用于建立拥堵预警防治机制,完善道路路网建设规划中不合理的部分,从而达到提升交通效率的目的。研究结果证明本模型能够较好达到研究目的,挖掘出的拥堵传导规则可以精确分析交通拥堵状况并预测未来交通流状况,因此可以为交通拥堵治理决策提供重要参考。相似文献

14.

数据挖掘中属性项压缩的统计方法研究

朱建平《统计与信息论坛》2006,21(5):15-18,30

文章试图将统计思想与(Rough)粗糙集理论相结合,针对事务性数据库属性项压缩问题提出了一些行之有效的方法,即基于重要性的属性压缩、基于相依性的属性压缩、属性项的广义线形分析及压缩、基于多重相关性的属性项压缩,以此达到数据库压缩之目的。相似文献

15.

Data Mining and Knowledge Discovery in Databases – An Overview

Murray J. Mackinnon & Ned Glick 《Australian & New Zealand Journal of Statistics》1999,41(3):255-275

Data mining seeks to extract useful, but previously unknown, information from typically massive collections of non-experimental, sometimes non-traditional data. From the perspective of statisticians, this paper surveys techniques used and contributions from fields such as data warehousing, machine learning from artificial intelligence, and visualization as well as statistics. It concludes that statistical thinking and design of analysis, as exemplified by achievements in clinical epidemiology, may fit well with the emerging activities of data mining and 'knowledge discovery in databases' (DM&KDD). 相似文献

16.

数据挖掘中基于可辨识矩阵的连续属性离散化方法

下载免费PDF全文

刘云霞曾五一《统计研究》2007,24(4):8-10

连续属性的离散化在数据挖掘中有着非常重要的作用。本文基于可辨识矩阵提出一种连续属性离散化的方法，并利用平均互信息量对离散化结果进行修正。该方法通过统计模拟取得了良好的效果。相似文献

17.

证券投资意识调查分析 —基于数据挖掘的视角 总被引：1，自引：1，他引：0

下载免费PDF全文

何海鹰朱建平谢邦昌《统计研究》2008,25(9):49-53

证券公司对于客户的挖掘和分类有利于挖掘潜在客户和做出适当的营销决策。本文将决策树、逻辑斯蒂回归和贝氏机率分类算法用于判断被访者是否购买股票,以此挖掘潜在客户,用K-means聚类法将股票购买者划分不同的类型,并建议采取不同的服务和营销方式,提高客户的忠诚度。相似文献

18.

基于Copula连接函数的数据挖掘关联算法的设计

张维群岳雪《统计与信息论坛》2014,(4):10-13

现实中海量数据往往持续地产生,如何实现信息和知识的动态挖掘已成为人们关注的理论问题。根据数据集分批分步输入处理的思想,以Copula连接函数为理论基础,给出一种有效海量数据的关联分步测度算法,通过模拟实验验证了该算法的可行性,结果显示所设计的关联算法能显著提高关联效应测量的效率,并能有效地解决超海量数据关联效应的测度问题。相似文献