首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对目前基于静态数据挖掘的可疑交易识别方法在处理该类交易数据时所面临的困难与局限性,结合可疑金融交易的特征,设计了基于流数据频繁项挖掘的可疑金融交易识别算法。该算法改进了有损计数法,利用实时保留的具有较高重复度的历史数据项解决了数据处理过程中的过度删除问题,实现了对频度列表中项的及时更新,并依据从数据流中识别出的频繁项来发现可疑金融交易线索。仿真实验结果验证了该算法的可行性和有效性。  相似文献   

2.
动态识别是改进我国目前可疑金融交易识别监测覆盖面不足和识别实时性较差的有效方法。针对动态识别的具体实现问题,基于数据流多维分析设计一种可疑突变特征动态识别算法。该算法根据金融交易数据流的特点,在筛选交易记录关键属性、构建数据流立方体结构以及确定通用路径的基础上,运用突变比量动态缩减时间框架,在不同维度及概念层上计算和维护立方体中数据单元的度量参数与突变比量参数,并以此为依据发现并识别出隐匿于数据流中的可疑突变特征。仿真结果表明:算法能够在有限的存储空间内完成对大规模金融交易数据流的实时处理,计算结果能够有效反映交易记录中频度、金额、类型等方面的可疑突变情况,从而达到动态识别可疑金融交易的目的。  相似文献   

3.
常用的决策树生成算法分析   总被引:2,自引:0,他引:2  
数据分类是数据挖掘中的一个重要课题,被有效地应用于科学实验、医疗诊断、气象预报、商业预测等领域。常用的分类方法包括决策树、神经网络、遗传算法等。其中决策树是分类方法中的一个重要研究方向,由于其结构简单、可以清晰的生成便于人们理解的规则、效率高、以及适用大数据量等优点而被广泛使用。本文就几种常用的决策树生成算法进行较深入地分析和比较。  相似文献   

4.
数据挖掘中的决策树分类可以对数据集进行有效的训练学习以及对新的相应数据集快速准确的分类.本文给出了一个利用Weka数据挖掘工具进行决策树分类的实例.  相似文献   

5.
隐私保护关联规则在可疑金融交易识别中的应用   总被引:1,自引:0,他引:1  
有效利用多方数据进行分析,将隐私保护关联规则应用于可疑金融交易识别中,提出了一种新的算法来满足目前用于异构的分布式数据库的隐私保护.该算法能提高反洗钱工作效率,为金融机构反洗钱工作提供一种行之有效的方法.  相似文献   

6.
随着微博的发展,近几年来网络上以微博为手段进行恶意炒作的事件不断增多,干扰了互联网正常秩序,对国家社会稳定与安全造成严重隐患.本文以新浪微博为研究对象,对规避新浪访问限制保障分布式数据持久采集、利用数据挖掘分类思想进行多特征炒作账户识别进行了研究,在进行特征分析时,选择决策树学习算法,通过测试建立分类模型,最终实现了对炒作微博账户的分析预测.  相似文献   

7.
分类是数据挖掘的重要内容之一,其中决策树分类法在海量数据环境中应用最为广泛,本文论述了决策树分类法ID3算法中的信息熵及其增益原理,并总结了ID3算法引进信息理论后的优点。  相似文献   

8.
近年来,数据挖掘方法在商业领域的应用方兴未艾。文章尝试将数据挖掘方法引入财务困境预测的问题中,并以上市公司的实际财务数据为出发点,全面比较了逻辑回归、神经网络和决策树等分类算法在上市公司财务困境预测问题上的优劣。结果表明决策树在预测准确率、波动性以及可解释性上具有综合优势。文章还提出了不同程度财务困境的新概念,并对这个问题进行了决策树建模。  相似文献   

9.
校园大数据分析是目前大数据研究的重要领域,针对历年积累的大量学生考勤数据,传统的数据库技术几乎无法完成全量的数据分析,串行的计算方法很难在短时间内计算出分析结果.大数据技术是解决此类问题的一种较好的方法.本文提出了一种基于Spark平台的决策树回归分析方法,可在较短时间内完成大量考勤数据的分析,生成影响学生课堂出勤率的决策树,该决策树对学生课堂出勤率的监测预警以及教学管理决策有一定的参考意义.文中详细描述了数据并行处理的流程以及采用CART算法对学生课堂出勤率进行回归分析的方法.并且比较了传统数据库技术与并行数据处理方式进行学生考勤数据分析的效率,该方法取得了较好的效果.  相似文献   

10.
决策树是数据挖掘中重要的分类算法,通常用来形成分类器.ID3算法是决策树中的核心算法.针对ID3算法倾向于取值较多的属性的缺点,引进属性重要度对ID3算法予以改进,并通过实验对改进前后的算法进行了比较.实验表明,改进后的算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号