首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
数据挖掘的聚类方法   总被引:3,自引:0,他引:3  
聚类是数据挖掘领域中的一个重要研究课题.本文介绍了数据挖掘领域中对聚类分析的典型要求、主要规则及数据挖掘领域中的聚类的有效性衡量.  相似文献   

2.
研究了一种附有引力影响因子的半监督K-means核函数聚类算法,并将该方法应用于多因子选股模型中。研究表明,相比传统的聚类模型,改进的模型具有较强的泛化能力,模型在处理样本线性不可分、样本分布非球状簇等问题上具有明显的优势,能选出较优的股票组合。  相似文献   

3.
统计方法在反洗钱可疑交易鉴别中的应用   总被引:2,自引:0,他引:2  
文章从截面数据和时间序列数据两方面对统计方法在我国反洗钱可疑交易鉴别中的应用问题作了探讨,并结合某家上市公司的现金交易数据对统计方法在反洗钱可疑交易鉴别中的具体应用作了实证分析.文章的结论是统计方法可以有效地鉴别出与一贯交易习惯明显不符的异常交易.  相似文献   

4.
文章提出了一种基于互信息量的改进K-Modes聚类方法,采用样本互信息来刻画数据对象属性之间的相互关系。在此基础上提出了一种新的距离度量,该距离度量方法既考虑了对象某个属性值本身的不同,又考虑了对象其它属性对该属性值的影响,使之更符合实际问题情况。实验结果表明,聚类方法有效地提高了聚类精度。  相似文献   

5.
该文建立了一种基于聚类分析与决策树分析相结合的服务订制预测模型,利用聚类提取训练集训练决策树,将生成模型应用于某地区用户对有线电视交互服务的订制意愿预测,最终确定高响应率客户群。实验证明,该模型相对于仅通过决策树进行预测能更大程度地提高分类精度,能更有效地识别出高响应率客户群。所提出的研究框架与方法,为企业在商业竞争中制定有效的营销决策提供了重要依据。  相似文献   

6.
基于时间序列孤立点检测的可疑外汇资金交易识别研究   总被引:1,自引:0,他引:1  
尽管洗钱模式复杂多变,但洗钱行为在整个金融活动中只占有极少的比例,这给监测洗钱交易增加了难度.作为数据挖掘重要方法之一的孤立点分析是在大数据集中发现有趣小模式的有效方法.文章提出了一种适用于可疑外汇资金交易识别的孤立点检测方法,可以持续地从大量的日常交易中发现极少数的与正常交易显著不同的异常交易.从孤立点分析角度,提出了基于非频繁模式挖掘思想和概念漂移处理的混合属性空间上时间序列孤立点检测方法;从可疑金融交易识别的角度,提出了对每天持续动态产生的海量金融交易数据进行分析的一种新思路.  相似文献   

7.
灰色聚类方法在高校图书馆综合评估中的应用   总被引:2,自引:0,他引:2  
文章根据高校图书馆综合评估的要求和统计数据特点,应用灰色聚类方法进行多指标数据的权重计算和白化处理,结合SPSS和Metlab软件应用,实现了多评价指标的科学赋权和图书馆的分类排名,是对高校图书馆综合评估计算方法的有益探讨。  相似文献   

8.
时间序列曲线分类的目的是为了找到曲线之间相似波动结构、减少建模工作量和进行预测,所以分类的结果将直接影响模型的质量和预测的精度.为此,文章提出了一种新的时序曲线分类方法-分位点回归系数聚类法.它可以有效地避免一些分类方法带来的局限性,能够更为全面、详尽地考查待分类时序数据的运行方式,改善分类的效果并为预测提供强大的支持.  相似文献   

9.
传统的解决有序样本聚类的Fisher最优分割法对计算机存储能力要求较高,不适合由于样本长度较大时的情况.实践中常用的最优二分割法只能求得局部最优解.文章提出了一种基于遗传算法解决有序样拳聚类问题的新算法.该算法适用于多种聚类距离,适合于大样本,可以解决方向聚类问题.  相似文献   

10.
11.
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。  相似文献   

12.
K-means算法是处理大样本数据的聚类分析的常用算法之一.该算法的不足之处是聚类的数目k必须事先给定.文章提出应用黄金分割法来度量有关该聚类的有效性,该方法能自动优化确定最佳的聚类个数,以此实现大样本数据的有效聚类:并采用实际数据说明了方法的合理性和有效性.  相似文献   

13.
文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用.将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标.  相似文献   

14.
对两阶聚类法自动确定聚类数规则的求证   总被引:1,自引:0,他引:1  
文章从两阶聚类法(TwoStep Cluster TSC)的原理出发,以联合对数极大似然估计值为基础,论证了BIC、BIC变化、BIC变化率、距离变化率等核心指标的计算公式,进而系统阐述了TSC分两步确定聚类数的规则,并通过实例对规则进行了演示.  相似文献   

15.
灰色聚类法在课程评估中的应用   总被引:2,自引:0,他引:2  
灰色聚类是以灰数的白化函数生成为基础的一种聚类方法。文章首先提出采用加权平均法则,对聚类结果可进行再分析,以充分利用信息,使评判结果更为合理。同时应用灰色聚类法对西安统计学院4门课程进行了综合评价分析,其结果符合实际。  相似文献   

16.
目前研究的模糊C均值聚类算法(FCM)面临的最重要问题是初始值随机选取,导致其容易陷入局部最优,同时影响运算速度.而灰色预测GM(1,1)模型在形成预测公式时对初始值的选取也没有合理有效的方案.针对以上问题,文章提出坐标密度法,确定初始聚类中心,对FCM算法进行改进;接着提出运用改进的FCM求取GM(1,1)中数据的聚类中心,并把聚类中心作为初始值的方法;通过与已知算法进行比较验证了其可行性和有效性.  相似文献   

17.
鉴于人力资源管理效能评价过程中存在许多非线性的关系,文章将基于一类分类的聚类方法应用于评价企业人力资源管理效能的过程中,为研究人力资源管理效能评价问题提供新思路和新方法,为企业有效评价其人力资源管理的有效性提供新的理论指导.  相似文献   

18.
本文首先介绍利用变量聚类过程VARCLUS构造的类变量综合得分的方法,然后通过一个具体实例说明类变量综合得分在多指标(变量)系统的排序评估问题中的应用.  相似文献   

19.
多指标面板数据能够较全面的提供研究对象的信息和数据特征,但复杂的数据结构也给其聚类分析带来了一定的困难.针对这一问题,文章提出了基于特征提取的多指标面板数据聚类方法,该方法将能够表征面板数据动态变化的“绝对量”特征、“波动”特征、“偏度”特征、“峰度”特征及“趋势”特征引入动态聚类算法中,可以避免以往采用欧式距离进行聚类的局限性,还可以处理带有缺失数据的面板数据,同时大大提高了聚类效率,并最大限度地保证时间维度信息不受损失.利用该方法分析了2001至2013年我国不同省份道路交通事故的不平衡状况,通过实证分析表明该方法能够解决多指标面板数据聚类的问题.  相似文献   

20.
数据挖掘中处理的数据越来越庞大,传统的聚类方法已经不再适用。因此,本文提出了一种基于因子分析的聚类方法,从而达到数据降维和简化聚类过程的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号