首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 922 毫秒
1.
利用数据挖掘技术对海量保险业务数据进行风险分析,通过交叉频数分析确定保单中风险较大的因素,为管理决策提供依据;将决策树、支持向量机、逻辑斯蒂回归和贝叶斯网络四种数据挖掘算法用于保户分类,提取高风险保户的潜在特征,挖掘理赔概率较高的保户群,以指导保险公司的营销工作。  相似文献   

2.
分类发现是数据挖掘的重要内容,贝叶斯分类和决策树在数据挖掘中应用相当广泛,它们是生成分类器的两种有效方法。文章分别用两种方法对顾客满意度进行分类及预测,并将两种方法进行比较分析,认为用决策树分类法来预测顾客满意度具有简洁、高效等特点。  相似文献   

3.
数据挖掘中的决策树技术及其应用   总被引:29,自引:0,他引:29  
数据挖掘作为一种发现大量数据中潜在信息的数据分析方法和技术 ,已经成为相关各界关注的热点。其中 ,决策树技术以其出色的数据分析效率、直观易懂的结果展示等特点 ,倍受广大用户的青睐。文章首先对决策树技术进行较为详尽的探讨 ,然后利用 SAS/EM工具 ,对该技术在客户关系管理中的应用进行了初步尝试。  相似文献   

4.
数据流具有连续、实时、有序及无限等特点,使用传统的数据挖掘技术来处理数据流的分类面临着严重的挑战,很难处理数据流中的概念漂移问题.文章结合现有的决策树分类挖掘算法,提出了自适应集成分类器方法,构建了数据流概念漂移的自适应集成分类模型,通过不断更新训练样例的权重与属性类别,将训练样例从现有的数据集中分离出来,并被确定为新类别属性的训练样例,以达到对数据流中概念漂移现象的有效检测,仿真结果也证明该方法的适应性和可靠性.  相似文献   

5.
随着Internet技术的飞速发展,www以其多媒体的传输及良好的交互性而倍受青睐.虽然近几年来网络速度得到了很大的提高,但是由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥挤,用户的服务质量(QoS)得不到很好的保证.预取技术的基础是预测算法.数据挖掘是从大量的数据中采掘出隐含的、先前未知的、对决策有潜在价值的知识和规则的一种技术.我们可以根据用户访问的历史数据和当前访问的数据、利用数据挖掘技术来预测用户将来的可能行为,从而为用户预取一些Web页面.用户缓冲器中的数据可以作为数据挖掘时的历史数据.  相似文献   

6.
在现代保险业中,通过数据挖掘技术的应用,从大量纷繁复杂的保户资料中,分析保户特性,进行市场细分,甄别高风险理赔人群,为保险公司选择目标客户提供决策依据。以保险资料为基础,应用数据挖掘技术进行聚类、决策树分类、类神经网络建模以及Logistic回归,划分客户群体,分析高风险理赔保户群体特征,为保险公司规避理赔风险提供决策依据。  相似文献   

7.
一、引言数据挖掘(Data Mining)是近年来随着人工智能和数据库技术的发展而出现的一门新兴学科。它是从大量的数据中筛选出隐含的、可信的、新颖的、有效的信息的高级处理过程。关联规则(Association Rule)是其中重要的研究课题,是数据挖掘的主要技术之一,也是在无指导学习系统  相似文献   

8.
缺失数据是影响调查问卷数据质量的重要因素,对调查问卷中的缺失值进行插补可以显著提高调查数据的质量。调查问卷的数据类型多以分类型数据为主,数据挖掘技术中的分类算法是处理属性分类问题的常用方法,随机森林模型是众多分类算法中精度较高的方法之一。将随机森林模型引入调查问卷缺失数据的插补研究中,提出了基于随机森林模型的分类数据缺失值插补方法,并根据不同的缺失模式探讨了相应的插补步骤。通过与其它方法的实证模拟比较,表明随机森林插补法得到的插补值准确度更优、可信度更高。  相似文献   

9.
薛薇 《统计研究》2002,19(4):52-53
一、概述数据挖掘是 90年代中后期兴起的一门跨学科的综合研究领域 ,它集计算机机器学习、统计学、数据库管理、数据仓库、可视化、并行计算、决策支持为一体 ,利用数据库、数据仓库技术存储和管理数据 ,利用机器学习和统计学方法分析数据 ,旨在发现大量复杂数据中蕴含的有价值的知识和信息。目前 ,随着数据挖掘应用的不断开展以及客观现实对数据分析需求的不断增长 ,人们越来越认识到数据挖掘的重要性和必要性。数据挖掘通过对数据的总结、分类、聚类、关联等分析 ,实现对数据内在结构特征的理解和对未知数据的预测。其中 ,数据总结是在数…  相似文献   

10.
一、数据挖掘的定义 数据挖掘就是利用人工智能、统计分析以及其它建模方法,从大量不完全的、随机的数据中寻找数据之间的关系和有用的信息.数据挖掘在营销、金融等行业的重要性已经被认识,所以企业一般都建立自己的数据库即客户关系系统(CRM),这为数据挖掘的发展提供了基础.需要指出的是:数据挖掘并不仅仅是技术和算法的组合,它其实更像过程,这个过程的目的在于解决具体的问题或做具体的决策.  相似文献   

11.
数据流分类中的概念漂移问题是数据挖掘技术领域的前沿和难点,其重点是等级分类可能随着数据序列的转移而产生漂移现象。虽然估计动态漂移及其调整分类的算法已被提出,但现有算法由于目标分布例证的缺失在概念漂移估计方面的表现并不是很好,例证的多少严重影响了估计效果。鉴此,提出了一种新的参数估计方法,称为转移估计法,运用目标分布数据,结合相似分布理论,对现存的算法进行改进,以便实现对数据流分类中的概念漂移现象进行正确检测和估计。通过对虚拟和真实数据集的仿真实验表明,改进算法在数据流分类中的概念漂移估计方面优于现存算法。  相似文献   

12.
支持向量机(SVM)是数据挖掘中非常流行的分类算法,得到了广泛的关注。数据泄露问题日渐凸显,数据挖掘中的隐私保护也成为当今研究热点,但是针对SVM隐私保护的研究较少。我们提出了基于旋转扰动的SVM隐私保护算法,该算法引入正交旋转变换方法,具有分类零损失的特性。文章采用传统数据安全评价方法,并利用UCI机器学习中心提供的数据对该算法的隐私性水平进行了分析。理论验证和实验结果表明,我们提出了令人满意的SVM隐私保护算法。  相似文献   

13.
一、引言   数据挖掘(Data Mining)是数据库中知识发现的核心,在近年来逐渐兴起,形成了一种全新的应用领域.数据挖掘是从大量的、有噪声的、随机的数据中,识别有效的、新颖的、有潜在应用价值及完全可理解模式的非凡过程,从而对科学研究、商业决策和企业管理提供帮助.神经网络是模拟人脑内部结构,在模拟推理、自动学习等方面接近人脑的自组织和并行处理的数学模型.其优点之一是,不依赖于对象.通过学习将输入、输出以权值的方式编码,把它们联系起来.神经网络在数据挖掘中的优势是:噪声数据的强承受能力,对数据分类的高准确性,以及可用各种算法进行规则提取.……  相似文献   

14.
数据挖掘技术的应用及发展   总被引:5,自引:0,他引:5  
数据挖掘是从大量的数据中发现其潜在规律的技术,是当前计算机科学及统计科学研究的热点之一。文章介绍了数据挖掘的概念、功能、数据挖掘过程、常用方法等;探讨了数据挖掘领域面临的问题;论述了数据挖掘与统计分析的关系,并对国内外研究现状及发展情况做了介绍。  相似文献   

15.
一、问题的提出关联规则挖掘是通过对已知数据的学习找出其中存在有意义依赖关系,它可以用来进行预测决策和分类,因此是机器学习领域集中解决的问题。数据挖掘中的问题与机器学习主要区别在于:数据挖掘中要处理大量的数据,因此要求学习的效率很高;另外数据挖掘获得的规则或模式  相似文献   

16.
1相关理论1.1数据挖掘(Data M ining)技术数据挖掘是从数据当中发现趋势或模式的过程。这一过程的目标就是通过对大量数据的分类而发现新的信息。人们通过数据挖掘得到的回报就是将这些新发现的知识转变为经营上的成果,如增加销售收入或者减少销售成本。数据挖掘是最近几年才发  相似文献   

17.
回归分析是数据挖掘中重要的方法之一。文章研究了基于半参数Beta回归模型结合惩罚样条估计的数据挖掘方法。当数据中因变量的数据取值为(0,1)区间(或某个区间)时,利用半参数Beta回归模型进行数据挖掘,不仅具有很好的解释效果,而且能挖掘出隐含在数据内部的有用信息。实验结果验证了研究方法的有效性。  相似文献   

18.
本文回顾了离群点数据挖掘技术的研究成果,对高维离群点数据挖掘技术进行了简要的评述,并在此基础上提出了一种基于粗糙聚类的高维离群点数据挖掘的算法,采用粗糙集方法选择出最优子空间,直接对高维空间数据进行聚类,并对子空间离群点进行数据挖掘,取得了良好的效果。  相似文献   

19.
就大数据生成过程的多维性、稀疏性和动态性等特征而言,大数据集并不等于统计总体,即便对于静态大数据集,随机抽样同样有着不可或缺的参数估计和总体推断的方法论价值。在大型数据分析中,常常遇到需要降低维度和减少计算量但又不知如何抽样处理的问题。因此,提出均匀抽样在大数据挖掘中应用的基本策略,并使用模拟数据和医学胎心宫缩监护数据集进行数值分析。结果表明:均匀抽样在降低决策树、adaboost、bagging和随机森林的误差率上优于现有文献的常用方法,这一策略能为面向大数据的数据挖掘方法提供参考,也为针对大数据分析的抽样有效性提供佐证。  相似文献   

20.
基于关联规则挖掘的股票板块指数联动分析   总被引:7,自引:0,他引:7  
本文应用数据挖掘中的关联规则算法,对我国股票市场中板块指数的关系进行实证分析。通过采用关联规则的Apriori算法技术,可以从大量数据中挖掘出我国股票市场的板块指数之间的强关联规则,并对其进行可视化描述与评价。文中所得的关联规则可以帮助市场参与者发现股票板块轮动的规则模式,并在此基础上规避证券市场风险。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号