首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 296 毫秒
1.
电子商务客户流失预测是一种典型的高维、非线性、数据不平衡问题,传统的方法已很难提高其预测精度。本文将自组织数据挖掘方法(SODM)引入电子商务客户流失预测,提出一种基于客观系统分析(OSA)和数据分组处理(GMDH)网络集成的电子商务客户流失预测模型。首先利用OSA算法自动选择出重要的电子商务客户流失关键属性,然后将训练样本送入GMDH网络进行学习与训练,进而对测试样本客户流失状态进行预测。为了提高预测精度,本文还利用向上采样法进行数据平衡化,使得流失类和非流失类客户数量大致相等。应用该模型对某网上商场客户流失状态进行预测,并将预测结果与神经网络、SVM等方法得到的结果进行了比较,验证了该模型的有效性及实用性。  相似文献   

2.
基于改进支持向量机的电信客户流失预测模型   总被引:7,自引:0,他引:7  
随着电信业改革的深入和竞争的加剧,电信企业的客户流失率逐步攀升,如何预测并有效减少客户流失直接关系到电信企业的生存和发展.流失客户在客户总体中占比例较低,因此电信客户数据集中存在明显的非平衡数据问题,传统的客户流失预测把客户流失作为普通的模式识别问题处理,建立基于普适机器学习的预测模型.在两类错误的错分代价相差较大的情况下,基于普适机器学习的预测模型缺乏实用价值,因此引入代价敏感学习理论建立了基于改进支持向量机的电信客户流失预测模型,将不同的错分代价纳入建模过程,有效的提高了模型的预测性能.  相似文献   

3.
客户流失问题一直以来都受到企业的重视,如何有效预测流失客户是一个重要课题。本文通过对某通信企业原始数据进行严格的数据预处理,以及利用直方图检验和卡方检验相结合的方法对模型变量进行筛选,同时采用抽样的方法选取出模型的训练样本和测试样本,并利用分类回归树算法和自适应Boosting算法生成相应的强分类器模型,仿真实验结果表明本文使用的模型在预测该通信企业的离网客户中具有较高的准确性,从模型的ROC曲线可知,该模型是一个比较理想的分类模型。另外,本文通过与其他两个模型的预测结果进行比较发现本文的集成模型具有更好的预测性能。  相似文献   

4.
近年来,随着移动通信行业的蓬勃发展,市场饱和度越来越高,企业获取新用户的成本也越来越大。随着中国三大运营商竞争的加剧,产品和服务的同质化程度也越来越高,这使企业在老客户的保留上变得异常困难,客户流失率也在逐年上升,如何识别高风险流失客户并有效防止客户流失已经成为该行业管理者普遍关心的问题之一。 着眼于客户流失影响因素研究,运用社交网络分析方法,通过构造与网络结构相关的变量进行影响因素的探讨,运用逻辑回归方法构建客户流失预警模型。从社交网络的视角出发,利用客户的通话详单数据建立客户之间的通信网络,在自我网络的相关理论框架下,构建个体的度、联系强度、个体的信息熵3个自我网络特征变量。运用中国某移动运营商公司的月度客户数据(包括基础通信数据和通话详单数据),通过逻辑回归构建基于社交网络变量的客户流失预警模型。 研究结果表明,个体的度、联系的强度和个体的信息熵都对预测客户流失有显著效果。具体的,个体的度越大,联系强度越强,个体的信息熵越大,客户越不容易流失。外样本AUC值平均可以达到0.75以上,模型具有良好的预测精度。 研究结果对企业实践具有非常重要的意义,合作企业应用客户流失预警模型进行高风险流失客户的识别,预测精度可以达到70%,达到了企业的实践预期。客户流失预警模型可以帮助企业提前识别高风险流失客户,极大地降低企业维系客户的成本。建议企业管理者在未来更加关注与客户社交网络有关的变量,从网络结构的视角理解消费者行为,更好地进行客户关系管理。  相似文献   

5.
罗彬  邵培基  夏国恩 《管理学报》2012,9(9):1373-1381
针对不同样本在特征空间中具有不同的区域特性和不同分类算法之间的预测互补性,在电信客户流失预测理论基础上,融合多分类器动态集成理论和成本敏感学习理论,建立了电信客户流失多分类器集成预测的利润函数,并提出了一类新的基于多分类器动态选择与成本敏感优化集成的电信客户流失预测模型.首先使用K均值聚类法聚类训练样本成多个分区;接着使用NaiveBayes算法、多层感知机算法和J48算法在各分区样本上构建客户流失预测子分类器;最后使用改进人工鱼群算法分别对各分区的子分类器进行成本敏感优化集成.实验结果表明,所提出的基于多分类器动态选择与成本敏感优化集成模型的分类性能不仅优于由训练集全体样本所构建的3个单模型,也优于基于改进人工鱼群算法优化集成这3个单模型而得到的集成模型.  相似文献   

6.
为了对客户流失风险分析过程中的大量的冗余特征进行约简或压缩,本文利用粗集理论中的特征约简方法来研究客户流失风险分析,提出了一种基于粗集的客户流失风险的分析方法.通过一个客户流失风险的分析实例对该算法进行了检验,实验结果表明,在保证分类质量基本不变的情况下,该算法可以查找出对分类起主要作用的特征,从而达到了特征约简的目的,成功地将粗集理论应用到客户流失风险的分析和预警中,为客户流失风险的分析和预警提供了一条新的研究思路和方法.  相似文献   

7.
近年来,目标客户选择建模成为客户关系管理领域的研究热点。为了解决用于目标客户选择建模的训练样本类别分布高度不平衡的问题,本文首先提出了混合抽样方法。进一步地,将数据分组处理(GMDH)神经元网络引入到客户特征选择中,提出新的特征选择算法Log-GMDH。该算法分别从传递函数的选择和新的外准则的构建两个方面对传统GMDH网络模型进行了改进。最后,将提出的混合抽样、Log-GMDH和Logistic回归分类算法相结合,构建目标客户选择模型LogGMDH-Logistic。在CoIL2000预测竞赛中某汽车保险公司的目标客户选择数据集上进行实证分析,结果表明,LogGMDH-Logistic模型不仅在性能上优于已有的一些目标客户选择模型,而且具有很好的可解释性。  相似文献   

8.
大数据环境下,随着企业间的竞争加剧,企业越来越意识到客户购买行为预测的重要性。主要采用改进的决策树模型对客户购买行为进行预测,并通过对优化前后的效果对比分析,验证了改进后的算法在客户购买行为预测上的有效性和高效率。以Teradata软件为例,介绍了决策树模型在大数据背景下的应用,阐述了决策树模型在大数据情况下的用法和应该注意的问题。  相似文献   

9.
针对电信客户流失预测问题的复杂性,融合自组织神经网络良好的连续属性值离散化优势、粗糙集理论出色的属性约简功能和蚁群优化算法全局的随机搜索特点,在模型集成技术和成本敏感学习理论的基础上,提出了一种新的基于蚁群算法的成本敏感线性集成多分类器的电信客户流失预测模型。构建该集成模型可分为4个阶段:(1)连续属性值的离散处理:利用自组织神经网络对连续属性值进行非监督离散化处理;(2)原始属性集的约简处理:使用粗糙集理论按属性重要性原则对离散属性进行约简;(3)子分类器的建立:分别使用NaiveBayes、Logistic回归、多层感知器和决策树等4种差异性很大的分类技术在约简属性集上建立4个对应的客户流失预测子分类器;(4)子分类器的集成:基于成本敏感学习理论,构建了4种不同的线性集成模型,采用蚁群优化算法求解集成模型的最优线性组合权重系数。将该模型应用于某电信客户流失预测,其实验结果表明该集成方法是可行且有效的。  相似文献   

10.
张婷婷  贺昌政  肖进 《管理评论》2012,(6):83-87,123
在管理决策的制定中,分类已经成为一种十分重要的方法和技术。由于现实客户数据常常是不完整的,因此,研究不完整数据的客户分类问题具有重要意义。通过分析以往分类过程中对不完整数据的处理方法,提出了一种基于动态分类器集成选择的不完整数据分类方法DCES-ID。分别在UCI客户分类数据集以及某券商客户数据集上进行分类的实验和实证分析。结果表明,与已有的6种分类算法相比,DCES-ID算法具有更高的分类准确性及稳定性,能够更有效地进行客户分类。  相似文献   

11.
基于粗糙集理论-神经网络-蜂群算法集成的客户流失研究   总被引:1,自引:0,他引:1  
针对电信客户流失问题的复杂性,融合粗糙集理论、神经网络和蜂群算法的优势,提出了一种新的客户流失预测模型——基于粗糙集理论、神经网络和蜂群算法线性集成多分类器的客户流失预测模型。首先利用自组织神经网络(SOM)对连续属性值进行非监督离散化处理;接着使用粗糙集方法(RS)对离散属性进行约简;然后分别使用BP神经网络、RBF神经网络、ELMAN神经网络和广义回归神经网络(GRNN)在约简属性集上建立4个子分类器;最后使用模型集成法对4个子分类器进行线性集成,并采用人工蜂群(ABC)算法优化线性组合的权重。将该模型应用于某电信客户流失,实验结果表明该集成方法是可行且有效的。  相似文献   

12.
在现实的目标客户选择建模中,往往只能获取少量有类别标签的样本,而剩下的大量样本都无法获取类别标签。已有研究大都使用监督式建模研究范式,仅在少量有类别标签样本集上建模,很难取得令人满意的效果。为解决这一问题,本文引入半监督学习(semi-supervised learning,SSL)技术,将其与代价敏感学习(cost sensitive learning,CSL)和多分类器集成中的随机子空间(random subspace,RSS)方法相结合,提出了代价敏感的目标客户选择半监督集成模型(cost-sensitive semi-supervised ensemble model,CSSE)。该模型使用代价敏感的支持向量机(SVM)来解决目标客户选择建模中样本数据类别分布不平衡的问题,还能够同时使用有、无类别标签的客户样本来建模。进一步地,该模型利用RSS方法训练一系列基本分类模型,并通过集成得到最终的分类结果。在某保险公司目标客户选择数据集上进行实证分析,结果表明,与两种监督式集成模型、两种单一的半监督模型以及两种半监督集成模型相比,CSSE模型具有更好的目标客户选择性能。  相似文献   

13.
在现实的很多信用评估问题中,由于对样本进行类别标记需要花费大量的人力、财力和物力,往往只能获取少量有类别标签的样本来训练分类模型,而把数据库中大量无类别标签的客户样本舍弃。为解决这一问题,本研究引入半监督学习技术,并将其与多分类器集成技术中的随机子空间方法(Random Subspace, RSS)相结合,构建了类别不平衡环境下基于RSS的半监督协同训练模型RSSCI。该模型主要包括三个阶段:1)使用RSS方法训练得到若干基本分类器;2)从大量无类别标签数据集中选择性标记一部分最合适的样本加入到原始训练集中;3)在最终的训练集上训练分类模型,并对测试集样本进行分类。在三个客户信用评估数据集上进行实证分析,结果表明,RSSCI模型的信用评估性能不仅优于常用的监督式集成信用评估模型,也优于已有的一些半监督协同训练信用评估模型。  相似文献   

14.
对无约束条件下多客户流失挽救的最优方案进行了研究.借助于广义客户终身价值,通过数学建模和分析发现,只有当挽救行动判定值大于1时,对流失客户的挽救才有必要,且存在最优挽救费用,各类客户中的合理挽救次序也存在.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号