共查询到20条相似文献,搜索用时 15 毫秒
1.
在基于价值的客户细分中,不可避免地产生"拒真纳伪"的两类错误,由于错误分类代价差异和不同价值客户数量的不平衡分布,基于总体准确率的数据挖掘方法不能体现由于客户价值不同对分类效果带来的影响.本研究在代价敏感性学习机制下引入支持向量机作为分类工具,建立基于客户价值的错分代价函数,为适应客户价值多类别细分的要求,将二元分类扩展为多元分类,建立分类的期望损失函数作为分类效果的评价标准.实验结果说明,该方法可以更精确地控制代价敏感性和不同种分类错误的分布,降低总体的错误分类代价,使模型能更准确反映分类的代价,有效识别客户价值. 相似文献
2.
基于改进支持向量机的电信客户流失预测模型 总被引:7,自引:0,他引:7
随着电信业改革的深入和竞争的加剧,电信企业的客户流失率逐步攀升,如何预测并有效减少客户流失直接关系到电信企业的生存和发展.流失客户在客户总体中占比例较低,因此电信客户数据集中存在明显的非平衡数据问题,传统的客户流失预测把客户流失作为普通的模式识别问题处理,建立基于普适机器学习的预测模型.在两类错误的错分代价相差较大的情况下,基于普适机器学习的预测模型缺乏实用价值,因此引入代价敏感学习理论建立了基于改进支持向量机的电信客户流失预测模型,将不同的错分代价纳入建模过程,有效的提高了模型的预测性能. 相似文献
3.
在现实的目标客户选择建模中,往往只能获取少量有类别标签的样本,而剩下的大量样本都无法获取类别标签。已有研究大都使用监督式建模研究范式,仅在少量有类别标签样本集上建模,很难取得令人满意的效果。为解决这一问题,本文引入半监督学习(semi-supervised learning,SSL)技术,将其与代价敏感学习(cost sensitive learning,CSL)和多分类器集成中的随机子空间(random subspace,RSS)方法相结合,提出了代价敏感的目标客户选择半监督集成模型(cost-sensitive semi-supervised ensemble model,CSSE)。该模型使用代价敏感的支持向量机(SVM)来解决目标客户选择建模中样本数据类别分布不平衡的问题,还能够同时使用有、无类别标签的客户样本来建模。进一步地,该模型利用RSS方法训练一系列基本分类模型,并通过集成得到最终的分类结果。在某保险公司目标客户选择数据集上进行实证分析,结果表明,与两种监督式集成模型、两种单一的半监督模型以及两种半监督集成模型相比,CSSE模型具有更好的目标客户选择性能。 相似文献
4.
5.
6.
近年来,国内信用卡业务发展正从过去以"量的扩张"为主转变到以"质的提高"为主的阶段。在这一转折时期,各商业银行越来越重视数据挖掘技术在客户细分管理中的应用,开始积极探索客群细分基础上的差异化客户管理。本文根据某银行信用卡客户数据,基于RFM模型和决策树模型进行客户细分实证研究,并提出相应的客户管理策略建议。 相似文献
7.
8.
针对电信客户流失预测问题的复杂性,融合自组织神经网络良好的连续属性值离散化优势、粗糙集理论出色的属性约简功能和蚁群优化算法全局的随机搜索特点,在模型集成技术和成本敏感学习理论的基础上,提出了一种新的基于蚁群算法的成本敏感线性集成多分类器的电信客户流失预测模型。构建该集成模型可分为4个阶段:(1)连续属性值的离散处理:利用自组织神经网络对连续属性值进行非监督离散化处理;(2)原始属性集的约简处理:使用粗糙集理论按属性重要性原则对离散属性进行约简;(3)子分类器的建立:分别使用NaiveBayes、Logistic回归、多层感知器和决策树等4种差异性很大的分类技术在约简属性集上建立4个对应的客户流失预测子分类器;(4)子分类器的集成:基于成本敏感学习理论,构建了4种不同的线性集成模型,采用蚁群优化算法求解集成模型的最优线性组合权重系数。将该模型应用于某电信客户流失预测,其实验结果表明该集成方法是可行且有效的。 相似文献
9.
10.
11.
本文运用数据挖掘技术中的分类决策树算法和快速聚类算法,对某省会城市联通公司的3G业务数据进行深入分析,研究并实现-个准确、实用的3G客户识别和客户细分的模型.在对模型进行评估的基础上,为精确发展优质3G客户提供了-个具体参考,同时对3G的资费策略提出-些参考意见. 相似文献
12.
为了降低单个分类模型的不稳定性,提高其应用于消费者信用评估的准确性,提出一种基于组合分类的消费者信用评估方法.首先通过有监督聚类将各个类别的数据样本划分为若干子集合,使得各个子集合中数据样本均来自同一类别,再对不同类别子集合之间进行两两组合得到训练样本子集合,然后在各个训练样本子集合中分别建立不同的分类模型.在分类模型结果综合阶段,以各个分类模型在待分类样本的近邻训练样本中的分类性能作为权重,对各个分类模型的结果进行加权投票以产生待分类样本的最终分类结果.实证研究以决策树作为基本分类器,通过在实际的消费者信用数据集上的比较分析,说明所提出方法相对于其它组合分类方法具有更高的分类准确性,可以有效应用于消费者信用评估. 相似文献
13.
针对不同样本在特征空间中具有不同的区域特性和不同分类算法之间的预测互补性,在电信客户流失预测理论基础上,融合多分类器动态集成理论和成本敏感学习理论,建立了电信客户流失多分类器集成预测的利润函数,并提出了一类新的基于多分类器动态选择与成本敏感优化集成的电信客户流失预测模型.首先使用K均值聚类法聚类训练样本成多个分区;接着使用NaiveBayes算法、多层感知机算法和J48算法在各分区样本上构建客户流失预测子分类器;最后使用改进人工鱼群算法分别对各分区的子分类器进行成本敏感优化集成.实验结果表明,所提出的基于多分类器动态选择与成本敏感优化集成模型的分类性能不仅优于由训练集全体样本所构建的3个单模型,也优于基于改进人工鱼群算法优化集成这3个单模型而得到的集成模型. 相似文献
14.
基于客户价值的客户细分及保持策略研究 总被引:12,自引:0,他引:12
保持有价值的客户是客户关系管理的核心任务之一,准确地进行客户细分是有效实施客户保持策略的基础.在讨论客户价值定义及评价方法的基础上,结合客户生命周期理论提出了改进的客户价值预测模型,建立了三维客户价值细分模型,根据客户细分的结果对每类客户的特征及相应的客户保持策略进行分析. 相似文献
15.
本文首先介绍了客户细分在企业营运中的重要性,将聚类算法应用于企业客户细分。基于聚类可以找到数据集中未知的分类,本文介绍了一种可对客户多种描述特征进行综合聚类的客户细分方法。该算法不仅将网络概念加入到聚类中,还可以通过参数的控制,使客户的细分数量在可控范围之内。 相似文献
16.
大数据环境下,随着企业间的竞争加剧,企业越来越意识到客户购买行为预测的重要性。主要采用改进的决策树模型对客户购买行为进行预测,并通过对优化前后的效果对比分析,验证了改进后的算法在客户购买行为预测上的有效性和高效率。以Teradata软件为例,介绍了决策树模型在大数据背景下的应用,阐述了决策树模型在大数据情况下的用法和应该注意的问题。 相似文献
17.
首先分析了挽留激励、竞争反击、自然衰减和口碑传播这4种效应对客户保持率产生影响的动力学模型,并得到了客户保持率在客户挽留周期中的演进路径;接着定义了挽留激励系数、竞争反击系数、自然衰减系数和口碑影响系数来具体刻画这4种效应的作用力.然后基于客户保持率的演进路径得到了客户挽留周期计算模型,分别基于竞争对手反击效应存在性的不同情况建立了3类客户挽留价值计算模型.最后基于客户挽留价值和挽留成本建立了客户流失挽留评估模型,基于挽留重要性指标建立了客户挽留顺序选择模型.实验结果表明所提出的客户流失挽留方法是可行且有效的. 相似文献
18.
随着客户资源竞争的加剧,客户分类成为企业管理客户的重要内容。在考虑各种客户分类方法的基础上,详细介绍套餐推荐的具体内容,最后利用数据挖掘的决策树技术,进行客户分类,并通过某手机资费软件公司的数据进行验证,结果表明,客户分类有助于企业运营成果的提高。 相似文献
19.
目前越来越多的数据挖掘方法被用于风险预警中,决策树、支持向量机、神经网络、Logistic回归等方法在风险预警中都表现出了较好的特性和预警效果,但是不同数据挖掘分类方法得到的结果不同,往往导致预警结果的不一致,因此也会存在一定风险。本文引入信息融合技术对不同数据挖掘分类方法得到的结果进行融合处理得到最优的结果,解决了不同数据挖掘方法得到的结果不一致问题。文章在SVM和Logistic回归的数据挖掘模型基础上建立基于信息融合的公司财务预警模型,提高了财务预警准确率,并且保留了原数据挖掘方法在分类预测上的优势。在实证研究中,论文选取了中国制造业的上市公司作为研究对象,在SVM和Logistic回归两种数据挖掘模型的基础上利用信息融合方法建立了财务预警模型,实证结果表明,基于信息融合的数据挖掘方法的预测准确率要高于单独的SVM和Logistic回归两种方法。 相似文献
20.
随机森林方法及其在客户流失预测中的应用研究 总被引:1,自引:0,他引:1
在全球化的市场竞争中,企业如何利用现有资源,提高客户满意度,保住现有客户,已成为企业面临的主要问题,客户流失预测越来越受到企业关注。本文针对实际客户流失数据中正负样本数量不平衡而且数据量大的特点,提出一种改进的平衡随机森林算法,并将其应用于某商业银行的客户流失预测。实际数据集测试结果表明,与传统的预测算法比较,这种算法集成了抽样技术和代价敏感学习的优点,适合解决大数据集和不平衡数据,具有更高的精确度。 相似文献