共查询到10条相似文献,搜索用时 390 毫秒
1.
2.
3.
针对不同样本在特征空间中具有不同的区域特性和不同分类算法之间的预测互补性,在电信客户流失预测理论基础上,融合多分类器动态集成理论和成本敏感学习理论,建立了电信客户流失多分类器集成预测的利润函数,并提出了一类新的基于多分类器动态选择与成本敏感优化集成的电信客户流失预测模型.首先使用K均值聚类法聚类训练样本成多个分区;接着使用NaiveBayes算法、多层感知机算法和J48算法在各分区样本上构建客户流失预测子分类器;最后使用改进人工鱼群算法分别对各分区的子分类器进行成本敏感优化集成.实验结果表明,所提出的基于多分类器动态选择与成本敏感优化集成模型的分类性能不仅优于由训练集全体样本所构建的3个单模型,也优于基于改进人工鱼群算法优化集成这3个单模型而得到的集成模型. 相似文献
4.
在分类问题中,类别不平衡问题将引起分类器训练偏差,导致少数类样本诊断敏感性降低.马田系统是一种多元数据诊断和预测技术,它通过构建一个连续的测量尺度而非直接对训练样本进行学习,该性质有望不受数据分布的影响,克服分类不平衡问题.本文针对马田系统阈值计算缺陷和不平衡数据分类要求,研究一种概率阈值模型计算马田系统阈值;还针对马田系统的若干不足,采用优化模型替代正交表和信噪比筛选关键变量,并使用了一种全方位优化算法求解.通过对8个UCI数据集的实验分析表明,改进的马田系统不仅对不平衡数据有较好的分类效果,且能筛选关键变量,降维效果明显. 相似文献
5.
6.
基于SODM的贝叶斯分类器结构学习及其在客户分类中的应用 总被引:1,自引:0,他引:1
将自组织数据挖掘理论引入贝叶斯分类中,提出一种新颖的贝叶斯分类器结构学习算法.算法将基于依赖分析和评分搜索两种贝叶斯网络结构学习思想相接合,根据互信息测度值选择初始模型,用贝叶斯评分作为筛选中间模型的外准则,能够在不同数据集上完成自适应建模过程,包括选择进入模型的变量、确定具有最优复杂度的模型结构等.在 10 个UCI数据集上进行分类测试,结果表明,贝叶斯分类器结构学习算法分类器的分类精度要高于常用的朴素贝叶斯、树扩展朴素贝叶斯以及基于K2算法的分类器.进一步地,在信用卡客户分类数据集german上的学习曲线和抗干扰试验还表明,与朴素贝叶斯、树扩展朴素贝叶斯以及K2等分类器相比,贝叶斯分类器结构学习算法分类器具有更加稳定的分类性能和更强的抗干扰能力. 相似文献
7.
本文针对模糊C均值聚类在大数据量时收敛较慢以及不能对多种数据结构有效聚类的缺点,结合PIM算法与核方法提出了一种新的高效聚类算法———KPIM算法,并从理论上证明了该算法的收敛性.最后利用标准实验数据IRIS数据集测试,结果表明KPIM算法在保证收敛速度的同时,聚类效果更有效. 相似文献
8.
9.