首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
为了提高软件开发过程的可测性和可信性,本文在分析软件缺陷预测数据特点的基础上,提出了一种新的带特征选择的模糊多目标线性规划分类器FMCLPC-FS。首先,定义了一个模糊隶属度函数来处理原始数据中的噪声和异常值;然后,利用核函数将非线性可分问题转化为线性可分或近似线性可分问题。此外,在多目标线性规划分类器MCLPC中引入了稀疏化函数,可以在分类过程中去除数据集中的冗余特征并选择出最少的重要特征。实验结果显示,与MCLPC和SVC相比,FMCLPC-FS可以显著提高缺陷预测的准确性和分类的可解释性。  相似文献   

2.
针对支持向量机中由于噪声和野值带来的过拟合问题,提出了基于模糊最小二乘支持向量机(fuzzy LS-SVM)的抑制非直达波的移动定位方法。利用一种基于支持向量数据域描述的模糊隶属度函数模型,根据样本到特征空间最小包含超球球心的距离来确定模糊隶属度。仿真结果表明了该方法的稳健性,提高了LS-SVM的抗噪声能力。  相似文献   

3.
在基于微阵列的癌症分类中,由于变量(基因表达)较多,而实验条件较少,因此特征选择和分类方法非常重要。对于疾病诊断,分类器的性能直接影响到最终结果的准确性。本文提出一种新的基因选择和分类方法,这种方法使用基于递归特征排除(RFE)的非线性核支持向量机(SVM)。实验表明本文方法比其它线性分类方法具有更好的整体表现,如线性核支持向量机和Fisher线性判别分析方法;同样本文方法也比一些非线性分类方法更好,如采用非线性核的最小二乘支持向量机(LS-SVM)。实验除了使用测试集,还使用留一校验算法(leave-one-out)用于测试分类器的泛化性能。实验采用可通过互联网获得的AML/ALL数据集和遗传性乳腺癌数据集。  相似文献   

4.
针对现有模糊支持向量机(SVM)使用中直接选择模糊隶属度存在的不足,本文提出了一种对模糊隶属度进行优化的新方法。该方法通过选取曲率变化大、形式简单的幂函数作为候选隶属度函数,并采用格子搜索法寻找最优参数,从而可以确定出最优模糊隶属度。仿真实验表明:在利用模糊SVM训练时间序列数据集时,采用本文方法确定最优模糊隶属度,比目前常用选择模糊隶属度的方法效果好。  相似文献   

5.
在基于微阵列的癌症分类中,由于变量(基因表达)较多,而实验条件较少,因此特征选择和分类方法非常重要。对于疾病诊断,分类器的性能直接影响到最终结果的准确性。本文提出一种新的基因选择和分类方法,这种方法使用基于递归特征排除(RFE)的非线性核支持向量机(SVM)。实验表明本文方法比其它线性分类方法具有更好的整体表现,如线性核支持向量机和Fisher线性判别分析方法;同样本文方法也比一些非线性分类方法更好,如采用非线性核的最小二乘支持向量机(LS-SVM)。实验除了使用测试集,还使用留一校验算法(leave-one- out)用于测试分类器的泛化性能。实验采用可通过互联网获得的AML/ALL数据集和遗传性乳腺癌数据集。  相似文献   

6.
在短期风速预测方面支持向量机已被广泛应用并取得较好的效果。然而,随着应用的深入,其逐渐暴露出两大问题:一,对噪声较为敏感;二,未能充分利用样本已有信息。为进一步提高支持向量机的泛化能力,该文提出模糊流形支持向量机FMSVM。该方法引入模糊技术,保证不同样本区别对待,减少或消除噪声的影响;充分利用流形判别分析的性质,进一步改进支持向量机,在分类决策时同时考虑样本的边界信息、分布特征以及局部流形结构。通过某风场风速数据集上的比较实验验证该方法的有效性。  相似文献   

7.
针对数字音频信号分类问题提出了基于二型模糊集合理论的C均值聚类算法,并在此基础上应用跳跃基因遗传算法对聚类得到的初始模糊模型进行优化,最后采用向量相似性测度准则对优化后的模糊规则集合进行简化,得到最终的模糊分类器模型。与传统的一型模糊集合相比,二型模糊集合可以掌控更多的不确定性信息。基于二型模糊集合理论的C均值聚类算法对样本分布不均匀、结构不规则的样本集的聚类效果更精确。实例仿真结果对比显示,应用二型模糊C均值聚类算法的音频信号分类器比应用一型模糊C均值聚类算法的分类器得到的分类结果更准确。  相似文献   

8.
针对飞机铆钉磁光图像的识别问题,提出了一种基于模糊支持向量机的裂纹有无和裂纹方向自动识别的新方法。该方法首先对铆钉磁光图像进行预处理得到铆钉二值化图像;然后采用阈值法求取铆钉中心;最后将由铆钉中心发出的星形射线矢量作为特征,采用模糊支持向量机方法对铆钉有无裂纹和裂纹方向进行分类。其中,支持向量机的核宽及惩罚常数采用网格法进行选取,并结合模糊隶属度函数解决多类分类问题中存在的错分和拒分现象。实验结果表明,使用训练获得的支持向量机分类器识别裂纹缺陷取得了很好的效果,能够满足自动检测的高实时性要求。  相似文献   

9.
提出智能优化支持向量机算法来提高模型的预测能力和泛化能力。该算法针对支持向量机噪声敏感问题采用小波方法对数据集去噪;利用核主成分分析方法提取数据特征;采用量子粒子群算法优化支持向量机超参数。将该优化算法应用于锅炉负荷短期预测,实验结果表明,该优化算法预测精度较高,收敛速度较快,泛化性能优于其他预测方法,且工程实现容易。  相似文献   

10.
依据AdaBoost思想对BP神经网络、线性判别式以及支撑向量机三种传统分类器进行强化训练形成强分类器。在传统训练的基础上,根据分类器的映射特点选择相应的预处理方法和权值分布函数,降低分类器对数据特点的依赖性,提高AdaBoost的训练效果。对基于左右手运动想象的实际脑电数据进行模式分类,发现采用该思想训练的强分类器能不同程度地提高分类效果。该算法具有一定的推广意义,也证实了AdaBoost算法在脑机接口技术开发中的应用潜力。  相似文献   

11.
针对遥感图像样本较少、特征维数高、特征对分类器贡献差异等问题,提出一种多角度、多尺度特征增益的多级稀疏表示遥感图像分类方法,将遥感图像在8个角度5个尺度高斯分解以提取Gabor视觉特征,将粒子群算法中的惯性权重和加速因子设置为适应度的函数以避免早熟和加速收敛,改进后的粒子群算法寻找中心最大频率和带宽参数的最优取值,通过稀疏表示构建Gabor特征视觉词典,形成遥感图像稀疏系数矩阵作为分类器的输入,在分类器中引入信息熵和条件熵,计算特征增益以区分不同特征对分类器的贡献差异,并给出特征增益支持向量机高斯核函数的表达式实现图像分类。在Pavia University数据集上仿真测试结果为:改进粒子群寻优中心最大频率和带宽组合参数后相比随机确定组合参数的分类精度分别提高67.56%和62.49%,均方误差分别降低0.432 1和0.430 9,30步训练时间增加了37.354 s和34.276 s,分类的总体精度相比未考虑特征增益的SVM、BoVW或PLSA分别提高了1.96%、4.47%和5.39%,Kappa系数分别提升0.038 9、0.068 5和0.076 8。和弦图对分类结果可视化,更加直观地表现出所提方法类间混淆最少,总体分类精度最高。结果表明:二维Gabor滤波器组的中心最大频率和带宽对分类器的性能具有较大影响,通过寻优组合参数值用较小的时间可换取分类性能的较大提升,低频窄带提高了图像的描述能力和可解释性,特征增益可进一步提升分类器的性能,从而整体上改善遥感图像分类效果。  相似文献   

12.
为了解决大规模非线性分类中局部学习的不平衡性问题,提出一种改进的局部支持向量机算法,在高维特征空间中聚类后,为每一个簇构造局部非线性支持向量机。为了克服簇内样本的分布不均衡问题,根据闭合超平面不规则边界的几何特点,经过梯度下降寻找稳定均衡向量,以此构造簇几何中心;再结合簇密度中心共同约束类心形成双重加权中心。然后通过求解加权最小闭球问题实现对大规模样本向量的分类。对照实验显示,除了个别数据集以外,改进的算法在训练时间、测试时间以及测试精度等方面都比另外两种分类算法表现更佳。  相似文献   

13.
Poggio和Smale最近提出的学习理论的一个关键算法(Akeyalgorithm,KA)可用于非线性分类和回归,并避免求解二次规划,但几乎所有的样本是“支持向量“。为此提出了一种稀疏KA算法(SKA),通过设计特定的优化函数,SKA能有效减少“支持向量“,并具备良好的推广能力。将SKA应用于两个实际的模式识别问题,并与支持向量机(SVM)进行比较,验证了SKA的有效性。  相似文献   

14.
为了提高Hadoop平台下大数据人力资源管理推荐的高效性和精准性,采用支持向量机来完成岗位匹配。将人员指标要素样本进行稀疏表示,得到人员指标要素稀疏矩阵,经过支持向量机对样本进行二元分类,判断人员对岗位的匹配程度,最后引入随机变换函数,实现Hadoop平台下大数据环境下的动态推荐。经过实验证明:文中算法人员岗位匹配精准度好,且动态推荐效率高且能实现批量推荐。  相似文献   

15.
分析了增量学习过程中支持向量和非支持向量的转化情况。在此基础上提出一种误分点回溯SVM增量算法,该算法先找出新增样本中被误分的样本,然后在原样本集寻找距误分点最近的样本作为训练集的一部分,重新构建分类器,这样能有效保留样本的分类信息。实验结果表明:该算法比传统的支持向量机增量算法有更高的分类精度。  相似文献   

16.
在实际应用中,少数类样本往往包含重要信息,而传统机器学习方法通常对少数类样本的分类准确率低,且误分类代价较高。针对不平衡文本数据的情感分类问题,以三支采样(three-way sampling, 3WS)与过采样为基础,提出了三支过采样算法(three-way SMOTE,3WOS)和三支边缘过采样算法(three-way borderline-SMOTE,3WOBS),3WOS能够更好地识别边界区域上的数据,3WOBS可以增强边界区域所蕴含的信息。首先,将文本数据构建为超球,获得超球边缘的支持向量。其次,3WOS对边缘上的支持向量直接进行过采样以生成合成新样本并更新样本集,3WOBS则在生成合成新样本后根据给定条件判断是否获得该新样本并更新样本集。最后,将更新的样本集放在不同的基分类器上进行对比实验。实验采用了3个不平衡数据集,并保证了不同的不平衡比。同时,在数据集训练过程中引入粒计算思想,确保模型的鲁棒性。实验结果表明,3WOS-ITSC与3WOBS-ITSC准确率较高且代价低于其他模型,为不平衡文本分类问题提供了新思路。  相似文献   

17.
提出了一种新型网络入侵检测分类模型,设计了一个基于支持向量机(SVM)的分类器。采用因子分析法(FA)将行为样本的众多相关网络特征融合成精简的综合特征,实现了对网络监测数据的降维。利用支持向量决策函数排序法(SVDFRM),通过支持决策向量函数得到网络行为的特征贡献率并提取网络行为的重要特征。KDD99数据集测试实验结果表明,提出的分类模型降维效果显著,具有较好的实时性和较高的检测率。  相似文献   

18.
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%。该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能。  相似文献   

19.
为智能化的解决交通拥堵这一难题,采用了在智能交通系统领域较热门的短时交通流预测识别技术。短时交通流具有非线性、时变性、不确定性、不稳定性等特点,运用对非线性拟合效果较好的支持向量回归机(support vector regression,SVR)和支持向量分类机(support vector classification,SVC)两者相结合来完成短时交通状态的预测识别,通过对交通流进行预测,以及对预测结果进行分类试验,得到了98.1157%的分类率。仿真结果表明,采用这两种方法相结合的方式可以得到较高的分类效率。  相似文献   

20.
为了解决无人承载式车身在复杂工况下由于非线性耦合导致目标函数求解困难的问题,提出基于数据驱动和多目标遗传算法相协同的不确定性优化方法。数据集以车身各结构面的特征尺寸作为输入参数,以车身满载扭转工况最大等效应力、自由模态基频频率和车身侧倾工况的最大等效应力作为输出参数。通过灵敏度分析法分析车身的特征尺寸和优化结果的相关程度。基于支持向量机对数据集进行分类,从种群中筛选出符合期望的个体。基于改进的遗传算法的种群重组方法,使寻优算法在解空间范围内进行全局搜索,获得Pareto最优解。结果表明:被优化的特征尺寸总体减小,且车身优化后最大扭转应力下降8.53%,最大侧倾应力下降4.65%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号