首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为解决网络应用加密传输中大部分分析加密流量的方法忽略通信维持的简化阶段的流量分类,并且网络中应用指纹有大量重复的问题,提出一种新型的加密流量分类方法。将报文长度作为重要的特征分析,通过高斯混合模型建模解决应用指纹的重复问题;通过限制聚类将同一应用长度相近的指纹尽可能划分到同一簇内,提高了收敛速度。实验结果表明:提出的研究方法与传统的加密流量分类方法相比,其TPR和FPR分别提高10.8%和15.7%,效果明显提高。  相似文献   

2.
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%。该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能。  相似文献   

3.
针对遥感图像样本较少、特征维数高、特征对分类器贡献差异等问题,提出一种多角度、多尺度特征增益的多级稀疏表示遥感图像分类方法,将遥感图像在8个角度5个尺度高斯分解以提取Gabor视觉特征,将粒子群算法中的惯性权重和加速因子设置为适应度的函数以避免早熟和加速收敛,改进后的粒子群算法寻找中心最大频率和带宽参数的最优取值,通过稀疏表示构建Gabor特征视觉词典,形成遥感图像稀疏系数矩阵作为分类器的输入,在分类器中引入信息熵和条件熵,计算特征增益以区分不同特征对分类器的贡献差异,并给出特征增益支持向量机高斯核函数的表达式实现图像分类。在Pavia University数据集上仿真测试结果为:改进粒子群寻优中心最大频率和带宽组合参数后相比随机确定组合参数的分类精度分别提高67.56%和62.49%,均方误差分别降低0.432 1和0.430 9,30步训练时间增加了37.354 s和34.276 s,分类的总体精度相比未考虑特征增益的SVM、BoVW或PLSA分别提高了1.96%、4.47%和5.39%,Kappa系数分别提升0.038 9、0.068 5和0.076 8。和弦图对分类结果可视化,更加直观地表现出所提方法类间混淆最少,总体分类精度最高。结果表明:二维Gabor滤波器组的中心最大频率和带宽对分类器的性能具有较大影响,通过寻优组合参数值用较小的时间可换取分类性能的较大提升,低频窄带提高了图像的描述能力和可解释性,特征增益可进一步提升分类器的性能,从而整体上改善遥感图像分类效果。  相似文献   

4.
依据AdaBoost思想对BP神经网络、线性判别式以及支撑向量机三种传统分类器进行强化训练形成强分类器。在传统训练的基础上,根据分类器的映射特点选择相应的预处理方法和权值分布函数,降低分类器对数据特点的依赖性,提高AdaBoost的训练效果。对基于左右手运动想象的实际脑电数据进行模式分类,发现采用该思想训练的强分类器能不同程度地提高分类效果。该算法具有一定的推广意义,也证实了AdaBoost算法在脑机接口技术开发中的应用潜力。  相似文献   

5.
针对当前中文文本分类方法难以平衡分类精度和学习效率的问题,提出了一种基于极限学习机(ELM)的中文文本分类方法,该方法包括预处理模块、文本特征提取模块、特征融合模块和基于极限学习机的分类模块。在分类模块中,提出采用单隐层神经网络作为分类器并使用ELM算法来训练分类器,有效地平衡模型性能和学习效率。同时分别针对不同的特征训练分类器,集成不同分类器的输出得到最后的分类结果,有效提高了平衡分类精度,并在电网档案管理系统的档案归类任务中对该模型进行应用评估。实验结果表明,该模型不仅有较高的分类精度,而且在训练和测试两个阶段模型的计算都具有较低的代价。所提方法适用于海量数据下的中文文本分类场景,具有重要的研究意义和推广价值。  相似文献   

6.
特征提取是手写体数字识别研究中的重要问题,有效、稳定的特征是提高识别率和识别精度的关键。该文提出了一种基于分数本征特征和核非线性分类器的手写数字识别方法,首先找到时频平面的一个轴进行分数傅里叶变换,使不同类别样本在这个轴上最大限度地分开,然后用主元分析进行降维,得到比较稳健的低维特征,再将常用分类器用于特征分类,实现对手写数字的识别。对实际数据进行实验,结果表明上述本征特征与核非线性分类器相结合有较高的识别率和训练、分类效率。  相似文献   

7.
针对密集战术通信信号的实时分选问题,提出了采用TMS320C25开发系统为预处理器,BAM/NBAM(双向联想存储器/新型双向联想存储器)为信号分类器的新型分类系统结构,并分析了信号特征及提取方法。对BAM/NBAM作为信号分类器的结构、原理、性能作了探讨。结果表明,基于BAM/NBAM的通信信号分类方法是有效的,其性能优于传统的线性分类方法。  相似文献   

8.
随着P2P技术的发展及网络流量的急剧增加,如何对不同类型的流量进行控制成为各园区网络管理人员要加以解决的问题。文章提出一种基于主机行为的流量检测方法。该方法不对数据包载荷部分的内容进行检测,而是分析主机通信时的连接特征,并根据特征得到流量的分类。  相似文献   

9.
针对垃圾网页检测过程中的"维数灾难"和不平衡分类问题,提出一种融合最优Fisher特征选择的样本加权K近邻分类器用于垃圾网页检测。首先,针对训练数据集进行Fisher特征选择,按Fisher Score从大到小排序,依次选择Fisher Score更大的特征对训练数据集进行样本加权的K近邻分类,根据训练数据集分类结果的AUC值是否增加以确定是否保留某个特征,最后基于保留的最优特征子集对测试数据集进行样本加权的K近邻分类。在WEBSPAM UK-2006数据集上的实验表明:该方法明显优于决策树、支持向量机、朴素贝叶斯、K近邻等传统分类器。与其他相关方法相比,该方法在准确率、F1测度和AUC指标上接近最优结果。  相似文献   

10.
随着科技的进步移动通信产业已经与人类生活、社会发展产生紧密地结合在一起,对特定单一场景或一定区域内条件下的无线信道进行分类、识别,实现特定场景进行分析以及无线网络的优化,具有重要意义。针对这一背景,提出了一种结合随机森林算法的信道场景分类模型。对不同的信道场景物理特征进行提取与降维,基于多分类器集成的原理,结合多个决策树与随机向量决策树的构造原理,创建信道场景的随机森林分类模型。实验结果表明:所采用的分类方法的总模型准确率约为89.90%,能有效地实现信道场景的分类识别。  相似文献   

11.
针对衣物属性分类的多样性和复杂性,传统算法和并行卷积神经网络难以准确快速地对衣物属性分类,提出了基于卷积神经网络的衣物属性分类方法,从衣物图像不同角度和不同位置特征出发,利用加入了DenseNet网络的模型自动完成特征学习,得到全面的衣物属性分类信息,然后利用cen误差函数优化softmax分类器,提高类间分散性和类内紧密性。结果表明:与并行卷积神经网络和传统算法相比,该网络结构收敛速度更快,在衣物多种属性上分类准确率更高。  相似文献   

12.
新型城镇化进程中凸显的民生问题亟须以公共服务精细化治理进行回应.对重庆南坪街道公共服务改革的个案分析表明:公共服务精细化治理需要以载体重构实现行政流程再造和公共服务的标准化、分类化,以政府为主导构建复合式协作治理框架,形成以需求为导向的公共服务供需匹配配套机制.正确处理政府、社会、市场的关系,是精细化治理的进一步提升方向.  相似文献   

13.
特征提取是雷达目标识别研究中的重要问题,有效、稳健的特征是提高识别率的关键。核判别分析(KDA)是一种抽取非线性特征的有效方法,但它会因为奇异性问题而难以求解。基于子空间投影的思想,给出一种最优的核判别分析(OKDA)方法,用于对雷达目标的距离像进行特征提取,然后采用基于核的非线性分类器对所提取的特征进行分类,实现对雷达目标的识别。分别对仿真和实测距离像进行实验,结果表明该方法具有较好的识别效果。  相似文献   

14.
人脸检测是人脸识别的一项重要任务.论文提出了一种基于Gabor滤波特征和一类分类器的正面人脸检测方法.算法首先利用了Gabor滤波器的良好的空间位置与方向的选择特性,采用了四种方向的Gabor滤波器提取人脸样本图像特征并用PCA方法对特征降维,然后用已降维的特征训练支持向量机分类器.最后应用一类分类器分类检测人脸.实验结果证明该方法是十分有效.  相似文献   

15.
针对核空间中大数据集的计算代价高问题,提出用NSVM方法减少分类器的训练数据。先用NSVM、核主成分分析(KPCA)和贪婪KPCA分别从全部训练数据中提取训练分类器的子集;再用子集训练分类器,并用训练和测试数据的错分率对分类结果进行评价。在两个数据集和两种分类器中,用KPCA提取的子集训练的分类器的分类性能弱于NSVM和贪婪KPCA,但用贪婪KPCA提取的子集训练的分类器的泛化能力弱于NSVM。仿真结果表明,用NSVM方法提取的子集训练的分类器,不仅保证了分类器的泛化能力,也降低了分类算法的计算复杂度。  相似文献   

16.
TAN是一种非常有效的贝叶斯网分类器,但其不足之处是缺少根据实际问题放宽假设限制条件的能力.首先提出了增强属性的概念,通过有差别地处理属性变量实现对TAN分类器的扩展,从而得到了增强的TAN分类器(ATAN).其次,引入数据挖掘工具Weka中更一般化的TAN学习算法,并在此基础上实现了ATAN学习算法.利用Weka实验平台进行的大量测试表明,对于大多数分类问题,ATAN的确能够在不增加时间复杂度的前提下得到相对于TAN更高的分类准确率.  相似文献   

17.
在基于微阵列的癌症分类中,由于变量(基因表达)较多,而实验条件较少,因此特征选择和分类方法非常重要。对于疾病诊断,分类器的性能直接影响到最终结果的准确性。本文提出一种新的基因选择和分类方法,这种方法使用基于递归特征排除(RFE)的非线性核支持向量机(SVM)。实验表明本文方法比其它线性分类方法具有更好的整体表现,如线性核支持向量机和Fisher线性判别分析方法;同样本文方法也比一些非线性分类方法更好,如采用非线性核的最小二乘支持向量机(LS-SVM)。实验除了使用测试集,还使用留一校验算法(leave-one-out)用于测试分类器的泛化性能。实验采用可通过互联网获得的AML/ALL数据集和遗传性乳腺癌数据集。  相似文献   

18.
为了解决机器学习中不平衡数据难以用于主流数据分类器的问题,面向多种类不平衡数据,提出一种基于超平面排序、分层抽样、多类样本重组的数据采样方法,以得到可用于机器学习的分类平衡数据集。首先,求得不同种类样本的最大公共抽样数,以此确定每类样本的抽样份数;再根据数据到分类超平面的距离,对每类样本的数据进行重新排序,按照等间距对每类样本进行分层采样,确保各个样本的采样总数为最大公共抽样数倍数,构成样本内部的基数样本。最后,排列组合构造平衡数据集合。经过数据分类算法的训练和测试,结果表明:采样方法不仅实现多种类样本之间的数据平衡,也保持了样本的原有数据分布特征,提高了机器学习下游算法的精度。  相似文献   

19.
文章在阐述当前医保医疗服务监管方式及存在问题的基础上,探讨如何应用信息技术加强监管和提升监管效果的途径?方法和具体实施的技术框架,为进一步实现医保医疗服务信息化监管,提升医保基金精细化管理水平提供建议?  相似文献   

20.
在基于微阵列的癌症分类中,由于变量(基因表达)较多,而实验条件较少,因此特征选择和分类方法非常重要。对于疾病诊断,分类器的性能直接影响到最终结果的准确性。本文提出一种新的基因选择和分类方法,这种方法使用基于递归特征排除(RFE)的非线性核支持向量机(SVM)。实验表明本文方法比其它线性分类方法具有更好的整体表现,如线性核支持向量机和Fisher线性判别分析方法;同样本文方法也比一些非线性分类方法更好,如采用非线性核的最小二乘支持向量机(LS-SVM)。实验除了使用测试集,还使用留一校验算法(leave-one- out)用于测试分类器的泛化性能。实验采用可通过互联网获得的AML/ALL数据集和遗传性乳腺癌数据集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号