首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
针对垃圾网页检测过程中的"维数灾难"和不平衡分类问题,提出一种融合最优Fisher特征选择的样本加权K近邻分类器用于垃圾网页检测。首先,针对训练数据集进行Fisher特征选择,按Fisher Score从大到小排序,依次选择Fisher Score更大的特征对训练数据集进行样本加权的K近邻分类,根据训练数据集分类结果的AUC值是否增加以确定是否保留某个特征,最后基于保留的最优特征子集对测试数据集进行样本加权的K近邻分类。在WEBSPAM UK-2006数据集上的实验表明:该方法明显优于决策树、支持向量机、朴素贝叶斯、K近邻等传统分类器。与其他相关方法相比,该方法在准确率、F1测度和AUC指标上接近最优结果。  相似文献   

2.
针对人耳图像自身的特点并通过对现有方法的研究,提出了一种先利用LDA/GSVD算法对样本图像进行特征提取,然后运用SVM分类器对样本向量进行分类的人耳识别方法.此外,还对线性判别分析、广义奇异值分解和支持向量机的相关内容做了简要介绍.实验表明,LDA/GSVD很好地解决了在高维、小样本的情况下,使用Fisher线性鉴别分析的特征提取方法存在的病态奇异问题,把它与支持向量机有机地结合起来,构成了一种有效的人耳识别新方法.  相似文献   

3.
为了解决机器学习中不平衡数据难以用于主流数据分类器的问题,面向多种类不平衡数据,提出一种基于超平面排序、分层抽样、多类样本重组的数据采样方法,以得到可用于机器学习的分类平衡数据集。首先,求得不同种类样本的最大公共抽样数,以此确定每类样本的抽样份数;再根据数据到分类超平面的距离,对每类样本的数据进行重新排序,按照等间距对每类样本进行分层采样,确保各个样本的采样总数为最大公共抽样数倍数,构成样本内部的基数样本。最后,排列组合构造平衡数据集合。经过数据分类算法的训练和测试,结果表明:采样方法不仅实现多种类样本之间的数据平衡,也保持了样本的原有数据分布特征,提高了机器学习下游算法的精度。  相似文献   

4.
考虑图像投影鉴别分析问题,为提高特征抽取的速度和识别率,利用图像矩阵直接构造图像散布矩阵,在具有统计不相关的条件下将Foley-Sammon鉴别分析(FSLDA)转化为两目标约束优化问题,并给出了有效投影向量的概念;根据多目标优化的最优性条件可将求取有效投影向量的问题归结为求广义特征方程的最大特征值对应的特征向量,并据此进行特征抽取,进而提出了两目标最优图像投影鉴别分析方法。与其他鉴别投影分析方法相比,该方法具有以下特点:(1)可直接由图像矩阵构建散布矩阵;(2)有效投影向量具有统计不相关性;(3)训练样本的类内散布矩阵不必为可逆的,也不需要求某种形式矩阵的逆。在ORL标准人脸库和NUST603人脸库上的试验结果表明,上述图像投影鉴别分析方法在识别性能上较以往的方法有一定的提高,尤其是特征抽取的速度有明显的提高。  相似文献   

5.
人脸检测是人脸识别的一项重要任务.论文提出了一种基于Gabor滤波特征和一类分类器的正面人脸检测方法.算法首先利用了Gabor滤波器的良好的空间位置与方向的选择特性,采用了四种方向的Gabor滤波器提取人脸样本图像特征并用PCA方法对特征降维,然后用已降维的特征训练支持向量机分类器.最后应用一类分类器分类检测人脸.实验结果证明该方法是十分有效.  相似文献   

6.
针对人脸图像,双树复小波变换具有良好的方向选择性、近似平移不变性,并且能够进行局部多尺度描述.本文利用双树复小波变换的优点,提出了一种基于双树复小波变换人脸特征表示的人脸识别方法.该方法首先利用DT-CWT捕获人脸图像不同尺度和方向的局部特征并形成人脸特征表示,然后结合最大散度差鉴别分析提取有助于分类的鉴别特征.实验结果表明该方法对于人脸分类是有效和鲁棒的.  相似文献   

7.
针对局部三元模式提取到的人脸特征通常具有较高的维数,导致特征的紧致度不高,提出一种新的局部人脸特征提取方法——LTP子模式,并结合线性鉴别分析获得最佳的人脸局部纹理紧致特征的分类投影轴.本文在ORL和AR两个标准人脸库上测试,LTP-SP提取到的人脸特征维数不到原LTP特征的30%,但是识别性能却优于原始算法,因此算法具有较好的应用前景.  相似文献   

8.
分析了增量学习过程中支持向量和非支持向量的转化情况。在此基础上提出一种误分点回溯SVM增量算法,该算法先找出新增样本中被误分的样本,然后在原样本集寻找距误分点最近的样本作为训练集的一部分,重新构建分类器,这样能有效保留样本的分类信息。实验结果表明:该算法比传统的支持向量机增量算法有更高的分类精度。  相似文献   

9.
在基于微阵列的癌症分类中,由于变量(基因表达)较多,而实验条件较少,因此特征选择和分类方法非常重要。对于疾病诊断,分类器的性能直接影响到最终结果的准确性。本文提出一种新的基因选择和分类方法,这种方法使用基于递归特征排除(RFE)的非线性核支持向量机(SVM)。实验表明本文方法比其它线性分类方法具有更好的整体表现,如线性核支持向量机和Fisher线性判别分析方法;同样本文方法也比一些非线性分类方法更好,如采用非线性核的最小二乘支持向量机(LS-SVM)。实验除了使用测试集,还使用留一校验算法(leave-one-out)用于测试分类器的泛化性能。实验采用可通过互联网获得的AML/ALL数据集和遗传性乳腺癌数据集。  相似文献   

10.
在基于微阵列的癌症分类中,由于变量(基因表达)较多,而实验条件较少,因此特征选择和分类方法非常重要。对于疾病诊断,分类器的性能直接影响到最终结果的准确性。本文提出一种新的基因选择和分类方法,这种方法使用基于递归特征排除(RFE)的非线性核支持向量机(SVM)。实验表明本文方法比其它线性分类方法具有更好的整体表现,如线性核支持向量机和Fisher线性判别分析方法;同样本文方法也比一些非线性分类方法更好,如采用非线性核的最小二乘支持向量机(LS-SVM)。实验除了使用测试集,还使用留一校验算法(leave-one- out)用于测试分类器的泛化性能。实验采用可通过互联网获得的AML/ALL数据集和遗传性乳腺癌数据集。  相似文献   

11.
特征提取是手写体数字识别研究中的重要问题,有效、稳定的特征是提高识别率和识别精度的关键。该文提出了一种基于分数本征特征和核非线性分类器的手写数字识别方法,首先找到时频平面的一个轴进行分数傅里叶变换,使不同类别样本在这个轴上最大限度地分开,然后用主元分析进行降维,得到比较稳健的低维特征,再将常用分类器用于特征分类,实现对手写数字的识别。对实际数据进行实验,结果表明上述本征特征与核非线性分类器相结合有较高的识别率和训练、分类效率。  相似文献   

12.
根据意义和功能,现代汉语的量词"把"分为两类3种:个体量词"把1",集合量词"把2",动量词"把3"。研究发现,量词的使用是一种范畴确认或语法归类,最初使用量词的对象的认知原型,在相当程度上制约着同类对象的量词选取;围绕动词"把"及其有关项所形成的意义,是制约量词"把"的类型和使用的重要因素。  相似文献   

13.
推行环境意识产品的生产,不仅能提高产品的国际竞争力,还能够促进公众环境意识的提高。为了促进环境意识产品的生产,有必要评价工业产品的环境意识。本研究采用产品的可降解性、可回收性、环境意识宣传能力、可维修性、能量消耗及耐久度6个指标,研究了如何利用模糊矢量投影的方法评价产品的环境意识。该方法是将每个模糊变量向量投影到模糊权重矢量上,以投影系数来确定结果的优劣。  相似文献   

14.
提出了一种改进的人脸图像标准化算法.该算法先利用改进的人脸图像的垂直灰度积分投影确定脸的左右边界,再根据人脸图像的水平灰度投影曲线来确定眼睛的大致高度.利用由上述方法得到的参数对人脸进行第一次裁剪,然后对人眼精确定位,最后对图像进行旋转、剪切和缩放,获得人脸的标准图像.采用ORL人脸数据库进行仿真实验,结果表明,该算法消除了背景、头发等干扰,保留了人脸识别所需的主要信息,有利于后续的特征提取与识别.  相似文献   

15.
凉山彝语类别量词的特点   总被引:1,自引:0,他引:1  
凉山彝语(北部方言什乍话)的类别量词很丰富。量词主要来源于名词、动词和描摹词(有人将其归为形容词);抽象的量词由具体的量词引申而来。凉山彝语量词有自己独特的一套语义分类标准,名词所指事物都有不同的属性,从量词归类时所依据的属性可以看到该语言所侧重的事物属性。除了这些最显著的语义特点外,量词还有一些变调特点和句法特点。拷贝型量词也是凉山彝语类别量词的一个重要类型,正如其他的藏缅语族语言一样,它是量词发展的初级阶段。  相似文献   

16.
从名词加量词角度分析,汉语中“生命义”名词有其独特的表现形式,“生命义”名词一般能带个体量词,但绝对不能带度量词,另外所搭配动词是“自主”动词的典型形式,它的所指是强“个体性”、有较高生命意志的事物。倾向于加个体量词与绝对不能加度量词,已初步成为“生命义”名词的形式“标签”;事物生命的本质就是事物的强“个体性”,名词的“生命义”与名词在“空间义”方面的强“个体性”特征相对应,以及与强“自主”的行为性特征相对应;“生命义”、强“个体”义、强“自主”义,是一种跨越了词类层级的、而在语法的释义世界中自成系统的、具有相随性的一组意义。  相似文献   

17.
语体是语言功能的变体,它是名词对量词选择的重要制约因素。由于语义约略、惯性意识及语音关系,谈话体中对“个”的选择具有明显倾向;而科学体中,因用语规范统一的要求,对个体量词选择具有规约性和单一性量词选择仅限于主题性名词的选择差异;在科学体和非科学体之间,量词选择具有科学体向非科学体的单向转换关系。  相似文献   

18.
运用概念整合理论对汉英名量异常搭配的认知解读进行共性考察。通过对汉英异常搭配表量结构的分析发现,根据名词和量词所代表两个输入空间之间的空间冲突,汉英名量异常搭配主要有两种:篡位型搭配(基于词性范畴的不兼容)和错位型搭配(基于语义范畴的错位);汉英名量异常搭配的认知解读并不是一次简单的四空间概念整合过程,而是更为错综复杂的心理认知程序,有可能涉及到多个输入空间,其中有的输入空间并非存在于显性的语言表述中,而是隐匿于量词背后该量词范畴中的原型名词。汉英异常搭配表量结构中的量词具有激活并突显名词所代表心理空间某种属性的作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号