首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
华锐  梁娜 《统计与决策》2012,(23):69-71
对样本分类的方法很多,比如广义朴素贝叶斯分类器[1],层次-聚类模型[2],神经网络[3]等,但对小样本的分类却存在很多困难,如:小样本的代表性不够,不能覆盖所有属性,分类器分类效果不佳等问题,文章提出的结合拉普拉斯校准的特征加权朴素贝叶斯分类器操作简单,能高效地解决了以上问题。  相似文献   

2.
分类是十分基础且很关键的数据分析技术,而基于贝叶斯理论的朴素贝叶斯分类技术是当前数据分析领域的一个研究热点.文章针对条件独立性假设提出了基于主成分分析的改进方法,以期能够充分体现朴素贝叶斯分类器在分类中的优势,实现改进分类效果的目的.  相似文献   

3.
文章主要探讨了一种贝叶斯分类方法在肝炎后肝硬化中医诊断中的应用,介绍了粗糙集理论、广义关联度系数以及贝叶斯分类模型等数据挖掘技术。并且,运用粗糙集理论及广义关联度系数方法,对287例肝炎后肝硬化的症状、体征进行了属性选择。进一步,利用树增广的朴素贝叶斯分类算法,构建了肝炎后肝硬化中医证候分类模型。实验表明这种模型对肝炎后肝硬化的6种主要证候分类的符合率达83%。研究结果对肝炎后肝硬化的中医临床诊断具有参考意义。  相似文献   

4.
文章主要探讨了一种贝叶斯分类方法在肝炎后肝硬化中医诊断中的应用,介绍了粗糙集理论、广义关联度系数以及贝叶斯分类模型等数据挖掘技术.并且,运用粗糙集理论及广义关联度系数方法,对287例肝炎后肝硬化的症状、体征进行了属性选择.进一步,利用树增广的朴素贝叶斯分类算法,构建了肝炎后肝硬化中医证候分类模型.实验表明这种模型对肝炎后肝硬化的6种主要证候分类的符合率达83%.研究结果对肝炎后肝硬化的中医临床诊断具有参考意义.  相似文献   

5.
分类发现是数据挖掘的重要内容,贝叶斯分类和决策树在数据挖掘中应用相当广泛,它们是生成分类器的两种有效方法。文章分别用两种方法对顾客满意度进行分类及预测,并将两种方法进行比较分析,认为用决策树分类法来预测顾客满意度具有简洁、高效等特点。  相似文献   

6.
评估分类预测模型优良性的做法是衡量其预测准确度,即正判率.文章从四个不同角度,构建基于混合策略的组合预测模型、持续学习的朴素贝叶斯分类器、变量集预处理、分阶段逐步实施的分类预测模型,讨论了如何审慎地选择或以恰当的方式运用一种或几种合适的分类算法,来有效地提升分类预测的正判率.其中,基于混合策略的组合预测模型对正判率的提升幅度明显,而持续学习的朴素贝叶斯分类器对模型优化也显得简单而有效.  相似文献   

7.
文章针对现有的大部分单一分类器预测精度不而,且具有一定限制条件的弱点,提出了应用组合分类模型对中小企业信贷违约预判的方法.以调整的SVM后验概率分类器和多维正态分布概率分类器为基本模型,构建了基于贝叶斯规则动态分配权重的组合分类模型,并把它应用于中小企业信贷违约预判.结果表明,该模型克服了普通组合预测模型权重分配固定的弱点,可获得较高的稳健性和分类精度.  相似文献   

8.
朴素贝叶斯是一种处理分类问题的常用方法,但它的属性条件独立性假设在实际应用中难以成立,导致其分类性能降低。针对这一问题,文章提出了基于改进PCA的朴素贝叶斯分类算法,该算法通过Pearson和Kendall系数计算出属性间的相关性大小,基于主成分分析筛选出新的属性集,使其尽量满足条件独立性假设,并对新数据集进行朴素贝叶斯分类。实验结果表明,该方法有效地提高了分类准确率。  相似文献   

9.
为了准确对肿瘤病理类型进行诊断,减轻患者因诊断造成的不便与痛楚,提出了基于变精度粗糙集理论与贝叶斯网络的肿瘤诊断方法。对930例甲状腺肿瘤病例使用变精度粗糙集与贝叶斯网络方法导出诊断规则,并与粗糙集对比后发现,基于变精度粗糙集与贝叶斯网络的诊断规则准确性高于粗糙集理论的诊断准确性。基于变精度粗糙集与贝叶斯网络的肿瘤诊断模型对提高肿瘤诊断水平具有更好的临床使用价值,为肿瘤的诊断与分类提供了一种新思路。  相似文献   

10.
过滤式特征选择是一种在基因表达数据上广泛使用且简单有效的方法。针对其特征子集冗余性问题,使用皮尔逊相关系数,提出一种带冗余去除的特征选择算法。研究了在不同相关强度下特征子集冗余去除及分类准确度效果。实验选用三个不同的基因表达数据集,使用支持向量机、k近邻、随机森林作为分类器分别进行了测试。实验结果表明,带冗余去除的过滤式特征选择方法在不同分类器上均能获得良好的分类性能,另外,此方法在降低特征子集维度的同时能够提高分类准确度。  相似文献   

11.
宋磊 《统计与决策》2011,(17):37-39
为了解决支持向量机算法在大样本处理的“过学习”现象,文章设计出在并行系统中使用的多分类器支持向量机算法,应用多支持向量机分类器系统代替单一分类器,解决了大样本数据集上学习内存开销大、训练速度慢的缺点;同时,提出了一种自组织选择性融合算法,根据终止法则找到最优复杂度的融合模型,自主更新各分类器并调整其分类性能,把各分类器的分类结果融合为最终的分类,有效解决了大样本多分类器融合受子样本分布状态影响、各分类器学习能力相差过大的缺点,从而提高了训练效率和分类效率。  相似文献   

12.
徐雪松  王四春 《统计研究》2012,29(4):108-112
根据免疫否定选择原理,设计了基于掩码分段匹配的否定选择分类器,克服连续r位匹配法的缺陷。给出了适用于免疫优化的分类规则编码及分类信息分的评价。通过免疫进化对其进行群体优化以约简数据规则集。避免了传统分类算法缺乏全局优化能力的缺点,提高了对样本的识别能力。实验结果表明本文方法提高了数据分类的准确性,在数据分类准确率及平均信息分上优于传统的分类方法。  相似文献   

13.
文章着重研究了带有有序分类变量的结构方程模型的模型选择问题,并将一个基于贝叶斯准则的统计量称为测度,应用到此类模型中进行模型选择。通过实例分析说明了上述方法的应用,并给出了根据贝叶斯因子进行模型选择的结果。  相似文献   

14.
文章基于平均策略,使用BP神经网络对贝叶斯判别、费歇尔线性判别和logistic回归判别财务危机的输出新变量进行加权平均再判别,并和单一方法判别的效果比较。应用双层分类器做了一次财务危机判别的新尝试。  相似文献   

15.
为简化ANN网络结构、降低MSVM识别的复杂度,提高动态过程质量异常模式识别效率,文章提出了基于ANN-SVM的动态过程质量异常模式识别模型.首先,在ANN分类器中应用均值特征把整体变化趋势上具有相似性的六种质量模式划分为三大类别.其次,利用SVM分类器对这三类进行再识别.应用均值特征构建的ANN网络结构简单,无需对其进行参数优化,并且ANN分类器将多分类问题转化为三个两分类问题,降低了MSVM的分类数.仿真结果表明:所提出的识别模型比单一采用ANN或MSVM分类器的整体识别精度均有显著提高,且大大缩减了模型训练时间.  相似文献   

16.
分类回归模型是回归模型家族的一个重要组成部分.文章针对现有的分类回归模型均采用选择性回归计算所存在的问题,建立了贝叶斯平均分类回归模型,并将其用于人民币汇率预测的实证研究.在实证研究时选取人民币对主要货币的汇率序列,对使用时间序列模型的预测结果与贝叶斯平均分类回归模型的预测结果进行对比分析,证明贝叶斯平均分类回归模型确实能够提高预测准确度.还使用贝叶斯平均分类回归模型对比分析了现有研究文献的预测效果,结果表明分类回归模型具有一定程度的优越性.  相似文献   

17.
张宸  韩夏 《统计与决策》2017,(14):45-48
当前网络舆情信息存在数据量大、流动快及数据非结构化等特点,难以实现对其快速、准确的分类.SVM算法和朴素贝叶斯算法都是性能优秀的传统分类算法,但无法满足快速处理海量数据.文章利用Hadoop平台可并行处理分布式数据存储的优良特性,提出了HSVM_WNB分类算法,将采集的舆情文档依照HDFS架构进行本地化存储,并通过MapReduce进程完成并行分类处理.最后利用实验验证,本算法能够有效提升网络舆情分类能力与分类效率.  相似文献   

18.
在AI领域中,备受关注的一个问题是如何获得更好的分类,尤其是对于多分类的情形。目前,针对多分类算法已取得了大量的研究成果,很多较为高效的多分类算法也已应用到实践中,而对于多分类算法的研究仍然备受关注。以BT-SVM为基分类器,提出一种带阈值的新型动态加权多分类器集成的方法,并通过模拟和实证分析验证该算法的有效性,研究表明该算法对于平衡和非平衡数据的分类效果表现得都比较优良。  相似文献   

19.
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐舍在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器.实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类.  相似文献   

20.
当检验数据中包含有新的类别时,传统判别分析方法所构造的分类器,无法识别这些新类别,只能将检验数据划分到学习阶段所遇到的已知类别当中,分类正确率较低.为克服这一缺陷,文章引入一种基于混合模型的动态判别分析方法,可自适应调整原有的分类器,使之能够发现新类别,并显著提高分类正确率.一个实际数据的分类结果验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号