首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 81 毫秒
1.
分类是十分基础且很关键的数据分析技术,而基于贝叶斯理论的朴素贝叶斯分类技术是当前数据分析领域的一个研究热点.文章针对条件独立性假设提出了基于主成分分析的改进方法,以期能够充分体现朴素贝叶斯分类器在分类中的优势,实现改进分类效果的目的.  相似文献   

2.
评估分类预测模型优良性的做法是衡量其预测准确度,即正判率.文章从四个不同角度,构建基于混合策略的组合预测模型、持续学习的朴素贝叶斯分类器、变量集预处理、分阶段逐步实施的分类预测模型,讨论了如何审慎地选择或以恰当的方式运用一种或几种合适的分类算法,来有效地提升分类预测的正判率.其中,基于混合策略的组合预测模型对正判率的提升幅度明显,而持续学习的朴素贝叶斯分类器对模型优化也显得简单而有效.  相似文献   

3.
文章主要探讨了一种贝叶斯分类方法在肝炎后肝硬化中医诊断中的应用,介绍了粗糙集理论、广义关联度系数以及贝叶斯分类模型等数据挖掘技术。并且,运用粗糙集理论及广义关联度系数方法,对287例肝炎后肝硬化的症状、体征进行了属性选择。进一步,利用树增广的朴素贝叶斯分类算法,构建了肝炎后肝硬化中医证候分类模型。实验表明这种模型对肝炎后肝硬化的6种主要证候分类的符合率达83%。研究结果对肝炎后肝硬化的中医临床诊断具有参考意义。  相似文献   

4.
文章主要探讨了一种贝叶斯分类方法在肝炎后肝硬化中医诊断中的应用,介绍了粗糙集理论、广义关联度系数以及贝叶斯分类模型等数据挖掘技术.并且,运用粗糙集理论及广义关联度系数方法,对287例肝炎后肝硬化的症状、体征进行了属性选择.进一步,利用树增广的朴素贝叶斯分类算法,构建了肝炎后肝硬化中医证候分类模型.实验表明这种模型对肝炎后肝硬化的6种主要证候分类的符合率达83%.研究结果对肝炎后肝硬化的中医临床诊断具有参考意义.  相似文献   

5.
华锐  梁娜 《统计与决策》2012,(23):69-71
对样本分类的方法很多,比如广义朴素贝叶斯分类器[1],层次-聚类模型[2],神经网络[3]等,但对小样本的分类却存在很多困难,如:小样本的代表性不够,不能覆盖所有属性,分类器分类效果不佳等问题,文章提出的结合拉普拉斯校准的特征加权朴素贝叶斯分类器操作简单,能高效地解决了以上问题。  相似文献   

6.
基于灰色关联度的属性约简方法   总被引:1,自引:1,他引:0  
属性约简是粗集理论研究的核心内容之一,其主要思想是在保持分类能力不变的前提下,消除决策表中冗余的属性,推导出最少的属性集合和最小的决策规则.目前属性约简方法主要包括:①基于信息熵的启发式算法,该算法计算信息熵时的时间复杂度较高;②基于可辨别矩阵和逻辑运算的属性约简,这种方法能够得到全部约简结果,但计算过程中析取逻辑表达式很多,甚至是重复的,这导致化简时计算量很大,且对于大样本、高维数据的约简建立的可辨别矩阵具有较高的空间复杂度.本文结合灰色关联理论提出了一种新的属性约简方法,以灰色关联度作为属性重要性的测度,采用启发式算法,先计算出属性的核,然后依据属性的重要程度依次在核的基础上添加属性,直到所得的属性子集与原条件属性的分类能力相同为止,对于高维属性,可以采用优化搜索策略,寻找最佳的属性集.  相似文献   

7.
朴素贝叶斯网分类器是贝叶斯分类器的一种,文章将其应用到现代教育测量的认知诊断分类中,对0,1计分下的认知诊断进行了实验,并与认知诊断中典型的分类方法进行了比较。实验结果表明,利用贝叶斯网分类器分类效果明显占优。  相似文献   

8.
文章提出一种基于粗糙集属性约简算法的循环经济指标体系构建方法。利用粗糙集理论的属性约简算法进行指标初始筛选,运用主成分分析方法选择出最优指标体系集,并通过Bayes统计判别法验证其合理性,最终得到循环经济指标体系构建方法模型。选取甘肃省10个市州2012年的统计数据进行了实证研究。  相似文献   

9.
在采用聚类方法产生训练集的基础上,运用粗集理论离散化预处理该训练集,可以更好的提高分类精度.文章运用PAM算法聚类原始样本构成训练集,再利用布尔逻辑和粗集理论结合的离散化算法离散化该训练集,并以此离散化的训练集训练分类器.实验结果证明,基于该方法在相同的数据集上分类,比仅基于PAM算法预处理的RDDTE方法产生的分类精度最高提高了15.5%,且选用更少量的训练集.  相似文献   

10.
基于最大熵的测量不确定度的贝叶斯评估方法   总被引:4,自引:0,他引:4  
为提高测量不确定度的评估精度,文章提出了一种基于最大熵理论的贝叶斯评估方法。首先,利用最大熵原理,求解出样本信息的概率密度函数;然后结合先验信息,采用贝叶斯评估方法,得到后验信息的概率密度函数;最终计算出测量结果的不确定度。该方法含有的主观假设少,并充分利用了历史测量数据,评估方法合理。实验结果表明,基于最大熵理论的测量不确定度贝叶斯评估方法可靠性高,计算结果更加精确。  相似文献   

11.
Theoretical considerations of kurtosis, whether of partial orderings of distributions with respect to kurtosis or of measures of kurtosis, have tended to focus only on symmetric distributions. With reference to historical points and recent work on skewness and kurtosis, this paper defines anti-skewness and uses it as a tool to discuss the concept of kurtosis in asymmetric univariate distributions. The discussion indicates that while kurtosis is best considered as a property of symmetrised versions of distributions, symmetrisation does not simply remove skewness. Skewness, anti-skewness and kurtosis are all inter-related aspects of shape. The Tukey g and h family and the Johnson Su family are considered as examples.  相似文献   

12.
在今天越来越激烈的市场竞争之中,越来越多的公司已经从产品驱动的市场竞争策略转向客户驱动的市场竞争策略。并且随着计算机技术及数据挖掘方法的飞速发展,直接市场营销越来越受到重视。如何选择目标客户邮寄货单的问题也就越来越引起市场直销者的兴趣。计分模型及增益表选择方法和单群预测及选择方法是目前普遍采用的两种客户选择方法。在平稳市场的假设下,客户的购买模式服从著名的重复购买理论。基于这个理论,本文提出了一种新的客户选择方法,即两群预测及选择方法。应用实际的客户数据比较这三种不同的方法,结果表明新方法表现最好。  相似文献   

13.
This paper is concerned with the analysis of repeated measures count data overdispersed relative to a Poisson distribution, with the overdispersion possibly heterogeneous. To accommodate the overdispersion, the Poisson random variable is compounded with a gamma random variable, and both the mean of the Poisson and the variance of the gamma are modelled using log linear models. Maximum likelihood estimates (MLE) are then obtained. The paper also gives extended quasi-likelihood estimates for a more general class of compounding distributions which are shown to be approximations to the MLEs obtained for the gamma case. The theory is illustrated by modelling the determination of asbestos fibre intensity on membrane filters mounted on microscope slides.  相似文献   

14.
张征宇  朱平芳 《统计研究》2010,27(4):103-108
近年来运用空间计量经济模型进行实证分析的文献都普遍采用空间自回归(SAR)形式的设定,对参数的估计也多采用极大似然(MLE)的方法。在经典多元线性回归模型中,仅有被解释变量的测量误差并不会影响系数估计的一致性。本文证明对于SAR模型,即使仅当被解释变量存在测量误差时,且无论该测量误差是否与模型本身的扰动项相关,普遍采用的MLE都将是不一致的。为此,Hausman型的设定检验被推广到SAR模型中用以判别是否存在被解释变量的测量误差。当零假设被拒绝时,我们说明由Kelejian&Prucha(1998), Lee(2003)提出的二阶段最小二乘法仍然可以得到参数的一致估计。Monte Carlo模拟的结果与我们的理论预期一致。最后我们用一个估计地方环境支出外溢效应的实例说明如何运用本文所提的方法来检验应用空间自回归模型时可能存在的测量误差。  相似文献   

15.
张广科 《统计研究》2009,26(9):70-76
 基于9省调研,本文对目前新型农村合作医疗对农户疾病风险的分担能力及目标约束下的筹资规模方法进行了实证与比较分析。研究显示,农村居民中疾病风险分布的差异性较大;不同补偿方案下,新型农村合作医疗对农户疾病经济风险的分担能力差异较大;新型农村合作医疗制度目标的实现程度决定了筹资规模的大小。  相似文献   

16.
预防性储蓄重要性的测算方法及其比较   总被引:2,自引:0,他引:2       下载免费PDF全文
郭香俊  杭斌 《统计研究》2009,26(11):61-68
 本文对西方预防性储蓄研究文献中预防性储蓄重要性的测算方法进行了详细总结和比较,对其在中国的应用和适用性也做了简要的介绍和讨论,以期起到抛砖引玉的作用。  相似文献   

17.
偏离-份额分析空间模型及其应用   总被引:11,自引:0,他引:11       下载免费PDF全文
 传统的偏离-份额分析模型没有考虑区域之间的空间交互作用,为此国外出现了空间拓展模型的探索、论证与应用,然而目前国内仍主要停留在对传统模型的应用。本文探讨了如何构建空间权重矩阵来表示区域间的空间相互作用,并介绍了国外较成熟的偏离-份额分析空间模型,以江苏为例应用传统模型和空间模型进行了实证对比分析。结果表明,江苏省第二、三产业在全国具有较强的竞争力,经济总量及各产业的增长中,竞争力因素比产业结构因素贡献更大;但相对周边邻近省份,江苏省各产业并没有表现出竞争优势;邻近省份对江苏经济增长产生了较大的正面影响,但江苏没有能够充分利用这种影响,因此带来了一定的理论经济损失。  相似文献   

18.
 本文首先对经典行为均衡汇率模型简要解读。指出其在估算实践中,暗含技术上的严格假定。本文给出放松假定的改进。通过人民币均衡汇率估算的经验分析,对改进工作进行检验。为人民币均衡汇率估算研究搭建一个深入分析的技术平台。经验分析的主要结论是,人民币实际汇率短期存在低估,但与长期均衡汇率比较,其实际汇率一直存在高估的情况。鉴于均衡汇率水平的决定机制复杂,人民币汇率水平升值调整必须慎之又慎。  相似文献   

19.
关于计量经济学模型随机扰动项的讨论   总被引:1,自引:0,他引:1       下载免费PDF全文
 论文指出了计量经济学模型中源生的随机扰动项和衍生的随机误差项之间的区别;讨论或证明了,如果模型存在总体设定误差和变量观测误差,在很多情况下将导致随机误差项对Gauss假设以及正态性假设的违背。  相似文献   

20.
当前的价格形势及政策抉择   总被引:1,自引:0,他引:1       下载免费PDF全文
当前,我国居民消费价格(CPI)高位继续上涨,工业品出厂价格(PPI)和固定资产投资价格加速上涨,房地产和股票等资产类价格出现滞涨和大幅回落态势。本轮价格上涨是在全球性需求比较旺盛、资金比较宽裕的背景下,主要是由于成本上升及供给不足推动的,即供给环节问题是导致当前我国价格上涨的直接原因。为此,宏观调控的政策重点应是控信贷、保供给、抑通胀。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号