共查询到20条相似文献,搜索用时 81 毫秒
1.
分类是十分基础且很关键的数据分析技术,而基于贝叶斯理论的朴素贝叶斯分类技术是当前数据分析领域的一个研究热点.文章针对条件独立性假设提出了基于主成分分析的改进方法,以期能够充分体现朴素贝叶斯分类器在分类中的优势,实现改进分类效果的目的. 相似文献
2.
评估分类预测模型优良性的做法是衡量其预测准确度,即正判率.文章从四个不同角度,构建基于混合策略的组合预测模型、持续学习的朴素贝叶斯分类器、变量集预处理、分阶段逐步实施的分类预测模型,讨论了如何审慎地选择或以恰当的方式运用一种或几种合适的分类算法,来有效地提升分类预测的正判率.其中,基于混合策略的组合预测模型对正判率的提升幅度明显,而持续学习的朴素贝叶斯分类器对模型优化也显得简单而有效. 相似文献
3.
4.
5.
对样本分类的方法很多,比如广义朴素贝叶斯分类器[1],层次-聚类模型[2],神经网络[3]等,但对小样本的分类却存在很多困难,如:小样本的代表性不够,不能覆盖所有属性,分类器分类效果不佳等问题,文章提出的结合拉普拉斯校准的特征加权朴素贝叶斯分类器操作简单,能高效地解决了以上问题。 相似文献
6.
基于灰色关联度的属性约简方法 总被引:1,自引:1,他引:0
属性约简是粗集理论研究的核心内容之一,其主要思想是在保持分类能力不变的前提下,消除决策表中冗余的属性,推导出最少的属性集合和最小的决策规则.目前属性约简方法主要包括:①基于信息熵的启发式算法,该算法计算信息熵时的时间复杂度较高;②基于可辨别矩阵和逻辑运算的属性约简,这种方法能够得到全部约简结果,但计算过程中析取逻辑表达式很多,甚至是重复的,这导致化简时计算量很大,且对于大样本、高维数据的约简建立的可辨别矩阵具有较高的空间复杂度.本文结合灰色关联理论提出了一种新的属性约简方法,以灰色关联度作为属性重要性的测度,采用启发式算法,先计算出属性的核,然后依据属性的重要程度依次在核的基础上添加属性,直到所得的属性子集与原条件属性的分类能力相同为止,对于高维属性,可以采用优化搜索策略,寻找最佳的属性集. 相似文献
7.
8.
9.
在采用聚类方法产生训练集的基础上,运用粗集理论离散化预处理该训练集,可以更好的提高分类精度.文章运用PAM算法聚类原始样本构成训练集,再利用布尔逻辑和粗集理论结合的离散化算法离散化该训练集,并以此离散化的训练集训练分类器.实验结果证明,基于该方法在相同的数据集上分类,比仅基于PAM算法预处理的RDDTE方法产生的分类精度最高提高了15.5%,且选用更少量的训练集. 相似文献
10.
11.
Theoretical considerations of kurtosis, whether of partial orderings of distributions with respect to kurtosis or of measures of kurtosis, have tended to focus only on symmetric distributions. With reference to historical points and recent work on skewness and kurtosis, this paper defines anti-skewness and uses it as a tool to discuss the concept of kurtosis in asymmetric univariate distributions. The discussion indicates that while kurtosis is best considered as a property of symmetrised versions of distributions, symmetrisation does not simply remove skewness. Skewness, anti-skewness and kurtosis are all inter-related aspects of shape. The Tukey g and h family and the Johnson Su family are considered as examples. 相似文献
12.
在今天越来越激烈的市场竞争之中,越来越多的公司已经从产品驱动的市场竞争策略转向客户驱动的市场竞争策略。并且随着计算机技术及数据挖掘方法的飞速发展,直接市场营销越来越受到重视。如何选择目标客户邮寄货单的问题也就越来越引起市场直销者的兴趣。计分模型及增益表选择方法和单群预测及选择方法是目前普遍采用的两种客户选择方法。在平稳市场的假设下,客户的购买模式服从著名的重复购买理论。基于这个理论,本文提出了一种新的客户选择方法,即两群预测及选择方法。应用实际的客户数据比较这三种不同的方法,结果表明新方法表现最好。 相似文献
13.
This paper is concerned with the analysis of repeated measures count data overdispersed relative to a Poisson distribution, with the overdispersion possibly heterogeneous. To accommodate the overdispersion, the Poisson random variable is compounded with a gamma random variable, and both the mean of the Poisson and the variance of the gamma are modelled using log linear models. Maximum likelihood estimates (MLE) are then obtained. The paper also gives extended quasi-likelihood estimates for a more general class of compounding distributions which are shown to be approximations to the MLEs obtained for the gamma case. The theory is illustrated by modelling the determination of asbestos fibre intensity on membrane filters mounted on microscope slides. 相似文献
14.
近年来运用空间计量经济模型进行实证分析的文献都普遍采用空间自回归(SAR)形式的设定,对参数的估计也多采用极大似然(MLE)的方法。在经典多元线性回归模型中,仅有被解释变量的测量误差并不会影响系数估计的一致性。本文证明对于SAR模型,即使仅当被解释变量存在测量误差时,且无论该测量误差是否与模型本身的扰动项相关,普遍采用的MLE都将是不一致的。为此,Hausman型的设定检验被推广到SAR模型中用以判别是否存在被解释变量的测量误差。当零假设被拒绝时,我们说明由Kelejian&Prucha(1998), Lee(2003)提出的二阶段最小二乘法仍然可以得到参数的一致估计。Monte Carlo模拟的结果与我们的理论预期一致。最后我们用一个估计地方环境支出外溢效应的实例说明如何运用本文所提的方法来检验应用空间自回归模型时可能存在的测量误差。 相似文献
15.
基于9省调研,本文对目前新型农村合作医疗对农户疾病风险的分担能力及目标约束下的筹资规模方法进行了实证与比较分析。研究显示,农村居民中疾病风险分布的差异性较大;不同补偿方案下,新型农村合作医疗对农户疾病经济风险的分担能力差异较大;新型农村合作医疗制度目标的实现程度决定了筹资规模的大小。 相似文献
16.
17.
传统的偏离-份额分析模型没有考虑区域之间的空间交互作用,为此国外出现了空间拓展模型的探索、论证与应用,然而目前国内仍主要停留在对传统模型的应用。本文探讨了如何构建空间权重矩阵来表示区域间的空间相互作用,并介绍了国外较成熟的偏离-份额分析空间模型,以江苏为例应用传统模型和空间模型进行了实证对比分析。结果表明,江苏省第二、三产业在全国具有较强的竞争力,经济总量及各产业的增长中,竞争力因素比产业结构因素贡献更大;但相对周边邻近省份,江苏省各产业并没有表现出竞争优势;邻近省份对江苏经济增长产生了较大的正面影响,但江苏没有能够充分利用这种影响,因此带来了一定的理论经济损失。 相似文献
18.
本文首先对经典行为均衡汇率模型简要解读。指出其在估算实践中,暗含技术上的严格假定。本文给出放松假定的改进。通过人民币均衡汇率估算的经验分析,对改进工作进行检验。为人民币均衡汇率估算研究搭建一个深入分析的技术平台。经验分析的主要结论是,人民币实际汇率短期存在低估,但与长期均衡汇率比较,其实际汇率一直存在高估的情况。鉴于均衡汇率水平的决定机制复杂,人民币汇率水平升值调整必须慎之又慎。 相似文献
19.