首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
分类是十分基础且很关键的数据分析技术,而基于贝叶斯理论的朴素贝叶斯分类技术是当前数据分析领域的一个研究热点.文章针对条件独立性假设提出了基于主成分分析的改进方法,以期能够充分体现朴素贝叶斯分类器在分类中的优势,实现改进分类效果的目的.  相似文献   

2.
评估分类预测模型优良性的做法是衡量其预测准确度,即正判率.文章从四个不同角度,构建基于混合策略的组合预测模型、持续学习的朴素贝叶斯分类器、变量集预处理、分阶段逐步实施的分类预测模型,讨论了如何审慎地选择或以恰当的方式运用一种或几种合适的分类算法,来有效地提升分类预测的正判率.其中,基于混合策略的组合预测模型对正判率的提升幅度明显,而持续学习的朴素贝叶斯分类器对模型优化也显得简单而有效.  相似文献   

3.
文章主要探讨了一种贝叶斯分类方法在肝炎后肝硬化中医诊断中的应用,介绍了粗糙集理论、广义关联度系数以及贝叶斯分类模型等数据挖掘技术。并且,运用粗糙集理论及广义关联度系数方法,对287例肝炎后肝硬化的症状、体征进行了属性选择。进一步,利用树增广的朴素贝叶斯分类算法,构建了肝炎后肝硬化中医证候分类模型。实验表明这种模型对肝炎后肝硬化的6种主要证候分类的符合率达83%。研究结果对肝炎后肝硬化的中医临床诊断具有参考意义。  相似文献   

4.
华锐  梁娜 《统计与决策》2012,(23):69-71
对样本分类的方法很多,比如广义朴素贝叶斯分类器[1],层次-聚类模型[2],神经网络[3]等,但对小样本的分类却存在很多困难,如:小样本的代表性不够,不能覆盖所有属性,分类器分类效果不佳等问题,文章提出的结合拉普拉斯校准的特征加权朴素贝叶斯分类器操作简单,能高效地解决了以上问题。  相似文献   

5.
文章主要探讨了一种贝叶斯分类方法在肝炎后肝硬化中医诊断中的应用,介绍了粗糙集理论、广义关联度系数以及贝叶斯分类模型等数据挖掘技术.并且,运用粗糙集理论及广义关联度系数方法,对287例肝炎后肝硬化的症状、体征进行了属性选择.进一步,利用树增广的朴素贝叶斯分类算法,构建了肝炎后肝硬化中医证候分类模型.实验表明这种模型对肝炎后肝硬化的6种主要证候分类的符合率达83%.研究结果对肝炎后肝硬化的中医临床诊断具有参考意义.  相似文献   

6.
基于灰色关联度的属性约简方法   总被引:1,自引:1,他引:0  
属性约简是粗集理论研究的核心内容之一,其主要思想是在保持分类能力不变的前提下,消除决策表中冗余的属性,推导出最少的属性集合和最小的决策规则.目前属性约简方法主要包括:①基于信息熵的启发式算法,该算法计算信息熵时的时间复杂度较高;②基于可辨别矩阵和逻辑运算的属性约简,这种方法能够得到全部约简结果,但计算过程中析取逻辑表达式很多,甚至是重复的,这导致化简时计算量很大,且对于大样本、高维数据的约简建立的可辨别矩阵具有较高的空间复杂度.本文结合灰色关联理论提出了一种新的属性约简方法,以灰色关联度作为属性重要性的测度,采用启发式算法,先计算出属性的核,然后依据属性的重要程度依次在核的基础上添加属性,直到所得的属性子集与原条件属性的分类能力相同为止,对于高维属性,可以采用优化搜索策略,寻找最佳的属性集.  相似文献   

7.
朴素贝叶斯网分类器是贝叶斯分类器的一种,文章将其应用到现代教育测量的认知诊断分类中,对0,1计分下的认知诊断进行了实验,并与认知诊断中典型的分类方法进行了比较。实验结果表明,利用贝叶斯网分类器分类效果明显占优。  相似文献   

8.
基于最大熵的测量不确定度的贝叶斯评估方法   总被引:4,自引:0,他引:4  
为提高测量不确定度的评估精度,文章提出了一种基于最大熵理论的贝叶斯评估方法。首先,利用最大熵原理,求解出样本信息的概率密度函数;然后结合先验信息,采用贝叶斯评估方法,得到后验信息的概率密度函数;最终计算出测量结果的不确定度。该方法含有的主观假设少,并充分利用了历史测量数据,评估方法合理。实验结果表明,基于最大熵理论的测量不确定度贝叶斯评估方法可靠性高,计算结果更加精确。  相似文献   

9.
文章提出一种基于粗糙集属性约简算法的循环经济指标体系构建方法。利用粗糙集理论的属性约简算法进行指标初始筛选,运用主成分分析方法选择出最优指标体系集,并通过Bayes统计判别法验证其合理性,最终得到循环经济指标体系构建方法模型。选取甘肃省10个市州2012年的统计数据进行了实证研究。  相似文献   

10.
在采用聚类方法产生训练集的基础上,运用粗集理论离散化预处理该训练集,可以更好的提高分类精度.文章运用PAM算法聚类原始样本构成训练集,再利用布尔逻辑和粗集理论结合的离散化算法离散化该训练集,并以此离散化的训练集训练分类器.实验结果证明,基于该方法在相同的数据集上分类,比仅基于PAM算法预处理的RDDTE方法产生的分类精度最高提高了15.5%,且选用更少量的训练集.  相似文献   

11.
能源是人类社会赖以生存和发展的物质基础。能源消耗指标成为当今社会经济工作的约束指标。本文利用投入占用产出技术分别提出了生产、生活以及进出口贸易领域的能耗指标,即:生产综合能耗指标,人均生活综合能耗指标和进出口完全能耗综合指标,并且利用能源投入占用产出表进行了模型分析。实证分析表明,新的能耗指标在国内外生产生活和进出口贸易领域的能源问题上具有很强的可比性和可操作性。  相似文献   

12.
简明统计学术史纲要   总被引:1,自引:0,他引:1       下载免费PDF全文
于忠义 《统计研究》2009,26(6):102-111
 本文首先探讨了统计学术史研究的时间范畴;其次将统计学术史划分为四个不同发展阶段:萌芽中的统计学(1654—1750)、推断统计的兴起(1750—1827)、统计学应用领域的拓展及在遗传学领域的突破(1827—1907)、现代统计学理论的建立(1907—1935);最后本文给出了统计学术史大纲。  相似文献   

13.
对中国第三产业发展的几点分析   总被引:2,自引:0,他引:2       下载免费PDF全文
米小琴 《统计研究》1996,13(2):41-44
  相似文献   

14.
乡镇统计工作机制有效运转的思考   总被引:1,自引:0,他引:1       下载免费PDF全文
杨舒 《统计研究》2009,26(11):13-15
 乡镇统计是统计工作的重要基础,同时也是目前统计工作的薄弱环节。巩固和加强乡镇统计工作,推动乡镇统计基础工作规范化建设,促进乡镇统计工作机制有效运转,本文提出了具体的设想和思考。本文重点从乡镇统计站建设、人员建设、制度建设三个方面,对乡镇统计工作机制有效发挥作用进行研究,目的在于推进乡镇统计工作机制产生有效生产力。  相似文献   

15.
利润最大化区位理论与广州高房价的根源   总被引:1,自引:0,他引:1  
张立建 《统计研究》2008,25(9):16-23
本文利用利润最大化区位理论,建立房价模型,实证研究广州房价持续上涨的根源。发现影响房价的主要因素是住房供给的短缺,次要原因是高成本以及严重的贫富分化。其体制根源在于自由竞争的地产需求市场与计划经济的地产供给市场之间的矛盾,政策根源在于政府变为“经济人”,一味经营城市,经济根源在于因竞争和权力垄断所导致的产业分化,社会根源在于广州市民不合理的住房消费习惯。因而,近期来讲,加大土地供给、改革土地出让方式、实行房地产累进累退税是抑制房价的关键,从长远来讲,要建立自由竞争的地产供给市场,变“经济人”政府为服务性政府,优化产业结构,取消“国字头”行业特权。  相似文献   

16.
谢远涛  杨娟 《统计研究》2010,27(10):75-80
 本文在广义Gamma分布簇基础上引入异质性来构建广义线性混合模型。本文构建的广义Gamma分布簇广义线性混合模型在广义线性混合模型的框架下分析,通过参数重整技术把广义Gamma分布簇变量的建模问题与指数分布簇变量的建模问题联系起来,模型推断可以方便地利用广义线性混合模型和广义线性模型的研究成果,同时也可以方便地推广到其他模型。三参数广义Gamma分布可以收缩到两参数的Gamma分布、Weibull分布或指数分布,能降低模型误设的风险,还能便利地分析误差结构。  相似文献   

17.
黎明 《统计研究》2010,27(11):85-87
公交站台停靠区的排队问题决定了公交车辆的通行能力。把公交中途站台与公交车辆模拟成一个单服务系统、公车到达率 ,两服务率 、 的负指数分布的排队M/M/1/N系统。根据排队论理论,实测计算了北京中关村海淀黄庄、人民大学站点公交车辆排队队长,站内逗留时间等参数。结论为:城市主干道关键站台改造为主、副双公交站台制式以及调整公交线路布设,优化各线路发车频率是花费成本低,畅通成效大的解决站点塞车排队的方法。  相似文献   

18.
Ensuring a standard of assessment in situations where marking panels are used is fraught with difficulties, particularly where essay-type responses are to be marked. This paper discusses statistical process control procedures, similar to those used in industry, to help moderate marking quality when ‘double-marking’ or ‘partial double-marking’ are used. When questions are assessed by the same two markers, the scores assigned to responses by each marker may be adjusted so that their assessments are on average equal in terms of location and scale. The paper also discusses methods of controlling sequential assessment, and demonstrates the application of these techniques in evaluating marker consistency, using data from school leaving examinations in geography.  相似文献   

19.
 本文根据2001年1月至2008年4月我国CPI篮子的8类居民消费价格分类指数的月度数据,分析了我国CPI波动的特征,并运用Gonzalo和Granger(1995)以及Darrat和Zhong(2002)提出的检验协整系统中的长期驱动力和短期驱动力的方法,从CPI分类指数的角度实证分析了我国CPI波动的长期和短期的决定因素。研究结果显示我国CPI波动的具有明显的结构性,食品、烟酒及用品、交通和通信、娱乐教育文化用品及服务等5类分类指数价格的变动是我国CPI波动的长期驱动力,而食品、衣着、医疗保健及个人用品等5类分类指数价格的变动是短期驱动力。  相似文献   

20.
森林总经济价值核算研究   总被引:7,自引:0,他引:7       下载免费PDF全文
葛守中 《统计研究》1999,16(7):10-15
森林总经济价值,又称森林的经济效益。人们关注森林对人类的影响,还仅仅是最近几十年的事,而进行测度森林效益的尝试,更只是最近若干年的事。直到现在,这种尝试都还很幼稚,很不完善。战胜了1998年特大洪灾之后的中国,人们对洪灾的教训及成因进行了深刻反思。作...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号