首页 | 本学科首页   官方微博 | 高级检索  
     

随机森林方法研究综述
引用本文:方匡南,吴见彬,朱建平,谢邦昌. 随机森林方法研究综述[J]. 统计与信息论坛, 2011, 26(3): 32-38
作者姓名:方匡南  吴见彬  朱建平  谢邦昌
作者单位:1. 厦门大学经济学院计划统计系,福建,厦门,361005;厦门大学数据挖掘研究中心,福建,厦门,361005
2. 厦门大学经济学院计划统计系,福建,厦门,361005
基金项目:中央高校基本科研业务费专项资金《基于数据挖掘的数据质量管理研究》,国家统计局重点项目《金融风险中的统计方法》
摘    要:随机森林(RF)是一种统计学习理论,它是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果。它具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不容易出现过拟合,在医学、生物信息、管理学等领域有着广泛的应用。为此,介绍了随机森林原理及其有关性质,讨论其最新的发展情况以及一些重要的应用领域。

关 键 词:随机森林  分位数回归森林  生存回归森林  应用

A Review of Technologies on Random Forests
FANG Kuang-nan,WU Jian-bin,ZHU Jian-ping,SHIA Bang-chang. A Review of Technologies on Random Forests[J]. Statistics & Information Tribune, 2011, 26(3): 32-38
Authors:FANG Kuang-nan  WU Jian-bin  ZHU Jian-ping  SHIA Bang-chang
Affiliation:FANG Kuang-nana,b,WU Jian-bina,ZHU Jian-pinga,SHIA Bang-changa,b(a.Department of Statistics,School of Economics,b.Data Mining Center,Xiamen University,Xiamen 361005,China)
Abstract:Random Forests is a statistical learning theory,using bootsrap re-sampling method form sample sets,and then combining the tree predictors by majority voting so that each tree is grown using a new bootstrap training set.It is widely applied in medicine,bioinformatics,economics and other fields,because of its high prediction accuracy,good tolerance of noisy data,and the law of large numbers they do not overfit.In this paper we first introduce the concept of random forest and the latest research,then provide s...
Keywords:Random Forests  Quantile Regression Forests  Survival Regression Forests  application  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号