期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈钟毓尹居良《统计与决策》2023,(5):33-37

针对不平衡数据的分类问题，文章利用焦点损失函数可以挖掘困难样本的特性，提出了一种新的逻辑回归算法。首先，定义逻辑回归模型新的损失函数；其次，基于牛顿迭代法，设计FL逻辑回归算法；最后，在比较实验中，运用随机森林进行特征选择，以阈值优化逻辑回归模型为分类模型进行实验。实验结果表明，与传统逻辑回归算法相比，改进后的算法提高了少数类样本的分类精度，增强了模型的整体分类性能。相似文献

2.

基因表达数据特征子集的冗余研究

《统计与信息论坛》2019,(5):10-15

过滤式特征选择是一种在基因表达数据上广泛使用且简单有效的方法。针对其特征子集冗余性问题,使用皮尔逊相关系数,提出一种带冗余去除的特征选择算法。研究了在不同相关强度下特征子集冗余去除及分类准确度效果。实验选用三个不同的基因表达数据集,使用支持向量机、k近邻、随机森林作为分类器分别进行了测试。实验结果表明,带冗余去除的过滤式特征选择方法在不同分类器上均能获得良好的分类性能,另外,此方法在降低特征子集维度的同时能够提高分类准确度。相似文献

3.

基于随机森林模型的分类数据缺失值插补

孟杰 ;李春林《统计与信息论坛》2014,(9):86-90

缺失数据是影响调查问卷数据质量的重要因素,对调查问卷中的缺失值进行插补可以显著提高调查数据的质量。调查问卷的数据类型多以分类型数据为主,数据挖掘技术中的分类算法是处理属性分类问题的常用方法,随机森林模型是众多分类算法中精度较高的方法之一。将随机森林模型引入调查问卷缺失数据的插补研究中,提出了基于随机森林模型的分类数据缺失值插补方法,并根据不同的缺失模式探讨了相应的插补步骤。通过与其它方法的实证模拟比较,表明随机森林插补法得到的插补值准确度更优、可信度更高。相似文献

4.

基于云模型的混合量子神经网络算法及其仿真研究

《统计与信息论坛》2020,(2):17-23

在云模型、量子算法、神经网络算法等理论研究的基础上,设计了一种以量子比特神经元为信息处理单元的多层量子神经网络——基于云模型的混合量子神经网络算法。在标准数据集上进行的实验仿真表明:混合量子算法具有量子算法轨迹行为性能的优势;同时该混合算法可将提取的特征输入到量子神经网络中对数据集进行分类。该算法改进了量子神经网络的损失函数,提高了误差分析性能。最后,通过仿真实验验证了该混合量子算法在收敛速度和鲁棒性等方面均优于量子神经网络算法。相似文献

5.

基于模糊划分的自组织模糊特征提取算法研究

赵珩君肖进汪涛《统计与决策》2016,(16):21-25

准确的特征提取可以为营销活动提供有效的决策支持.文章从降低特征提取误差的角度考虑,提出对特征子集自动定义并分别赋予隶属函数的算法,取代了传统模糊规则归纳法所采用的对所有输入变量使用相同隶属函数的方法.从国际标准数据库中选择相关数据集进行特征提取识别率的实证分析,结果表明,与常用特征提取算法相比,在多共同特征数据集下,本文设计的基于模糊划分的自组织模糊特征提取算法能够提高特征提取的识别率并且具有可解释性. 相似文献

6.

拟适应再加权分类随机森林

马景义谢邦昌《统计与信息论坛》2010,25(3):13-16

综合Adaboost算法的自适应再加权和随机森林算法的未修剪随机变量划分树基模型,文章提出了用于自适应随机森林算法。通过实验数据发现,在训练集较大、贝叶斯误差较小时,模拟自适应再加权会起作用,从而,拟自适应随机森林算法会优于随机森林算法。相似文献

7.

基于属性聚类的项目评分预测推荐算法研究

刘贤锋刘同存《统计与决策》2012,(18):9-11

针对用户评分数据稀疏性问题,在对项目进行聚类基础上,文章提出了基于属性聚类的项目评分预测推荐算法。算法从项目属性特征相似性分析出发,利用K-Means聚类算法对项目进行聚类。对于未评分项目找到其所属的类簇;利用用户对类簇中其它项目的评分预测该用户对未评分项目的评分,达到降低数据稀疏性目的;最后结合协同过滤思想为用户提供推荐服务。实验结果表明,与基于项目评分预测的推荐算法相比,文章的算法推荐精度显著提高。相似文献

8.

用于分类的随机森林和Bagging分类树比较 总被引：1，自引：0，他引：1

马景义谢邦昌《统计与信息论坛》2010,25(10):18-22

借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分类树算法,是因为随机森林算法对应更小的偏差。相似文献

9.

基于数据挖掘的上市公司信用评级变动预测

盛夏李斌张迪《统计与决策》2016,(15):159-162

文章研究如何利用机器学习算法来预测中国上市公司的信用评级变动.选取了中国2003-2015年可得信用评级的记录,得到330条信用评级变动的记录.随后利用包含传统的线性分类器和最近提出的AdaBoost及随机森林分类模型等五类模型进行了实证.实证结果显示,随机森林分类模型对信用评级变动的预测能力最强. 相似文献

10.

基于统计相关的缺失值数据处理研究

张松兰王鹏徐子伟《统计与决策》2016,(12):13-16

针对数据库中存在缺失值的问题,文章建立了统计相关分析与机器学习相结合的缺失数据处理方法.首先利用统计相关性对原始数据进行分析,找出与缺失值属性相关度较大的属性,提取这些属性的已知值作为训练数据建立模型,再利用建立起来的模型估算缺失值.以UCI数据库真实的数据为例进行仿真,并对比分析了支持向量机、神经网络和决策树三种机器学习算法,实验结果表明利用相关度较大的已知属性值来训练学习,其估算值精度明显提高. 相似文献