共查询到20条相似文献,搜索用时 15 毫秒
1.
数据流分类中的概念漂移问题是数据挖掘技术领域的前沿和难点,其重点是等级分类可能随着数据序列的转移而产生漂移现象。虽然估计动态漂移及其调整分类的算法已被提出,但现有算法由于目标分布例证的缺失在概念漂移估计方面的表现并不是很好,例证的多少严重影响了估计效果。鉴此,提出了一种新的参数估计方法,称为转移估计法,运用目标分布数据,结合相似分布理论,对现存的算法进行改进,以便实现对数据流分类中的概念漂移现象进行正确检测和估计。通过对虚拟和真实数据集的仿真实验表明,改进算法在数据流分类中的概念漂移估计方面优于现存算法。 相似文献
2.
函数型数据的稀疏性和无穷维特性使得传统聚类分析失效。针对此问题,本文在界定函数型数据概念与内涵的基础上提出了一种自适应迭代更新聚类分析。首先,基于数据参数信息实现无穷维函数空间向有限维多元空间的过渡;在此基础上,依据变量信息含量的差异构建了自适应赋权聚类统计量,并依此为函数型数据的相似性测度进行初始类别划分;进一步地,在给定阈值限制下,对所有函数的初始类别归属进行自适应迭代更新,将收敛的优化结果作为最终的类别划分。随机模拟和实证检验表明,与现有的同类函数型聚类分析相比,文中方法的分类正确率显著提高,体现了新方法的相对优良性和实际问题应用中的有效性。 相似文献
3.
当检验数据中包含有新的类别时,传统判别分析方法所构造的分类器,无法识别这些新类别,只能将检验数据划分到学习阶段所遇到的已知类别当中,分类正确率较低.为克服这一缺陷,文章引入一种基于混合模型的动态判别分析方法,可自适应调整原有的分类器,使之能够发现新类别,并显著提高分类正确率.一个实际数据的分类结果验证了该方法的有效性. 相似文献
4.
5.
现有聚类分析测量的高等教育系统多样性存在着忽略院校类别分布和类别差异程度等主要缺陷,文章提出的基于先验分类信息、基于最佳分类数以及基于类数和距离关系的三种测量方法可对现有测量进行有效地改进.中国高等教育系统多样性测量的案例显示:三种测量方法具有较高的一致性. 相似文献
6.
在回归问题中,惩罚特征即正则化是特征处理的常用方式。但在集成分类问题中,惩罚特征以改善训练效果的研究较少。文章提出一种基于GBDT模型训练的SHAP值对各样本特征惩罚加权,进而提升分类精度的集成模型;其中,对于测试样本的SHAP值估计,通过其与训练集的样本距离权重结合训练集的SHAP矩阵近似得到。实验结果表明:选择GBDT_SHAP值惩罚特征后,模型的预测精度均有显著提升,验证了该算法的有效性。以GBDT_SHAP_GBDT模型为例,其在多组经典数据集上的分类效果良好,且在不平衡数据集上性能突出;若干组仿真实验表明,该方法能使模型快速达到较优且较为稳定的拟合效果,鲁棒性较强。 相似文献
7.
针对一种在属性权重和决策者权重完全未知且属性值为定值的多属性群决策问题.文章基于离差最大化思想提出了一种可对多种主观和多种客观权重信息进行集成的最优化组合赋权方法求解属性的集成权重,计算各方案的综合属性值,以求属性的集成权重的方法去求解决策者的集成权重.给出了一个数值例子说明该方法的实用性和有效性. 相似文献
8.
基于自适应在线极限学习机模型的预测方法 总被引:1,自引:0,他引:1
本文针对单个在线极限学习机输出不稳定的情况,提出一种自适应集成在线极限学习机算法(ASE-OSELM).算法首先初始化多个在线极限学习机模型,然后根据到达的每一批次数据的训练误差及其方差自适应地调整各个在线极限学习机的集成权重,并动态删除那些小于设定阈值的模型以提高算法的训练速度,最后选择准确度高、泛化能力好的模型用于集成预测.通过函数拟合、UCI数据集以及真实股价预测实验表明,文中提出的ASE-OSELM算法相比传统的OSELM、LS-SVM和BPNN算法具有更高的预测准确度和抗干扰能力. 相似文献
9.
文章针对解决具有语言评价信息的多属性群决策问题,提出了一种基于二元语义信息处理的群决策方法。该方法是采用近年来最新发展的二元语义概念对语言评价信息进行处理和运算。对于属性权重完全未知的情形,基于群体理想方案分别给出了一个求解属性权重的简洁公式获得相应的属性权重,然后利用二元语义加权算术平均(T-WAA)算子,对二元语义决策信息进行加权集成,继而对决策方案进行排序和择优。最后给出了一个实例分析。结果表明该方法简单,有效和易于计算。 相似文献
10.
基于时间序列孤立点检测的可疑外汇资金交易识别研究 总被引:1,自引:0,他引:1
尽管洗钱模式复杂多变,但洗钱行为在整个金融活动中只占有极少的比例,这给监测洗钱交易增加了难度.作为数据挖掘重要方法之一的孤立点分析是在大数据集中发现有趣小模式的有效方法.文章提出了一种适用于可疑外汇资金交易识别的孤立点检测方法,可以持续地从大量的日常交易中发现极少数的与正常交易显著不同的异常交易.从孤立点分析角度,提出了基于非频繁模式挖掘思想和概念漂移处理的混合属性空间上时间序列孤立点检测方法;从可疑金融交易识别的角度,提出了对每天持续动态产生的海量金融交易数据进行分析的一种新思路. 相似文献
11.
12.
针对属性值为直觉模糊值的多决策者、多时间点、多属性及多方案的多维度决策问题,文章基于新的记分函数等决策方法,并讨论了其在企业社会责任评价中的应用.首先,应用TIFHA、MIFHA等算子分别对各时间点和各专家决策进行了集成;其次,应用改进的记分函数对集成后得出的矩阵进行计算,得出记分函数矩阵;再次,运用熵权法算权重;最后引用距离公式及改进的TOPSIS方法将得出的结果进行多属性决策.并针对两家煤炭企业的社会责任履行情况进行了多时点、多专家、多属性决策,通过算例表明了此方法可行且有效. 相似文献
13.
14.
15.
16.
17.
18.
决策树是典型的分类方法.利用粗糙集的可辨识矩阵进行属性约简,去掉冗余属性,阈得到决策表的核属性.在构建决策树时,使用简化的决策表,从核属性集中选择当前节点,从而减少计算量,得到相对简洁的分类规则. 相似文献
19.
文章对决策者权重和属性权重已知,属性值为精确数、区间数和模糊语言表示的混合型多属性群决策问题,首先对群决策各评价矩阵中用模糊语言表示的属性值进行了区间化处理,提出了用群体极差正规化方法对各评价矩阵规范化;接着采用简单加权平均算子将群体决策各矩阵集结为单一决策矩阵.然后提出了含有精确数和区间数属性值的多属性群决策的群体数字理想点的概念.最后给出基于群体数字理想点的混合型多属性群决策TOPSIS算法的步骤. 相似文献
20.
属性子集的选择是数据归约的重要内容.文章提出了一种基于因子分析的无监督属性选择的方法.通过该方法选出的属性子集能够最好地覆盖数据的自然分类.在统计模拟中,这种方法也得到了很好的效果. 相似文献