期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张杰孙曰瑶《统计与信息论坛》2011,(12):19-25

数据流分类中的概念漂移问题是数据挖掘技术领域的前沿和难点,其重点是等级分类可能随着数据序列的转移而产生漂移现象。虽然估计动态漂移及其调整分类的算法已被提出,但现有算法由于目标分布例证的缺失在概念漂移估计方面的表现并不是很好,例证的多少严重影响了估计效果。鉴此,提出了一种新的参数估计方法,称为转移估计法,运用目标分布数据,结合相似分布理论,对现存的算法进行改进,以便实现对数据流分类中的概念漂移现象进行正确检测和估计。通过对虚拟和真实数据集的仿真实验表明,改进算法在数据流分类中的概念漂移估计方面优于现存算法。相似文献

2.

基于自适应迭代更新的函数型数据聚类方法研究

王德青等《统计研究》2015,32(4):91-96

函数型数据的稀疏性和无穷维特性使得传统聚类分析失效。针对此问题,本文在界定函数型数据概念与内涵的基础上提出了一种自适应迭代更新聚类分析。首先,基于数据参数信息实现无穷维函数空间向有限维多元空间的过渡;在此基础上,依据变量信息含量的差异构建了自适应赋权聚类统计量,并依此为函数型数据的相似性测度进行初始类别划分;进一步地,在给定阈值限制下,对所有函数的初始类别归属进行自适应迭代更新,将收敛的优化结果作为最终的类别划分。随机模拟和实证检验表明,与现有的同类函数型聚类分析相比,文中方法的分类正确率显著提高,体现了新方法的相对优良性和实际问题应用中的有效性。相似文献

3.

基于混合模型的动态判别分析及应用

朱德刚夏业茂《统计与决策》2016,(16):76-77

当检验数据中包含有新的类别时,传统判别分析方法所构造的分类器,无法识别这些新类别,只能将检验数据划分到学习阶段所遇到的已知类别当中,分类正确率较低.为克服这一缺陷,文章引入一种基于混合模型的动态判别分析方法,可自适应调整原有的分类器,使之能够发现新类别,并显著提高分类正确率.一个实际数据的分类结果验证了该方法的有效性. 相似文献

4.

企业转型的内涵研究 总被引：11，自引：0，他引：11

王吉发冯晋李汉铃《统计与决策》2006,(2):153-157

本文对企业转型概念进行整合集成,指出企业转型内生、外生内涵属性.参照生命基因的DNA分子结构,构建了企业要素集成模型,从机理上揭示了企业转型的内涵. 相似文献

5.

基于聚类分析的高等教育系统多样性测量

王传毅查强《统计与决策》2016,(19):32-36

现有聚类分析测量的高等教育系统多样性存在着忽略院校类别分布和类别差异程度等主要缺陷,文章提出的基于先验分类信息、基于最佳分类数以及基于类数和距离关系的三种测量方法可对现有测量进行有效地改进.中国高等教育系统多样性测量的案例显示:三种测量方法具有较高的一致性. 相似文献

6.

基于SHAP值惩罚特征的集成分类方法研究

曹玉茹高洋洋《统计与决策》2023,(6):21-26

在回归问题中，惩罚特征即正则化是特征处理的常用方式。但在集成分类问题中，惩罚特征以改善训练效果的研究较少。文章提出一种基于GBDT模型训练的SHAP值对各样本特征惩罚加权，进而提升分类精度的集成模型；其中，对于测试样本的SHAP值估计，通过其与训练集的样本距离权重结合训练集的SHAP矩阵近似得到。实验结果表明：选择GBDT＿SHAP值惩罚特征后，模型的预测精度均有显著提升，验证了该算法的有效性。以GBDT＿SHAP＿GBDT模型为例，其在多组经典数据集上的分类效果良好，且在不平衡数据集上性能突出；若干组仿真实验表明，该方法能使模型快速达到较优且较为稳定的拟合效果，鲁棒性较强。相似文献

7.

一种基于主客观权重信息集成的多属性群决策

林国光宋海洲《统计与决策》2016,(12):70-73

针对一种在属性权重和决策者权重完全未知且属性值为定值的多属性群决策问题.文章基于离差最大化思想提出了一种可对多种主观和多种客观权重信息进行集成的最优化组合赋权方法求解属性的集成权重,计算各方案的综合属性值,以求属性的集成权重的方法去求解决策者的集成权重.给出了一个数值例子说明该方法的实用性和有效性. 相似文献

8.

基于自适应在线极限学习机模型的预测方法 总被引：1，自引：0，他引：1

徐勇王东张慧《统计研究》2016,(7):103-109

本文针对单个在线极限学习机输出不稳定的情况,提出一种自适应集成在线极限学习机算法(ASE-OSELM).算法首先初始化多个在线极限学习机模型,然后根据到达的每一批次数据的训练误差及其方差自适应地调整各个在线极限学习机的集成权重,并动态删除那些小于设定阈值的模型以提高算法的训练速度,最后选择准确度高、泛化能力好的模型用于集成预测.通过函数拟合、UCI数据集以及真实股价预测实验表明,文中提出的ASE-OSELM算法相比传统的OSELM、LS-SVM和BPNN算法具有更高的预测准确度和抗干扰能力. 相似文献

9.

一种二元语义多属性群决策方法研究

张学军卫贵武《统计与决策》2008,(8):163-165

文章针对解决具有语言评价信息的多属性群决策问题,提出了一种基于二元语义信息处理的群决策方法。该方法是采用近年来最新发展的二元语义概念对语言评价信息进行处理和运算。对于属性权重完全未知的情形,基于群体理想方案分别给出了一个求解属性权重的简洁公式获得相应的属性权重,然后利用二元语义加权算术平均(T-WAA)算子,对二元语义决策信息进行加权集成,继而对决策方案进行排序和择优。最后给出了一个实例分析。结果表明该方法简单,有效和易于计算。相似文献

10.

基于时间序列孤立点检测的可疑外汇资金交易识别研究 总被引：1，自引：0，他引：1

孙景张成虎陈善新《统计与决策》2010,(18)

尽管洗钱模式复杂多变,但洗钱行为在整个金融活动中只占有极少的比例,这给监测洗钱交易增加了难度.作为数据挖掘重要方法之一的孤立点分析是在大数据集中发现有趣小模式的有效方法.文章提出了一种适用于可疑外汇资金交易识别的孤立点检测方法,可以持续地从大量的日常交易中发现极少数的与正常交易显著不同的异常交易.从孤立点分析角度,提出了基于非频繁模式挖掘思想和概念漂移处理的混合属性空间上时间序列孤立点检测方法;从可疑金融交易识别的角度,提出了对每天持续动态产生的海量金融交易数据进行分析的一种新思路. 相似文献

11.

两分类不平衡数据的Boosting算法

宋捷吕晓玲吴喜之《统计与决策》2010,(10)

Boosting算法是一类串行的集成算法,可用于分类和回归。不同的算法由不同的损失与不同的集成方式构成。文章提出了一种自适应地处理分类中的不平衡数据的Boosting算法Baboost。实验证明该算法能有效地减小各个类内部的预测误差。相似文献

12.

基于改进记分函数的直觉模糊多维度决策方法

赵宝福张超郭建威《统计与决策》2016,(24):54-58

针对属性值为直觉模糊值的多决策者、多时间点、多属性及多方案的多维度决策问题,文章基于新的记分函数等决策方法,并讨论了其在企业社会责任评价中的应用.首先,应用TIFHA、MIFHA等算子分别对各时间点和各专家决策进行了集成;其次,应用改进的记分函数对集成后得出的矩阵进行计算,得出记分函数矩阵;再次,运用熵权法算权重;最后引用距离公式及改进的TOPSIS方法将得出的结果进行多属性决策.并针对两家煤炭企业的社会责任履行情况进行了多时点、多专家、多属性决策,通过算例表明了此方法可行且有效. 相似文献

13.

数据流挖掘技术研究

王大将孙洁《统计与决策》2010,(7)

数据流挖掘技术是数据挖掘技术的新研究方向之一。文章介绍了数据流、数据流挖掘的特点,对现有的数据流挖掘算法进行了总结、分析,提出了数据流挖掘的研究方向和应用前景。相似文献

14.

基于改进PCA的朴素贝叶斯分类算法

李思奇吕王勇邓柙陈雯《统计与决策》2022,(1)

朴素贝叶斯是一种处理分类问题的常用方法,但它的属性条件独立性假设在实际应用中难以成立,导致其分类性能降低。针对这一问题,文章提出了基于改进PCA的朴素贝叶斯分类算法,该算法通过Pearson和Kendall系数计算出属性间的相关性大小,基于主成分分析筛选出新的属性集,使其尽量满足条件独立性假设,并对新数据集进行朴素贝叶斯分类。实验结果表明,该方法有效地提高了分类准确率。相似文献

15.

基于灰数据处理的多属性群决策TOPSIS扩展模型及其应用

孙旋熊晓明张群英《统计与决策》2009,(17)

文章对多属性决策问题的TOPSIS方法进行扩展,使之应用于多属性群决策模型中,并引入灰度数据及聚合分离度概念,解决对不确定信息问题处理. 相似文献

16.

基于统计相关的缺失值数据处理研究

张松兰王鹏徐子伟《统计与决策》2016,(12):13-16

针对数据库中存在缺失值的问题,文章建立了统计相关分析与机器学习相结合的缺失数据处理方法.首先利用统计相关性对原始数据进行分析,找出与缺失值属性相关度较大的属性,提取这些属性的已知值作为训练数据建立模型,再利用建立起来的模型估算缺失值.以UCI数据库真实的数据为例进行仿真,并对比分析了支持向量机、神经网络和决策树三种机器学习算法,实验结果表明利用相关度较大的已知属性值来训练学习,其估算值精度明显提高. 相似文献

17.

基于粕糙集与广义关联度系数的贝叶斯中医证候分类模型

张跃宏刘平张琴王磊孙继佳严广乐苏式兵《统计与决策》2008,(12)

文章主要探讨了一种贝叶斯分类方法在肝炎后肝硬化中医诊断中的应用,介绍了粗糙集理论、广义关联度系数以及贝叶斯分类模型等数据挖掘技术.并且,运用粗糙集理论及广义关联度系数方法,对287例肝炎后肝硬化的症状、体征进行了属性选择.进一步,利用树增广的朴素贝叶斯分类算法,构建了肝炎后肝硬化中医证候分类模型.实验表明这种模型对肝炎后肝硬化的6种主要证候分类的符合率达83%.研究结果对肝炎后肝硬化的中医临床诊断具有参考意义. 相似文献

18.

基于属性约简的决策树构建

王宏《统计与决策》2006,(14):60-61

决策树是典型的分类方法.利用粗糙集的可辨识矩阵进行属性约简,去掉冗余属性,阈得到决策表的核属性.在构建决策树时,使用简化的决策表,从核属性集中选择当前节点,从而减少计算量,得到相对简洁的分类规则. 相似文献

19.

混台型多属性群决策的群体数字理想点算法

王武平杜纲《统计与决策》2008,(10):157-158

文章对决策者权重和属性权重已知,属性值为精确数、区间数和模糊语言表示的混合型多属性群决策问题,首先对群决策各评价矩阵中用模糊语言表示的属性值进行了区间化处理,提出了用群体极差正规化方法对各评价矩阵规范化;接着采用简单加权平均算子将群体决策各矩阵集结为单一决策矩阵.然后提出了含有精确数和区间数属性值的多属性群决策的群体数字理想点的概念.最后给出基于群体数字理想点的混合型多属性群决策TOPSIS算法的步骤. 相似文献

20.

数据归约中基于因子分析的属性选择方法

刘云霞贺晋兵《统计与决策》2009,(7)

属性子集的选择是数据归约的重要内容.文章提出了一种基于因子分析的无监督属性选择的方法.通过该方法选出的属性子集能够最好地覆盖数据的自然分类.在统计模拟中,这种方法也得到了很好的效果. 相似文献