首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
数据流具有连续、实时、有序及无限等特点,使用传统的数据挖掘技术来处理数据流的分类面临着严重的挑战,很难处理数据流中的概念漂移问题.文章结合现有的决策树分类挖掘算法,提出了自适应集成分类器方法,构建了数据流概念漂移的自适应集成分类模型,通过不断更新训练样例的权重与属性类别,将训练样例从现有的数据集中分离出来,并被确定为新类别属性的训练样例,以达到对数据流中概念漂移现象的有效检测,仿真结果也证明该方法的适应性和可靠性.  相似文献   

2.
文章文针对金融等领域的时间序列数据流,提出了一种直方图的构造方法,该方法具有联机处理高频时间序列数据流的能力,并具有与最优化直方图构造方法接近的精度.  相似文献   

3.
数据流分类中的概念漂移问题是数据挖掘技术领域的前沿和难点,其重点是等级分类可能随着数据序列的转移而产生漂移现象。虽然估计动态漂移及其调整分类的算法已被提出,但现有算法由于目标分布例证的缺失在概念漂移估计方面的表现并不是很好,例证的多少严重影响了估计效果。鉴此,提出了一种新的参数估计方法,称为转移估计法,运用目标分布数据,结合相似分布理论,对现存的算法进行改进,以便实现对数据流分类中的概念漂移现象进行正确检测和估计。通过对虚拟和真实数据集的仿真实验表明,改进算法在数据流分类中的概念漂移估计方面优于现存算法。  相似文献   

4.
数据挖掘(机器学习)领域的研究重点是建立概念漂移数据(Concept-drift)下的模型,其中的核心问题就是探测器算法.文章提出了一种基于双窗的探测算法.其优点是给出了该算法的严格理论基础;有效提高挖掘效率,克服虚漂移的干扰.并且运用人工和实际数据进行实验,效果亦优于其他算法.  相似文献   

5.
图像数据挖掘相关研究综述—概念和应用   总被引:2,自引:0,他引:2  
图像挖掘是数据挖掘领域中新兴的领域。随着数字照相技术的发展和在多学科中的广泛应用,对大量图像数据的分析和研究越来越重要。由于图像挖掘的对象、内容不同于传统数据,方法上也不同于传统技术。本文旨在介绍图像挖掘的基本概念和体系以及国际上最新的研究成果。本文回顾了图像挖掘的相关问题及建模框架,并与模式识别、图像处理等相关领域进行了比较,在此基础上,还介绍了近年来图像挖掘领域在卫星遥感、医学影像和生物显微照片研究的相关应用。  相似文献   

6.
丁冲  范钧  栾添 《统计教育》2008,(12):8-12,7
图像挖掘是数据挖掘领域中新兴的领域。随着数字照相技术的发展和在多学科中的广泛应用,对大量图像数据的分析和研究越来越重要。由于图像挖掘的对象、内容不同于传统数据,方法上也不同于传统技术。本文旨在介绍图像挖掘的基本概念和体系以及国际上最新的研究成果。本文回顾了图像挖掘的相关问题及建模框架,并与模式识别、图像处理等相关领域进行了比较,在此基础上,还介绍了近年来图像挖掘领域在卫星遥感、医学影像和生物显微照片研究的相关应用。  相似文献   

7.
生命周期意义下的客户资源价值挖掘研究   总被引:1,自引:0,他引:1  
客户资源是企业最宝贵的资源之一,对其价值进行充分挖掘是企业实现盈利和发展的保障和前提。文章详细分析了生命周期意义下的客户行为模式,利用数据挖掘技术从客户再购买行为、关联购买行为、盈利能力和客户保持四个方面对客户资源价值挖掘进行研究,为企业的客户资源价值挖掘工作提供了一种新思路和方法。  相似文献   

8.
多媒体视频会议技术在我国刚刚开始起步。为了研究北京市多媒体视频会议技术的市场现状以及发展前景,我们进行了本次研究,不仅研究了使用多媒体视频会议技术的公司以及未使用多媒体视频会议技术的公司的对比情况,还对使用过多媒体视频会议技术的个人进行研究,从而挖掘该技术的市场范围及潜力。  相似文献   

9.
董蕊  罗亚非 《统计教育》2007,(12):56-58
多媒体视频会议技术在我国刚刚开始起步。为了研究北京市多媒体视频会议技术的市场现状以及发展前景,我们进行了本次研究,不仅研究了使用多媒体视频会议技术的公司以及未使用多媒体视频会议技术的公司的对比情况,还对使用过多媒体视频会议技术的个人进行研究,从而挖掘该技术的市场范围及潜力。  相似文献   

10.
唐晓彬等 《统计研究》2021,38(8):146-160
本文创新地将半监督交互式关键词提取算法词频-逆向文件频率( Term Frequency- Inverse Document Frequency, TF-IDF )与基于 Transformer 的 双 向 编 码 表 征 ( Bidirectional Encoder Representation from Transformers,BERT)模型相结合,设计出一种扩展CPI预测种子关键词的文本挖掘技术。采用交互式TF-IDF算法,对原始CPI预测种子关键词汇广度上进行扩展,在此基础上通过BERT“两段式”检索过滤模型深入挖掘文本信息并匹配关键词,实现CPI预测关键词深度上的扩展,从而构建了CPI预测的关键词库。在此基础上,本文进一步对文本挖掘技术特征扩展前后的关键词建立预测模型进行对比分析。研究表明,相比于传统的关键词提取算法,交互式TF-IDF算法不仅无需借助语料库,而且还允许种子词的输入。同时,BERT模型通过迁移学习的方式对基础模型进行微调,学习特定领域知识,在CPI预测问题中很好地实现了语言表征、语义拓展与人机交互。相对于传统文本挖掘技术,本文设计的文本挖掘技术具有较强的泛化表征能力,在84个CPI预测关键种子词的基础上,扩充后的关键词对CPI具有更高的预测准确度和更充分的解释性。本文针对CP 预测问题设计的文本挖掘技术,也为建立其他宏观经济指标关键词词库提供新的研究思路与参考价值。  相似文献   

11.
以沪深A股上市公司为样本,构建动态面板模型,基于技术资本的中介效应视角,挖掘环境规制对企业价值的影响路径。研究表明,环境规制、技术资本与企业价值具有明显的内在相关性,技术资本的中介效应显著成立。本研究不仅丰富了"波特假说"的现实证据,也对通过促进技术资本积累来改进环保绩效与可持续价值增长提供了有益的借鉴。  相似文献   

12.
面对当下智能手机APP种类繁多、层出不穷的局面,数据提取方案的提出和常见APP组合规律的深度挖掘已成为大数据时代的研究热点。在重新界定不同APP类别间关系度量方式的前提下,推出一套完整的关系型数据提取方案。借助社会网络可视化工具初步发现了不同APP类别间的关系程度及分布,而concor模型为APP组合的多层次划分和推荐提供了可靠的方法学依据。研究发现APP的多层次组合划分实现,对现实生活中经常同时使用的APP类别组的挖掘、划分结果具有较好的解释性和现实意义,为智能手机生产者提供了APP研发方向,并能推进智能生产和生活的发展进程。  相似文献   

13.
朱梅红 《统计与决策》2007,(16):147-150
本文介绍了数据挖掘中抽样技术运用的历史与现状,总结了数据挖掘领域对抽样技术研究和使用中存在的问题,并指出了数据挖掘中抽样技术未来研究方向和发展前景。  相似文献   

14.
文章融合了本体和数据挖掘技术,提出了基于本体的数据挖掘决策分析模型,利用基于本体的数据挖掘方法从语义层面上实现了对用户数据的挖掘,实现了用户数据的高效率和高精度挖掘,并根据挖掘结果进行决策分析,根据分析结果为用户提供基于RSS聚合的个性化服务.  相似文献   

15.
推动长江经济带绿色发展,挖掘绿色发展的金融动力具有重要意义。用综合指数衡量金融发展程度,用非径向方向距离函数测算绿色全要素生产率,以生态问题突出、金融欠发达的长江经济带上游乌江流域40个县域为样本,估计县域金融对绿色全要素生产率的影响。研究发现:县域金融不发达,但是整体水平处于上升态势,绿色全要素生产率年均增长0.6%,上游地区高于中下游地区;全样本下,县域金融通过绿色技术进步效应,推动了绿色全要素生产率增长;中下游地区县域金融推动了绿色全要素生产率进步,上游地区县域金融则抑制了绿色全要素生产率增长;2008年之后县域金融对绿色全要素生产率的影响增大。  相似文献   

16.
目前,国内外学者对企业能力的研究,定性分析居多,定量研究较少,多集中于对企业竞争力、核心能力的研究,主要采用层次分析法、模糊评价法.本文拟建立企业能力测评体系,并在此基础上首先提出了企业能力指数的概念,然后利用递阶多层次灰色评价方法和熵技术,给出了企业能力测评和伙伴挖掘模型,计算出企业能力指数,并进行了实证研究.  相似文献   

17.
一种测度数据序列同步波动强度的方法及应用   总被引:1,自引:0,他引:1  
同步波动强度是衡量数据序列之间波动关系的重要指标之一。文章在分析已有关于波动强度研究的基础上,提出了同步强度系数,并给出了定义和计算方法;分析了该指标的具体取值范围及含义,并发现同步强度系数可以同时反映数据序列之间的方向和数值强度两个方面特征;最后结合实例说明了同步强度系数的使用过程和分析步骤,认为同步强度系数的应用深度可以进一步挖掘。  相似文献   

18.
随着信息融合技术的发展,多分类器融合技术逐渐由基于数据的融合向基于知识的融合发展。在基于知识的多分类器融合研究中,模糊积分方法是三大发展方向之一,它相对于其他两种方法具有独特的优势。本文对多分类器融合现状进行了分析,指出了模糊积分方法的进展和发展方向。  相似文献   

19.
自然语言理解综述   总被引:3,自引:0,他引:3  
为了解决计算机理解自然语言问题,产生了自然语言理解这一研究方向,文章归纳了自然语言理解研究中的一些关键问题,整理了国内外自然语言理解技术发展的简史,讨论了自然语言理解技术的主要进展,并针对重大的研究工作做了粗浅的评述。最后对该学科的研究前景进行了展望。  相似文献   

20.
资源富集地区的环境与经济增长的协调性问题受到了越来越多的关注。文章使用方向距离函数研究了榆林市、延安市、铜川市3个地区的环境技术效率,并分析了影响环境技术效率的因素。研究发现:区域间环境工业协调性极不平衡,延安、榆林工业发展与环境关系较为和谐,铜川工业与环境关系严重失衡;实现环境与经济协调发展,重要的在于加快经济体制改革,积极推动产业结构调整。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号