共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
文章文针对金融等领域的时间序列数据流,提出了一种直方图的构造方法,该方法具有联机处理高频时间序列数据流的能力,并具有与最优化直方图构造方法接近的精度. 相似文献
3.
数据流分类中的概念漂移问题是数据挖掘技术领域的前沿和难点,其重点是等级分类可能随着数据序列的转移而产生漂移现象。虽然估计动态漂移及其调整分类的算法已被提出,但现有算法由于目标分布例证的缺失在概念漂移估计方面的表现并不是很好,例证的多少严重影响了估计效果。鉴此,提出了一种新的参数估计方法,称为转移估计法,运用目标分布数据,结合相似分布理论,对现存的算法进行改进,以便实现对数据流分类中的概念漂移现象进行正确检测和估计。通过对虚拟和真实数据集的仿真实验表明,改进算法在数据流分类中的概念漂移估计方面优于现存算法。 相似文献
4.
数据挖掘(机器学习)领域的研究重点是建立概念漂移数据(Concept-drift)下的模型,其中的核心问题就是探测器算法.文章提出了一种基于双窗的探测算法.其优点是给出了该算法的严格理论基础;有效提高挖掘效率,克服虚漂移的干扰.并且运用人工和实际数据进行实验,效果亦优于其他算法. 相似文献
5.
图像数据挖掘相关研究综述—概念和应用 总被引:2,自引:0,他引:2
Ding Chong Fan Jun Luan Tian 《统计教育》2008,(12)
图像挖掘是数据挖掘领域中新兴的领域。随着数字照相技术的发展和在多学科中的广泛应用,对大量图像数据的分析和研究越来越重要。由于图像挖掘的对象、内容不同于传统数据,方法上也不同于传统技术。本文旨在介绍图像挖掘的基本概念和体系以及国际上最新的研究成果。本文回顾了图像挖掘的相关问题及建模框架,并与模式识别、图像处理等相关领域进行了比较,在此基础上,还介绍了近年来图像挖掘领域在卫星遥感、医学影像和生物显微照片研究的相关应用。 相似文献
6.
7.
8.
多媒体视频会议技术在我国刚刚开始起步。为了研究北京市多媒体视频会议技术的市场现状以及发展前景,我们进行了本次研究,不仅研究了使用多媒体视频会议技术的公司以及未使用多媒体视频会议技术的公司的对比情况,还对使用过多媒体视频会议技术的个人进行研究,从而挖掘该技术的市场范围及潜力。 相似文献
9.
多媒体视频会议技术在我国刚刚开始起步。为了研究北京市多媒体视频会议技术的市场现状以及发展前景,我们进行了本次研究,不仅研究了使用多媒体视频会议技术的公司以及未使用多媒体视频会议技术的公司的对比情况,还对使用过多媒体视频会议技术的个人进行研究,从而挖掘该技术的市场范围及潜力。 相似文献
10.
本文创新地将半监督交互式关键词提取算法词频-逆向文件频率( Term Frequency- Inverse Document Frequency, TF-IDF )与基于 Transformer 的 双 向 编 码 表 征 ( Bidirectional Encoder Representation from Transformers,BERT)模型相结合,设计出一种扩展CPI预测种子关键词的文本挖掘技术。采用交互式TF-IDF算法,对原始CPI预测种子关键词汇广度上进行扩展,在此基础上通过BERT“两段式”检索过滤模型深入挖掘文本信息并匹配关键词,实现CPI预测关键词深度上的扩展,从而构建了CPI预测的关键词库。在此基础上,本文进一步对文本挖掘技术特征扩展前后的关键词建立预测模型进行对比分析。研究表明,相比于传统的关键词提取算法,交互式TF-IDF算法不仅无需借助语料库,而且还允许种子词的输入。同时,BERT模型通过迁移学习的方式对基础模型进行微调,学习特定领域知识,在CPI预测问题中很好地实现了语言表征、语义拓展与人机交互。相对于传统文本挖掘技术,本文设计的文本挖掘技术具有较强的泛化表征能力,在84个CPI预测关键种子词的基础上,扩充后的关键词对CPI具有更高的预测准确度和更充分的解释性。本文针对CP 预测问题设计的文本挖掘技术,也为建立其他宏观经济指标关键词词库提供新的研究思路与参考价值。 相似文献
11.
12.
13.
本文介绍了数据挖掘中抽样技术运用的历史与现状,总结了数据挖掘领域对抽样技术研究和使用中存在的问题,并指出了数据挖掘中抽样技术未来研究方向和发展前景。 相似文献
14.
15.
推动长江经济带绿色发展,挖掘绿色发展的金融动力具有重要意义。用综合指数衡量金融发展程度,用非径向方向距离函数测算绿色全要素生产率,以生态问题突出、金融欠发达的长江经济带上游乌江流域40个县域为样本,估计县域金融对绿色全要素生产率的影响。研究发现:县域金融不发达,但是整体水平处于上升态势,绿色全要素生产率年均增长0.6%,上游地区高于中下游地区;全样本下,县域金融通过绿色技术进步效应,推动了绿色全要素生产率增长;中下游地区县域金融推动了绿色全要素生产率进步,上游地区县域金融则抑制了绿色全要素生产率增长;2008年之后县域金融对绿色全要素生产率的影响增大。 相似文献
16.
17.
一种测度数据序列同步波动强度的方法及应用 总被引:1,自引:0,他引:1
同步波动强度是衡量数据序列之间波动关系的重要指标之一。文章在分析已有关于波动强度研究的基础上,提出了同步强度系数,并给出了定义和计算方法;分析了该指标的具体取值范围及含义,并发现同步强度系数可以同时反映数据序列之间的方向和数值强度两个方面特征;最后结合实例说明了同步强度系数的使用过程和分析步骤,认为同步强度系数的应用深度可以进一步挖掘。 相似文献
18.
随着信息融合技术的发展,多分类器融合技术逐渐由基于数据的融合向基于知识的融合发展。在基于知识的多分类器融合研究中,模糊积分方法是三大发展方向之一,它相对于其他两种方法具有独特的优势。本文对多分类器融合现状进行了分析,指出了模糊积分方法的进展和发展方向。 相似文献
19.