首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
图像数据挖掘相关研究综述—概念和应用   总被引:2,自引:0,他引:2  
图像挖掘是数据挖掘领域中新兴的领域。随着数字照相技术的发展和在多学科中的广泛应用,对大量图像数据的分析和研究越来越重要。由于图像挖掘的对象、内容不同于传统数据,方法上也不同于传统技术。本文旨在介绍图像挖掘的基本概念和体系以及国际上最新的研究成果。本文回顾了图像挖掘的相关问题及建模框架,并与模式识别、图像处理等相关领域进行了比较,在此基础上,还介绍了近年来图像挖掘领域在卫星遥感、医学影像和生物显微照片研究的相关应用。  相似文献   

2.
面板数据的聚类分析及其应用   总被引:19,自引:0,他引:19       下载免费PDF全文
 不同于传统的计量建模分析,本文探讨了多元统计方法在面板数据分析上的运用。文中介绍了面板数据的统计描述方法,构造了面板数据之间相似性的统计指标,并在此基础上提出了面板数据聚类分析的有效方法,通过实际应用取得了良好的效果。  相似文献   

3.
数据流挖掘技术是数据挖掘技术的新研究方向之一。文章介绍了数据流、数据流挖掘的特点,对现有的数据流挖掘算法进行了总结、分析,提出了数据流挖掘的研究方向和应用前景。  相似文献   

4.
在研究一组相关总体的数量特征、总体间数量特征关系和总体间的交互作用时,如果从每一总体中抽取一组截面数据,就形成了一种不同于截面数据、时间序列数据和面板数据的特殊数据类型——双截面数据,虽然现有数据处理方法可以为双截面数据提供“面板化”、“平行化”和方程结构耐抗性检验等处理思路,但鉴于双截面数据的特殊性,每种思路都有不完善的地方,充分挖掘双截面数据所隐含信息的针对性处理方法仍需进一步探索。  相似文献   

5.
唐晓彬等 《统计研究》2021,38(8):146-160
本文创新地将半监督交互式关键词提取算法词频-逆向文件频率( Term Frequency- Inverse Document Frequency, TF-IDF )与基于 Transformer 的 双 向 编 码 表 征 ( Bidirectional Encoder Representation from Transformers,BERT)模型相结合,设计出一种扩展CPI预测种子关键词的文本挖掘技术。采用交互式TF-IDF算法,对原始CPI预测种子关键词汇广度上进行扩展,在此基础上通过BERT“两段式”检索过滤模型深入挖掘文本信息并匹配关键词,实现CPI预测关键词深度上的扩展,从而构建了CPI预测的关键词库。在此基础上,本文进一步对文本挖掘技术特征扩展前后的关键词建立预测模型进行对比分析。研究表明,相比于传统的关键词提取算法,交互式TF-IDF算法不仅无需借助语料库,而且还允许种子词的输入。同时,BERT模型通过迁移学习的方式对基础模型进行微调,学习特定领域知识,在CPI预测问题中很好地实现了语言表征、语义拓展与人机交互。相对于传统文本挖掘技术,本文设计的文本挖掘技术具有较强的泛化表征能力,在84个CPI预测关键种子词的基础上,扩充后的关键词对CPI具有更高的预测准确度和更充分的解释性。本文针对CP 预测问题设计的文本挖掘技术,也为建立其他宏观经济指标关键词词库提供新的研究思路与参考价值。  相似文献   

6.
函数性数据的统计分析:思想、方法和应用   总被引:9,自引:0,他引:9       下载免费PDF全文
严明义 《统计研究》2007,24(2):87-94
 摘  要:实际中,越来越多的研究领域所收集到的样本观测数据具有函数性特征,这种函数性数据是融合时间序列和横截面两者的数据,有些甚是曲线或其他函数图像。虽然计量经济学近二十多年来发展的面板数据分析方法,具有很好的应用价值,但是面板数据只是函数性数据的一种特殊类型,且其分析方法太过于依赖模型的线性结构和假设条件等。本文基于函数性数据的普遍特征,介绍一种对其进行分析的全新方法,并率先使用该方法对经济函数性数据进行分析,拓展了函数性数据分析的应用范围。分析结果表明,函数性数据分析方法,较之计量经济学和其他统计方法具有更多的优越性,尤其能够揭示其他方法所不能揭示的数据特征  相似文献   

7.
大数据的冲击并非是对以样本数据为对象的统计学的颠覆,而是对现代统计学的扩展。本文结合大数据的相关特征,以数据经济价值的扩展为切入点,从数据价值挖掘的角度论证了数据挖掘与大数据分析的关系,探讨了大数据背景下数据衍生品的创造与数据工程学创建的必要性。在此基础上,参照“金融工程学”的概念及学科体系,对“数据工程学”的概念进行了界定,并对数据工程学学科体系构建的相关理论基础、主要研究内容与分析技术进行了归纳与说明。  相似文献   

8.
我们认为,收益率分布作为投资决策行为在市场交易中的直接后果,必然蕴涵着投资决策的行为特征.在我们前期的研究中,建立了基于行为理论的收益率分布模型,利用该模型考察投资者对小概率事件的反应程度,在投资行为模型基础上,可以建立有效的投资策略.本文在行为收益率分布模型和投资行为模型的基础上,通过考察投资者对小概率事件的反应程度,首次提出了不同于传统研究中采用收益率代表投资者的反应程度的方法,建立了不同于传统动量策略和反向策略的回复策略.利用沪市数据对本文提出的回复策略与传统动量、反向策略进行了实证比较研究.  相似文献   

9.
研究国内生产总值(即 GDP,下同)与主要经济统计指标的预测区间,需要从大量的数据中寻找数据变化趋势及指标之间的相关性,建立数学预测模型,并以模型来预测各项指标在以后年份的数值。通常人们使用的是回归分析和相关分析方法,经过多年实践,这两种方法技术已臻成熟,在许多领域的研究应用上均有显著的成果。本文采用回归  相似文献   

10.
秦磊  谢邦昌 《统计研究》2016,33(2):107-110
大数据时代下机遇与挑战并存,如何基于传统方法去处理大数据引人深思,一味地追求大数据也不一定正确。本文以谷歌流感趋势(GFT)为案例,介绍了大数据在疾病疫情监测方面的主要技术及相关成果,阐述了大数据在使用中的关键问题,并结合复杂的统计学工具给出了一些改进措施。谷歌流感趋势的成功取决于相关关系的应用,其失误却来源于模型的构造、因果关系和相关关系的冲突等问题。谷歌流感趋势案例的分析与启示对政府今后在大数据解决方案中有重要的理论和实践意义。  相似文献   

11.
唐晓彬等 《统计研究》2020,37(7):104-115
消费者信心指数等宏观经济指标具有时间上的滞后效应和动态变化的多维性,不易精确预测。本文基于机器学习长短时间记忆(Long Short-Term Memory,LSTM)神经网络模型,结合大数据技术挖掘消费者信心指数相关网络搜索数据(User Search,US),进而构建一种LSTM&US预测模型,并将其应用于对我国消费者信心指数的长期、中期与短期的预测研究,同时引入多个基准预测模型进行了对比分析。结果发现:引入网络搜索数据能够提高LSTM神经网络模型的预测性能与预测精度;LSTM&US预测模型具有较好的泛化能力,对不同期限的预测效果均较稳定,其预测性能与预测精度均优于其他六种基准预测模型(LSTM、SVR&US、RFR&US、BP&US、XGB&US和LGB&US);预测结果显示本文提出的LSTM&US预测模型具有一定的实用价值,该预测方法为消费者信心指数的预测与预判提供了一种新的研究思路,丰富了机器学习方法在宏观经济指标预测领域中的理论研究。  相似文献   

12.
常晋红 《山西统计》1999,(10):41-42
随着信息社会的到来,信息处理的需求越来越高,许多复杂的应用对象,如CAD、CAM、GIS等应用中涉及到大量的图形、图像、文字、声音、动画等多媒体数据类型,传统的数据库技术,如数据类型、数据模型、操作语言、存储结构、存取路径、检索机制以及网络和数据传递等都不能适应复杂应用对象的应用需求。这种需求促使了新技术的产生,这就是多媒体数据库。多媒体数据库是数据库技术与多媒体技术相结合的产物。一、多媒体数据的历史现状国外从80年代中期就已开始了对多媒体数据库的研究。人们发现,传统的数据库技术有一个根本的出发点,就…  相似文献   

13.
旅游需求预测是旅游研究中的一个新兴重要研究领域,在我国刚刚处于起步阶段.本文在考察了数十篇国外前沿研究成果的基础上,对定量预测技术中的单方程模型在旅游需求预测中的应用做以研究和介绍.力求为中国相关领域研究提供借鉴.……  相似文献   

14.
20世纪90年代,美国的一些应用者和学者把在数据海洋中寻找知识的过程叫做“数据挖掘”。这是一种新的信息处理技术,其主要特点是对数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助决策的关键性数据。数据挖掘与传统的数据分析,如查询、报表、OLAP(联机应用分析)、统计分析等数据分析技术的本质区别是数据挖掘是在明确假设的前提下去挖掘信息、发现知识。  相似文献   

15.
李德家 《山东统计》2005,(3):23-23,11
随着计算机及数据库技术的不断发展.数据库管理系统的广泛应用.数据库中存储的数据数量也急剧增大.在大量的数据里面隐藏着许多用于实践的信息,如果能把这些信息从数据库中提炼出来,将为我们工作创造很多潜在的利润.而这种从海量数据库中挖掘信息的技术.就称之为数据挖掘。数据挖掘是应用了统计学的知识以及计算机领域的思想、工具和方法.尤其是计算机学科的知识。  相似文献   

16.
本文通过对应用于公共事业的政府统计和应用于商业领域的企业数据分析与挖掘的介绍,阐述了统计建模思想的产生、发展和趋势。从量化的角度,诠释统计建模思想的几个不同的层次及适用的情境,以提升统计数据化决策在政府和商业领域的广泛应用为目标,目的是在面对公共和商业问题时政府和企业能运用统计建模思想提供的量化方法,实践商业智能与统计智能的互补,最终完成统计大数据决策时代的真正革命(最终实现大数据决策时代统计建模思想的真正价值)。  相似文献   

17.
“创新型城市评价”是创新型城市理论研究领域和建设实践领域的一大热点.目前官方倡导的创新型城市评价指标体系、学术界倡导的创新型城市评价指标体系在评价工作目的、数据获取渠道等方面存在明显的差异.创新型城市评价指标体系设计的后续研究应从基础理论研究、完善评价指标、加强数据公开与挖掘等方面进一步拓展.  相似文献   

18.
雷钦礼 《统计研究》1994,11(4):50-51
线性相关模型及其估计雷钦礼本文针对经济和社会研究领域中相关变量及其观测数据的特点并吸收回归分析中模型描述分析的思想,提出相关模型描述分析方法,用于讨论线性相关模型及其估计方法。一、两变量线性相关模型与估计假设两个线性相关的随机变量为Xflly,其样本...  相似文献   

19.
国外投入产出法研究述评   总被引:2,自引:1,他引:1  
介绍了目前国外投入产出研究比较集中的领域。投入产出模型的不确定性研究、空间结构分解分析法运用于投入产出模型研究和地区投入产出模型数据来源研究,是值得关注的趋势。  相似文献   

20.
一、问题的提出 统计学作为一门应用性很强的工具性学禾斗,其目的或任务是从众多数据中挖掘有用的信息,然后得出有关这个领域的某些特征或结论,进而用以指导实践,来“创造”更好的数据。统计的结果一方面依赖于观测数据,另一方面依赖于对所研究总体某些特性的假设,如分布形式.独立性等等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号