首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
基于统计的离群数据挖掘与分析   总被引:1,自引:0,他引:1  
在数据空间中不可避免地存在着一些严重偏离整体样本集合的其它观测值,这些离群数据对数据挖掘与分析结果具有重要影响.通过对各种基于统计算法的总结与比较,按一元到多元的探索性离群分析思路,设计了一般分布下的Grubbs离群检测法和基于似然的混合模型离群点检测方法,并对多维数据的统计检测技术进行了讨论.结果表明,在离群检测与分析中恰当地利用统计方法在低维数据中的有效性进行探索性数据分析是可行的.  相似文献   

2.
小波文献中,离散小波变换多由于带分解或拉普拉斯塔形分解等引出。本文从连续小波变换及小波级数变换出发,通过对采样过程的分析导出了离散小波变换的定义。离散小波变换是唯一便于X数值计算的小波变换,本文提出了一种以离散小波变换计算小波级数变换的算法,该算法较之O’Rloul的类似算法相比,可取得更好的计算精度。  相似文献   

3.
数据离散化就是按照特定的规则或方法对数据进行分类的研究,是很多研究的基础,有很重要的现实意义。文章在对数量属性数据离散化方法进行简要总结的基础上,针对FCM经典算法的不足,提出了基于非线性规划的改进方法,并用GAMS软件编程实现。为了进一步检验该方法,文章又结合因子分析和数据挖掘的方法对建材超市顾客满意度问题进行了分析,把基于非线性规划的数据离散化方法应用于实际数据。  相似文献   

4.
基于小波包变换和混沌理论提出了一种股票市场建模及其预测的新方法,既能刻划时间序列的规律,又能捕捉混沌状态的特征。首先,应用小波包变换对上证综指和深证成指日收益率序列进行三层分解,分别得到第三层从低频到高频八个频率成分的时序,并在此基础上作进一步分析,结果表明中国股市存在混沌特性;然后,应用混沌理论分别建立从低频到高频八个时序的预测模型,分别对八个时序进行预测;最后,基于小波包理论对混沌模型预测的结果予以重构,实现对原始收益率序列的预测。与现有方法比较,该方法具有较高的精度和较大的应用范围。  相似文献   

5.
一种新的嵌入零树小波ECG信号压缩编码算法(简称为改进的SPIHT算法),通过合理分配比特、改进零树集合、完善分类策略等措施能够进一步提高SPIHT算法的工作效率.该算法首先将ECG数据进行离散小波变换,然后对离散小波变换后的系数进行均匀量化,最后用基于上下文的自适应算术编码对量化后的系数进行编码.仿真结果显示,该算法压缩比大,信息损失小,能够较好地恢复原有的信号.  相似文献   

6.
本文应用小波变换对深圳股票市场的建模与预测进行了研究。首先对股指时序进行小波分解;然后对分解后的各部分分别建立混沌模型进行预测;再对混沌模型预测的结果予以小波重构,即得最终的预测结果。从吸引子结构的观点对预测精度提高的原因进一步分析得出,小波分解可使分解后的时序变得简单而容易预测,因而使得最终的预测结果能够具有较高的精度。研究表明,小波变换在股市预测中具有非常好的应用前景。  相似文献   

7.
小波变换和混沌理论在股市预测中的应用   总被引:1,自引:0,他引:1  
应用小波变换和混沌理论相结合的方法对股票市场进行预测,即先对股指时序进行小波分解,然后对分解得到的高、低频部分分别进行混沌预测,再将预测的结果进行小波重构,得到原始时序的预测结果。在此基础上应用小波和混沌理论提出进一步提高预测精度的方法,即通过对高频部分再进行小波分解、混沌预测和小波重构而使高频部分的预测精度得以提高,进而提高原始时序的预测精度。  相似文献   

8.
噪声消除是小波变换最成功的应用之一,其基本思想是将信号的小波变换系数通过阈值处理,然后进行小波重构得到降躁的信号。根据故障轴承声发射信号的脉冲特性选取Morlet小波.以“小波熵最小”原则确定Morlet小波的波形参数,然后进行连续小波变换。采用软阈值方法处理小波东数,通过小波重构得到降噪后的故障声发射信号,噪声得到了很好的抑制,故障脉冲特征明显增强。采用实验数据,通过与离散小波变换的比较,得到了用连续小波变换可以有效降低噪声、提取故障声发射信号特征的结论。  相似文献   

9.
本文分析了由具有二阶矩的ARMA过程的小波特征,把时序模型与小波变换结合起来,得到一些新结果。  相似文献   

10.
离散小波变换将离散时间信号分解为一系列不同分辨率下的离散近似信号和离散细节,紧支的正交规范小波与完全重构正交镜像滤波器(PR-QMF)相对应。在紧支正交小波基的构造条件下,利用余弦调制完全重构滤波器组的方法,实现了M带紧支正交小波基的构造,计算机模拟表明该方法非常简单、有效。  相似文献   

11.
运用替代数据方法来分析判断上海期货交易所两种主要工业品期货———铜和天然橡胶的期货价格时间序列的非线性特征。通过对两种期货合约共三组样本观测数据的检验,发现期货收益时间序列存在明显的非线性成分,且存在某种相依性,为进一步期货价格时间序列的非线性特征提供依据。  相似文献   

12.
一种海量数据的分析技术 ——符号数据分析及应用   总被引:9,自引:0,他引:9  
传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolic data analysis, SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用‘数据打包’的理念,对海量的原始数据在不破坏其原有内在逻辑关系的前提下,可以进行变量和样本点空间的双重降维,并将传统的统计分析技术扩展到符号数据分析体系中。符号数据的方法体系是知识发现和数据管理领域的最新研究方向之一,目前在国内鲜有相关的研究资料。文章详细阐述了符号数据因素分析技术的原理和概念,并以中国股票市场为案例研究背景,结果表明,SDA因素分析技术对综合简化大规模多维数据系统是十分有效的。  相似文献   

13.
针对常用的滤波去噪方法都受到使用条件的限制,实际资料的滤波去噪不能达到良好效果,S变换时变滤波克服了传统滤波去噪方法滤波因子不能随时间、频率变化而变化的缺陷。将地震资料用S变换方法变换到时频域,对不同时间内不同频率的噪声部分充零,再将去噪后的地震数据利用S反变换到时间域,以获得所需要的有效信号。通过理论计算分析和实例计算表明,S变换时变滤波能够有效去除不同时段、不同频率的噪声。该方法具有一定的可行性。  相似文献   

14.
Accurate forecast of the carbon trading price is of great significance in promoting the scientific and rational development of carbon trading market. Therefore, this paper proposes a multi-scale combined forecasting method for carbon price based on mixed structure data. First, the Google Index is used to extract the unstructured data related to the carbon price.The dimensions of unstructured data are reduced based on principal component analysis. Then, EMD is employedto the structured data,unstructured data and the carbon trading price to obtain different IMFs, which are reconstructed by the Fine-to-Coarse technique to get low, high frequency sequence and trend sequence. Furthermore, the three items are predicted respectively by using ARIMA, PLS and neural networks according to the features of each scale in time series. Finally, the forecasting results are summed to get the carbon price forecast sequence. The proposed method is used to forecast carbon price in EU. The empirical results show that the prediction accuracy of the model is higher than that of the single prediction method and the prediction method that time series aren’t decomposed by EMD, which is of great applicability.  相似文献   

15.
This paper presents time and frequency domain analyses of psychotherapy data drawn from a unique dyadic system--the patient/therapist (P/T) system. The data are constituted by a time series defined by which member of the P/T system held the speaker role at each second of ten recorded psychotherapy consultations. The series reflects a specific property of communication within the dyad. Each series significantly followed a first order autoregressive model. That is, each was highly sensitive to the prior state of the system, or equivalently, the system showed feedforward of its prior state. These models became more significant after intervention analysis further clarified the underlying autoregressive structure. The histograms of the frequency of the length of each utterance indicated an underlying Poisson model for the emergence of speech. The parameters of the Poisson and autoregressive models were used to determine blindly which of four pairs of interviews involved the same therapist with two different patients. The method correctly identified three of the therapist four pairs but failed to identify different interviews with the same patient, a significantly negative result. These results suggest that certain time domain measures are therapist-dominated, so that the therapist drives change in these areas within the P/T system more strongly than the patient. In the frequency domain, the coherency between each of the 45 pairs of speaker series was used in an attempt to identify which time series corresponded systematically to the same therapists or patients. This proved futile because no two pairs of series--no P/T system--showed significant non-zero coherency. This result suggests that the harmonics of the switching of the speaker role are not determined by the therapist or patient alone but by the P/T system as an entity. We conclude that human dyadic systems may show predominant influence of one member or jointly determined patterns that are highly distinctive.  相似文献   

16.
数据挖掘技术作为一种有效的决策工具正为企业做出科学决策提供依据。该文针对关联规则挖掘商品间相关性的不足,提出了一种新的计算方法利用销售商的商品销售数据挖掘商品之间的相关性及影响关系。该方法根据商品销售数据的变化得到所有商品销售数据的时间序列,然后计算测量序列的相似度,从而确定商品间影响关系。实验证明了该方法的有效性,同时得到了一些有价值的结果,可用于指导具体商业实践。  相似文献   

17.
针对金融时间序列分析中注重快速作出趋势判断的特点,利用数据挖掘的思想和工具,提出一种金融时间序列模式快速发现算法.与传统的预测算法相比较,该算法对数据的分布和平稳性等方面的要求不高,不基于任何假设,能够非常快速地发现时间序列中的频繁模式,经过模式匹配后,可以用于金融时间序列的分析与预测.以实际汇率数据为例,证明了该算法的有效性.  相似文献   

18.
数据仓库和联机分析处理是决策支持系统的有机组成部分,结合连锁超市配送决策支持系统的实例,提出了基于数据仓库和联机分析处理的决策支持系统的解决方案,并对如何完善模型作了进一步的探讨。  相似文献   

19.
在区域经济的定量分析中,较多的文献只是停留在静态的比较分析中,即仅对某一年的综合经济实力分析比较,而不是对一个大的经济体内各经济区域之间连续若干年的综合经济实力的动态比较。文章就解决这个问题所涉及到的分析方法、立体数据库的构造方法,对多维动态数据库系统给出全局主成分分析模型及较为详细的计算步骤,并对这种立体数据表进行立体式的综合与简化,最后将此模型应用于区域经济的多指标综合评价体系中,其综合分析结果与实际发展现实的吻合度十分相似。  相似文献   

20.
通过研究OPC数据访问规范,结合其数据访问机制,提出了应用COM开发OPC客户端的方法及其具体实现过程,并且根据实际需求,实现对不同OPC服务器、不同数据的访问.以Thermo公司提供的OPCDA服务器为例,实现了可靠的数据传输.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号