共查询到20条相似文献,搜索用时 9 毫秒
1.
2.
3.
BOX PLOT——描述统计的一个简便工具 总被引:1,自引:0,他引:1
随着统计学的发展演变,许多新兴的统计方法和工具应运而生,给人们带来诸多方便。Box plot便是描述统计大家族的一名成员,它没有数理统计公式那般深奥难懂,却能以一个简单的组合图形将数据批的形状直观地表现出来,使人洞悉眼花缭乱的数据中隐含的结构信息。Box plot在一般的统计软件(如SAS、SPSS等)中可以比较容易地绘出,使我们可以方便地利用box plot分析数据批的分布形状,并进行数据批间的比较。 相似文献
4.
普通最小二乘法是估计回归方程式的参数的一种常用的方法,它是根据在一组假定前提条件厂,要求实际观测值(Y)到回归方程的估计值(Y)的离差平方和达到最小值,即最小值。但是在实际工作中,利用最小二乘法研究经济变量之;司的关系时,当调查取得的资料中出现异常值时,如果不采用恰当的方法加以修正,估计出来的结果就可能出现很大的扭曲。有些人采用舍掉异常值的办法,这样做也可能使回归方程和观测值拟合得好一些,但由于舍掉了异常值,使资料的个数明显减少.因而在进行有关统计检验时,会因自由度变化而使参数的估计和检验受到影… 相似文献
5.
Cook距离公式常用于回归模型的异常值诊断,但由于公式中的样本方差■对异常值敏感,导致公式缺乏稳健性,使得诊断效果不理想。基于以上问题,文章选取绝对离差中位数作为样本标准差的稳健估计量,得到了样本方差■的稳健估计量,进而构造出稳健Cook距离公式;借鉴传统Cook距离的回归模型异常值诊断理论,将稳健Cook距离公式应用于时间序列异常值诊断,拓展了传统Cook距离公式的异常值诊断领域。通过选取模拟样本量分别为50、100、200,污染率分别为0、1%、5%、10%的ARMA(1,1)序列及金融时间序列进行实例分析,结果发现:(1)在无污染时,稳健Cook距离法与常规Cook距离法的诊断正确率均为100%,两者没有出现"误诊"现象;(2)在样本量、污染率同时增大时,常规Cook距离诊断正确率急剧下降,当污染率达到5%及以上时,已基本无诊断力,而稳健Cook距离法依然能保持较高的诊断力。稳健Cook距离法不仅能应用于时间序列异常值诊断,也能应用于回归分析的异常值诊断。 相似文献
6.
计量经济学中,数据异常的问题一直是人们研究的重点,因为少量的异常值就会对模型拟合产生很大的影响.本文着重讨论了异常值对线性回归模型造成的影响及其检测方法,并通过自由软件R进行了三类异常值的模拟和检测. 相似文献
7.
Copula——一个新的计量经济工具 总被引:1,自引:1,他引:0
Copula是一个新的计量经济工具,对它的研究具有理论和实际应用价值.文章介绍了Copula理论及其应用情况,并展望了Copula的未来. 相似文献
8.
准确可靠的统计数据是把握经济运行情况、进行科学决策的基础.以我国GDP数据的准确性为例,选取1985~2010年间的数据作为样本,根据时间序列自身的变化特点,分别拟合灰色预测模型、回归组合模型和双指数平滑模型.在模型通过统计检验、具有良好统计预测能力的基础上,构建基于误差绝对值和最小的组合预测模型对我国GDP数据进行预测,所得预测值代表“真值”,再从异常值的角度对我国GDP数据的准确性进行分析,结果表明组合预测模型在统计数据准确性检验中较高的实用价值,值得进一步研究. 相似文献
9.
文中对近年来可靠性统计的研究动态与重要进展进行了回顾,并对21世纪可靠性统计的发展进行了展望. 相似文献
10.
一、异常值的两种理解统计数据质量问题一直困扰着我国统计界 ,也为社会各界所关注。所以近年来对其理论上的研究探讨始络保持热点。但研究的重点主要是在健全统计法律制度和完善工作程序等方面。毫无疑问 ,这些确实是提高统计数据质量的重要方面。但统计数据质量问题本质上是误差问题。即所提供的统计数据与客观的社会经济现象实际的数量特征之间的差距问题。如果数据中混进了异常值 ,就会使相应统计分析误差增大 ,小则出差错 ,大则发生事故 ,甚至导致宏观决策上的失误。因此 ,在利用统计数据进行统计分析之前 ,有必要对其进行异常数据的检… 相似文献
11.
基于稳健马氏距离的多元异常值检测 总被引:3,自引:0,他引:3
多元数据由于其复杂性而使其中的异常值检测问题成为一个研究难点.传统的多元统计方法由于受异常值影响使结果产生不稳定性.本文提出一种基于稳健马氏距离的异常值检测方法,并与其它一般的传统办法进行比较说明其优良性. 相似文献
12.
层次分析法在决策领域广泛应用,其正确性依赖判断矩阵。文章介绍了当判断矩阵不满足一致性检验时,利用其完全一致性的特点去寻找异常值,以及利用极大似然估计的方法去修正异常值,使其满足一致性检验,并举例说明。 相似文献
13.
工作中常有这种情况 :虽已掌握统计或工程模型 ,但具体的数据分析处理颇费时间 ,还容易出错。其实 ,Excel提供的数据分析工具 ,能使你轻松地获得所需结果。掌握某个数据分析工具 ,通常只要比较一现成例子和Excel提供的结果就可以了。下面以国家标准GB3361- 82“在成对观测值情形下两个均值的比较”上的例子加以说明。例 :为确定内燃机使用铜 -铅或白色金属轴瓦时 ,转轴的平均磨损率是否不同 (显著性水平a =0 . 0 1) ,收集了以下 9对观测值 :铜 -铅 (Xi) :88. 90 ,50 . 80 ,119. 38,71. 12 ,165. 10 ,55. 88,63 . 50 ,14 7.… 相似文献
14.
统计数据预处理的理论与方法述评 总被引:3,自引:0,他引:3
统计数据预处理是提升数据质量的重要阶段,包括数据审查、数据清理、数据转换和数据验证四大步骤。根据处理对象的特点及每一步骤的不同目标,统计数据预处理可采用的方法包括描述及探索性分析、缺失值处理、异常值处理、数据变换技术、信度与效度检验、宏观数据诊断等六大类。选用恰当的方法开展统计数据预处理,有利于保证数据分析结论真实、有效。 相似文献
15.
在经济计量建模过程中,异常值的影响评价与诊断问题越来越显得重要。本文旨在提供异常值对复共线性关系检验、序列相关性检验、异方差性检验、单位根检验等经济计量检验产生致命影响的典型案例,为经济计量学的教学与相关建模理论研究提供有说服力的数据资料。 相似文献
16.
基于空气质量数据特征,在B-样条基底拟合曲线的基础上,将曲线本身信息、曲线变化信息引入分析,构造加权曲线深度指标,探索一种异常曲线探测方法。与现有仅考虑离散点信息和曲线本身信息的方法相比较,该探测方法更加符合空气质量数据特点,具备缺失值处理能力及整体异常和局部异常的识别能力。将该方法应用于兰州市空气质量数据采集点的二氧化氮水平曲线异常情况分析,结果表明该方法具有更好的异常情况识别效果。 相似文献
17.
数据的质量直接影响数据分析的效率和分析结果的可靠性。数据质量包括数据结构质量和给定数据结构后的数据真实性、一致性和完整性。在着重考虑拿到数据之后,从单元格、记录、变量三个角度如何识别数据中潜在的质量问题,并以案例为支撑,介绍了各种可能出现的问题。 相似文献
18.
一、引言当我们对总体均值进行统计推断时,常常需要假定样本均值服从或近似服从正态分布。我们知道,当样本来自于正态总体时,样本①均值服从正态分布;当样本来自于非正态总体时,根据中心极限定理对于足够大的样本容量n,样本均值将近似服从正态分布。对于非正态总体,问题的关键是样本容量n的“足够大”到底指多少?这很难一概而论。人们通常以30为界,将n≥30的样本称为大样本,并认为样本均值-x的抽样分布可作正态近似;而将n<30的样本称为小样本,认为此时不宜将-x的抽样分布作正态近似。许多统计应用者都是按这样的工作规则来做的,但在许多实际… 相似文献
19.
广义Pareto分布尾部厚度的分析与应用 总被引:1,自引:0,他引:1
极端值模型是准确估计"厚尾"分布金融资产回报市场风险的有力工具.主要有分块样本极大值模型(BMM)和阈顶点模型(POT).文章对阈顶点模型中广义Pareto分布尾部厚度和应用进行分析.结果表明,当0<ε≤1时,分布的尾部厚度为"厚尾"且随着形状参数的增加而变厚,此时最适合于金融资产时间序列"厚尾"分布建模. 相似文献
20.
文章分析并改正了原有组合分布模型中的错误,定义一种新的组合分布并给出了新组合分布模型建立的一般步骤。实例表明,新的组合分布可以更好地反应极端风险。 相似文献