在统计分析中如何识别极端值 |
| |
引用本文: | 郭莉.在统计分析中如何识别极端值[J].江苏统计,1999(11). |
| |
作者姓名: | 郭莉 |
| |
摘 要: | 极端值亦称离群值或边远值,即在观测值中远远偏离数据主体部分的个别值,这些值不能服从假定的概率分布。如果将极端值和其它数据不加区别地等同对待,会使数据的离散程度加大,计算出的数字特征不能反映主体数据的特征。对极端值进行识别并加以处理,是探索性数据分析的一个重要问题。经过适当处理后的数据,具有较强的耐抗性,即对局部数据的不良行为具有不敏感性。在统计分析中,识别极端值的方法有以下几种:(一)四分展布法四分展布法是一种经验法,首先计算中位数和四分位数:设有数据X1,X2…Xn,将其从小到大排列,记为X(t),…
|
本文献已被 CNKI 等数据库收录! |
|