首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
针对基于众包竞赛中欺诈者筛除机制的黄金标准数据方法、聚类算法的离群点检测算法K-means-算法和DBSCAN算法,依赖于事先给定的参数,不适合大规模数据集检测的问题,提出基于样本连通图的离群点检测算法。首先,给定参数并重复调用离群点检测算法,识别数据中的离群点和聚类;其次,计算每两个样本之间的连接次数和连接强度,在给定连接强度下界δ的情况下,根据样本的连接强度来构造样本之间的连通图;最后,根据样本之间的连通情况,对样本进行标记,把样本标记为聚类节点和离群点。实验结果表明,该算法在放宽参数设置范围的情况下,缩小了离群点个数波动范围,提升了离群点识别准确率,优于对比算法和经典的黄金标准数据方法。  相似文献   

2.
本文回顾了离群点数据挖掘技术的研究成果,对高维离群点数据挖掘技术进行了简要的评述,并在此基础上提出了一种基于粗糙聚类的高维离群点数据挖掘的算法,采用粗糙集方法选择出最优子空间,直接对高维空间数据进行聚类,并对子空间离群点进行数据挖掘,取得了良好的效果。  相似文献   

3.
文章以提高客户信息管理过程中离群信息挖掘的效率为目标,在传统的基于距离的离群数据挖掘方法的基础上,探索出了一种新的高效分析方法,该方法的时间复杂度降为O(d n log2n),能够一次性完成离群数据及其特征属性(OFA)的挖掘过程,且能够给出相应的离群因子(OF)来描述离群数据的离群程度及其为什么离群等离群信息。同时,用户操作简便,结果显示易于理解。该方法可以应用于对数据量大、维数高的Web客户信息的离群数据分析和特征属性挖掘工作。  相似文献   

4.
时间序列自回归AR模型的Yule-Walker估计法在建模过程中易受离群值的影响,导致计算结果与实际不相符。针对这一现象,基于均值和方差的稳健组合估计量构建了稳健自相关函数,得到了时序AR模型的稳健Yule-Walker估计算法,以克服离群值的影响。并对此方法进行了模拟与金融数据实证检验,模拟和实证检验均表明:当时序数据中不存在离群值时,传统估计方法与稳健估计方法得到的结果基本保持一致;当数据中存在离群值时,运用传统估计方法得到的结果出现较大变化,而运用稳健估计方法得到的结果基本不变。这说明相对于传统估计方法,稳健估计方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。  相似文献   

5.
时间序列自回归AR模型在建模过程中易受离群值的影响,导致计算结果与实际不相符。针对这一现象,运用FQn统计量对传统自相关函数进行改进,构建出自回归AR模型的稳健估计算法,以克服离群值的影响,并对此方法进行了模拟和实证分析。模拟和实证分析均表明:当时序数据中不存在离群值时,传统估计方法与稳健估计方法得到的结果基本保持一致;当数据中存在离群值时,运用传统估计方法得到的结果出现较大变化,而运用稳健估计方法得到的结果基本不变.这说明相对于传统估计方法,稳健估计方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。  相似文献   

6.
由于传统因子分析方法对离群值较敏感,导致计算结果与实际不相符。针对这一现象,本文运用FAST-MCD方法对传统因子分析方法进行改进,构建出因子分析的稳健算法,以克服离群值的影响,并对此方法进行了模拟和实证分析。模拟和实证分析结果均表明:因子旋转前后,当数据中不存在离群值时,传统因子分析与稳健因子分析得到的结果基本保持一致;当数据中存在离群值时,运用传统因子分析得到的结果出现较大变化,而运用稳健因子分析方法得到的结果基本不变,这说明相对于传统因子分析方法,稳健因子分析方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性。  相似文献   

7.
在基于抽样调查数据对总体参数进行估计的方法中,小域估计方法能够借助于辅助信息对小样本乃至无样本区域的参数进行有效的估计,并被广泛应用于抽样估计领域。单元水平模型作为小域估计的基本模型之一,是处理单元级别数据估计的有力工具之一。在单元水平模型的应用条件中,需假定区域随机误差和模型随机误差均服从正态分布。然而,在抽样调查中,满足这一条件的调查数据是很少的,尤其是在观测数据中出现离群值时。不满足正态性假设条件下的小域估计量会产生较大的偏差和均方误,因此有必要研究针对正态性假设和离群观测值不敏感的稳健估计方法。通过引入γ散度和γ似然函数,构建了基于单元水平模型的小域稳健估计方法,得到了模型参数的稳健估计和小域目标变量的稳健估计。与现有的稳健估计方法相比,所提新方法能更好地处理区域随机误差和模型随机误差非正态的情形,对于目标变量存在离群观测的情形,具有更好的稳健性,估计均方误更小。在利用模拟数据进行验证中,比较了不同误差分布情形下几类常用估计方法得到的估计量的均方误差,并进一步探究了随着污染分布的方差和比率变化,所得估计量的均方误差变化情形。最后,通过应用于经典的小域估计数据,进一步验证了所提新...  相似文献   

8.
在非寿险业务中,对未决赔款准备金进行预测分布有着重要的意义,而流量三角形中离群值的存在,会影响未决赔款准备金预测的准确性。在流量三角形中引入离群值,运用基于正态分布的一元离群值检测的孤立点挖掘算法挖掘离群值,考虑不同位置下离群值的不同修正办法。将蒙特卡洛法应用于未决赔款准备金评估的对数正态模型中,通过数值算例加以实证分析,得到了未决赔款准备金的预测分布。  相似文献   

9.
在准备金进展法中考虑离群值的影响,采用残差箱线图对相关索赔数据进行离群值检验,然后选择合适插补值的一种改进的准备金进展法,并对支付率和结转率的尾部数据加以修正,改善了最后两个进展年的异常值不能被有效识别的情况。研究表明:改进的准备金进展法能够有效识别和调整增量已决赔款和增量已报案赔款中的离群值,降低了离群值对最终准备金评估结果的影响。  相似文献   

10.
根据高技术产业技术创新活动的复杂性,文章将高技术产业技术创新过程分解为技术研发过程和技术转化过程,通过构建链形结构的关联网络DEA模型对我国区域高技术产业技术创新效率进行了较全面的评价。结果表明:我国区域高技术产业技术创新的整体效率和两个子过程效率都偏低,存在明显的区域差异;技术转化过程并不是导致技术创新活动相对低下的主要原因;我国大部分地区表现为两过程效率的一高一低或双重低效;东、中、西部三大地区的高技术产业技术创新效率呈现出明显的"阶梯分布"现象。  相似文献   

11.
12.
The generalised least squares, maximum likelihood, Bain-Antle 1 and 2, and two mixed methods of estimating the parameters of the two-parameter Weibull distribution are compared. The comparison is made using (a) the observed relative efficiency of parameter estimates and (b) themean squared relative error in estimated quantiles, to summarize the results of 1000 simulated samples of sizes 10 and 25. The results are that: generalised least squares is the best method of estimating the shape parameter ß the best method of estimating the scale parameter a depends onthe size of ß for quantile estimation maximum likelihood is best Bain-Antle 2 is uniformly the worst of the methods.  相似文献   

13.
一、问题的提出随着现代科技的发展 ,人们越来越认识到技术的重要性。它不仅是一个国家经济增长的主要推动因素 ,还决定一个国家的经济结构、生产力水平并最终影响一国的综合实力。有关技术的输入和输出逐渐引起人们的关注。技术的流动可以通过有形的高新技术产品交易 ,无形的技术转让、科技人员交流等形式进行。我国海关近年来对高新技术产品进出口已经建立了统计制度 ,从中可观察到高新技术产品各种分类及流向。而对于以人或文件为载体的技术转让 ,由于其无形性和复杂性 (常伴随着其他形式的技术流动 ) ,对其实施统计无疑是十分困难的。随…  相似文献   

14.
对我国基本单位名录库系统建设的研究   总被引:1,自引:0,他引:1       下载免费PDF全文
一、引言建立和完善名录库系统 ,是市场经济发展的客观要求。近年来 ,国际社会已普遍重视名录库建设并多次召开会议专门对此进行研讨和交流。据了解 ,以法国为代表的整个欧洲、美国、日本、加拿大、澳大利亚等国家和地区都在名录库建设方面花费了很大的精力并积累了不少成熟经验① 。我国的名录库建设起步较晚 ,于 1 993年初次引入名录库这一概念 ,于 1 996年第一次基本单位普查时建立了第一个覆盖全社会的较为完整的单位名录库 ,并通过每年一次的统计单位登记工作逐步完善。我国的名录库建设从无到有 ,从有到力图向国际标准靠拢 ,这本身是…  相似文献   

15.
中国商业银行业实行分业经营的合理性分析   总被引:1,自引:0,他引:1       下载免费PDF全文
一、前言作为一种银行审慎经营管制手段 ,分业经营制度实质上是银行资产选择管制 ,隔离商业银行业务、投资银行业务与保险业务是其最主要的内容。除了资产选择管制 ,其它常用的审慎经营管制手段还有存款利率管制、资本充足性要求。世界各国都对银行业进行审慎经营管制的原因在于银行业不同于其他产业的特征 :首先 ,债务在银行资产结构中所占比重很大 ,且债权人极为分散 ;其次 ,除了可内部化的破产成本外 ,银行破产还存在高昂的社会成本。负债比重越大银行破产的概率越大 ,而债权人越分散债权人对银行资产运营监管能力和积极性越小。银行破产…  相似文献   

16.
中国外资并购中的反垄断问题研究   总被引:2,自引:0,他引:2       下载免费PDF全文
在经济全球化的背景下,跨国并购已经成为国际直接投资的一种主要形式。随着我国对外开放程度不断提高,跨国并购浪潮对我国经济发展的影响也呈现越来越大的趋势。跨国公司并购不仅带来了我国企业所需要的资金、技术和管理经验,而且对我国生产要素优化重组和产业结构的战略性调整起到了一定的促进作用。但是,外资并购是一把“双刃剑”,它对东道国的经济发展也可能带来一些负面效应,其中最大的负面效应就是垄断。这种垄断可能表现为外资控制东道国市场,进而破坏其良好的竞争秩序;也可能表现为制约东道国幼稚产业的发展,影响其民族工业的独立性;…  相似文献   

17.
Suppose all events occurring in an unknown number (ν)(ν) of iid renewal processes, with a common renewal distribution F  , are observed for a fixed time ττ, where both νν and F   are unknown. The individual processes are not known a priori, but for each event, the process that generated it is identified. For example, in software reliability application, the errors (or bugs) in a piece of software are not known a priori, but whenever the software fails, the error causing the failure is identified. We present a nonparametric method for estimating νν and investigate its properties. Our results show that the proposed estimator performs well in terms of bias and asymptotic normality, while the MLE of νν derived assuming that the common renewal distribution is exponential may be seriously biased if that assumption does not hold.  相似文献   

18.
董根泰 《统计研究》2004,21(11):47-5
一、部分国家农产品价格的政策支持评价体系简介 1.生产者支持估计 生产者支持估计(Producer Support Estimate,简称PSE),是因为政策原因而从消费者和纳税人向农业生产者转移的年度总货币价值.生产者支持估计包括隐性和显性转移(支持).所谓隐性转移(支持),就是指国内农产品价格大大高于国际市场价格.所谓显性转移(支持),主要是指表1中的从B.到H.共7项.  相似文献   

19.
我国农产品交易市场发展对策研究   总被引:4,自引:0,他引:4       下载免费PDF全文
李敏 《统计研究》2003,20(1):15-3
The paper discusses the formation, current condition, characteristics, existing problems and policy of agricultural market.  相似文献   

20.
A form of the distribution function of ratios of linear combinations of order statistics of samples from an exponential distribution is given. From the distribution, tables of percentage points of the statistic for α = .05, .95, and n = 3(1)50, and for censoring up to five observations are presented. Use of the tables is made to find critical values of the most powerful scale and location invariant test of exponentiality against uniformity, and also to find critical values for a test of outliers in an exponential population.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号