共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
3.
目前国内外各种聚类算法数以千百计,本文提出了一个基于聚类算法构成要素的分类框架,进行了文献综述,并指出了四个研究热点。 相似文献
4.
本文根据大连市二三类行业参加工伤保险的实际情况,选择2009年至2011年连续三年缴纳工伤保险的9136个单位工伤保险数据,使用k-means聚类分析方法对工伤保险支付率以及工伤发生率进行定量分析,同时开发了网格分析方法,对支付率以及工伤发生率进行组合分析,同时依据国家相关要求及大连市相关政策,根据网格分析方法的结果对大连市工伤保险费率的浮动办法提出政策建议。 相似文献
5.
对数据集进行聚类分析的过程中,由于数据属性包含的个性信息有差异,导致数据属性在聚类过程中的作用会有差异。因此需要对属性进行加权,以减少包含共性较多的属性对聚类结果的影响。目前粗糙集加权研究仅用于属性值为少数离散值的情况。提出了基于粗糙集指数加权算法,对原始数据集进行预处理,并设计实验,验证了该算法能够有效提高聚类算法的正确率。 相似文献
6.
文章在信息技术迅速发展的背景下,研究针对海量数据计算机软硬件存储、分析的不足.通过研究海量数据下变量关联问题,构造了基于海量数据的学习算法.并通过数据模拟了该算法的应用原理. 相似文献
7.
介绍了蚁群聚类算法的原理,建立了省域物流发展评价指标体系,同时结合黑龙江省的物流发展情况,应用蚁群算法进行实证研究,并对结果进行分析,从而为科学制定黑龙江省省域物流规划提供了依据。 相似文献
8.
针对传统的k-类支持向量机(SVM)算法对数据进行多分类时存在的特征变量间信息重叠、模型复杂法(度M高CC、)分对类同精类度别低中这的一特系征列变问量题进,文行章赋提权出,用使得用到灰的色综关合联变聚量类(建GR立C k)-对类特SV征M变模量型进,行给分出类了,一并种用改复进相的关k系-数类SVM多分类算法。实证分析表明,该算法的分类效果优于传统算法。 相似文献
9.
在“十四五”时期,识别新设国家中心城市是构建与城市群发展相适应的新型城镇化格局,实现城市群高质量发展新增长极的重要途径,具有十分重要的现实意义。目前中国尚未形成科学系统的国家中心城市识别方法,因此以中国19个城市群中的27个中心城市为研究对象,基于金融中心、科技中心、交通中心、贸易中心、文化中心、教育中心、信息中心、对外交往中心和医疗中心等9个维度的发展能力,构建国家中心发展能力指标体系,在对各中心城市的9大发展能力及国家中心发展能力进行时空动态化评估的基础上,运用贝叶斯修正的特征提取的面板数据聚类方法识别出最具潜力发展成为新设国家中心城市的城市,既完善了国家中心城市的评价指标体系,又改进了聚类方法。研究结果表明,不同时空下中心城市国家中心发展能力的空间格局十分相似,国家中心发展能力整体呈现国家级城市群中心城市强、地区级城市群中心城市弱的时空格局,西部地区的中心城市的发展均普遍落后于东部中心城市;长沙市和济南市被识别为最具备潜力成为新设国家中心城市,长沙市在金融、科技、交通、贸易和文化方面具备较强的发展潜力,济南市在科技、交通、贸易和文化方面具备较强的发展潜力。 相似文献
10.
股票收益波动具有典型的连续函数特征,将其纳入连续动态函数范畴分析,能够挖掘现有离散分析方法不能揭示的深层次信息。本文基于连续动态函数视角研究上证50指数样本股票收益波动的类别模式和时段特征。首先由实际离散观测数据信息自行驱动,重构隐含在其中的本征收益波动函数。进一步,利用函数型主成分正交分解收益函数波动的主趋势,在无核心信息损失的主成分降维基础上,引入自适应权重聚类分析客观划分股票收益函数波动的模式类别。最后,利用函数型方差分析检验不同类别收益函数之间波动差异的显著性和稳健性,并基于波动函数周期性时段划分,图形展示和可视化剖析每一类别收益函数在不同时段波动的势能转化规律。研究发现:上证综指股票收益波动的主导趋势可以分解为四个子模式,50只股票存在五类显著的波动模式类别,并且5类波动模式的特征差异主要体现在本次研究区间的初始阶段。本文拓展了股票收益波动模式分类和差异因素分析的研究视角,能够为金融监管部门的管理策略制定和证券市场的投资组合配置提供实证支持。 相似文献
11.
《统计学通讯:理论与方法》2013,42(4):835-849
Abstract Let the data from the ith treatment/population follow a distribution with cumulative distribution function (cdf) F i (x) = F[(x ? μ i )/θ i ], i = 1,…, k (k ≥ 2). Here μ i (?∞ < μ i < ∞) is the location parameter, θ i (θ i > 0) is the scale parameter and F(?) is any absolutely continuous cdf, i.e., F i (?) is a member of location-scale family, i = 1,…, k. In this paper, we propose a class of tests to test the null hypothesis H 0 ? θ1 = · = θ k against the simple ordered alternative H A ? θ1 ≤ · ≤ θ k with at least one strict inequality. In literature, use of sample quasi range as a measure of dispersion has been advocated for small sample size or sample contaminated by outliers [see David, H. A. (1981). Order Statistics. 2nd ed. New York: John Wiley, Sec. 7.4]. Let X i1,…, X in be a random sample of size n from the population π i and R ir = X i:n?r ? X i:r+1, r = 0, 1,…, [n/2] ? 1 be the sample quasi range corresponding to this random sample, where X i:j represents the jth order statistic in the ith sample, j = 1,…, n; i = 1,…, k and [x] is the greatest integer less than or equal to x. The proposed class of tests, for the general location scale setup, is based on the statistic W r = max1≤i<j≤k (R jr /R ir ). The test is reject H 0 for large values of W r . The construction of a three-decision procedure and simultaneous one-sided lower confidence bounds for the ratios, θ j /θ i , 1 ≤ i < j ≤ k, have also been discussed with the help of the critical constants of the test statistic W r . Applications of the proposed class of tests to two parameter exponential and uniform probability models have been discussed separately with necessary tables. Comparisons of some members of our class with the tests of Gill and Dhawan [Gill A. N., Dhawan A. K. (1999). A One-sided test for testing homogeneity of scale parameters against ordered alternative. Commun. Stat. – Theory and Methods 28(10):2417–2439] and Kochar and Gupta [Kochar, S. C., Gupta, R. P. (1985). A class of distribution-free tests for testing homogeneity of variances against ordered alternatives. In: Dykstra, R. et al., ed. Proceedings of the Conference on Advances in Order Restricted Statistical Inference at Iowa city. Springer Verlag, pp. 169–183], in terms of simulated power, are also presented. 相似文献
12.
在人民币国际化不断推进、人民币汇率双向波动加强的背景下,构建具有优良预测能力的人民币汇率预测模型意义重大。参数模型对汇率预测的能力不仅取决于模型设定是否正确,同时还取决于能否迅速探测参数的结构性变化以使用最佳信息估计模型参数。本文构建了多元自适应可变窗算法以及时监测模型参数的时变特征,探测最大化参数同质区间。结果显示:①在中长期(3至24个月)的美元、欧元、英镑和日元兑人民币汇率的样本外推预测中,多元自适应可变窗算法能显著优于随机游走模型、购买力平价模型、弹性货币模型、利率平价模型、泰勒规则模型与偏移型泰勒规则模型这六种汇率预测主流模型,其预测能力也显著优于实时窗宽选择算法与自回归模型;在美元兑人民币汇率中长期(3至24个月)预测中,其预测误差MAE度量相比于次优模型能降低 25%~50%。②多元自适应可变窗算法能迅速捕捉美元、欧元、英镑和日元兑人民币汇率的拐点,预测人民币汇率走向并刻画人民币汇率的周期性变化,其长期(向前9个月)方向性趋势样本外推预测精度比次优模型提高了16%~40%。③断点前后的汇率动态结构性变化显示“811”汇改促进了经济基本面对汇率预期重要性的显著提升与市场风险偏好的转变。“811”汇改之后,人民币汇率预期更易受外部冲击影响。加速利率市场化建设、提高国内收入、稳定物价、坚持带管制的浮动汇率制度与有效的资本管制相结合等措施对促进汇率市场化、防止汇率风险具有重要意义。 相似文献
13.
本文提出了基于初始值为内生确定下的动态空间固定效应模型,综合考虑了可直接观测和不可直接观测或无法观测的空间效应;推导了模型参数拟极大似然估计量具有的渐近性质及其渐近分布。对参数估计量性质的模拟检验结果表明,似然估计量的渐近性质随着样本容量的增加而改善,且其改善程度对时间维度变化较对空间维度变化更为敏感,在空间单元限定情形下有效增加时间维度可以显著改善估计量性质。中国省域经济收敛性的实证案例分析结果显示,本文构建的综合考虑双重空间结构的空间计量模型具有适用性和合理性。 相似文献
14.
The analysis of categorical response data through the multinomial model is very frequent in many statistical, econometric, and biometric applications. However, one of the main problems is the precise estimation of the model parameters when the number of observations is very low. We propose a new Bayesian estimation approach where the prior distribution is constructed through the transformation of the multivariate beta of Olkin and Liu (2003). Moreover, the application of the zero-variance principle allows us to estimate moments in Monte Carlo simulations with a dramatic reduction of their variances. We show the advantages of our approach through applications to some toy examples, where we get efficient parameter estimates. 相似文献
15.
16.
This article aims to put forward a new method to solve the linear quantile regression problems based on EM algorithm using a location-scale mixture of the asymmetric Laplace error distribution. A closed form of the estimator of the unknown parameter vector β based on EM algorithm, is obtained. In addition, some simulations are conducted to illustrate the performance of the proposed method. Simulation results demonstrate that the proposed algorithm performs well. Finally, the classical Engel data is fitted and the Bootstrap confidence intervals for estimators are provided. 相似文献
17.
Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。 相似文献
18.
《统计与信息论坛》2019,(10):108-114
通过采用结构方程模型方法,以传统物流业和高端物流业为中介变量,实证研究政府营商环境因素对物流集群发展的影响效应。研究表明:物流信用对物流集群具有显著的正向影响效应,行政审批和交通运输对物流集群具有不显著的正向影响效应,土地供给对物流集群具有不显著的负向影响效应;同时,高端物流业在物流信用与物流集群间具有显著的中介作用,传统物流业和高端物流业分别在行政审批、土地供给、交通运输与物流集群间具有不显著的中介作用。当前,政府应高度重视物流信用体系建设,大力发展高端物流业,不断优化物流营商环境,加强物流基础设施建设,从而促进中国物流集群高质量发展。 相似文献
19.