期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

孙艳黄咏宁《统计与信息论坛》2017,(2):32-36

对于一类变量非线性相关的面板数据,现有的基于线性算法的面板数据聚类方法并不能准确地度量样本间的相似性,且聚类结果的可解释性低。综合考虑变量非线性相关问题及聚类结果可解释性问题,提出一种非线性面板数据的聚类方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率聚类,实证表明该方法的有效性及其对聚类结果的可解释性有所提高。相似文献

2.

基于特征提取的多指标面板数据聚类方法

党耀国侯荻青《统计与决策》2016,(19):68-72

多指标面板数据能够较全面的提供研究对象的信息和数据特征,但复杂的数据结构也给其聚类分析带来了一定的困难.针对这一问题,文章提出了基于特征提取的多指标面板数据聚类方法,该方法将能够表征面板数据动态变化的“绝对量”特征、“波动”特征、“偏度”特征、“峰度”特征及“趋势”特征引入动态聚类算法中,可以避免以往采用欧式距离进行聚类的局限性,还可以处理带有缺失数据的面板数据,同时大大提高了聚类效率,并最大限度地保证时间维度信息不受损失.利用该方法分析了2001至2013年我国不同省份道路交通事故的不平衡状况,通过实证分析表明该方法能够解决多指标面板数据聚类的问题. 相似文献

3.

面板数据加权聚类分析方法研究

张立军彭浩《统计与信息论坛》2017,(4):21-26

在面板数据聚类分析方法的研究中,基于面板数据兼具截面维度和时间维度的特征,对欧氏距离函数进行了改进,在聚类过程中考虑指标权重与时间权重,提出了适用于面板数据聚类分析的"加权距离函数"以及相应的Ward.D聚类方法。首先定义了考虑指标绝对值、邻近时点增长率以及波动变异程度的欧氏距离函数;然后,将指标权重与时间权重通过线性模型集结成综合加权距离,最终实现面板数据的加权聚类过程。实证分析结果显示,考虑指标权重与时间权重的面板数据加权聚类分析方法具有更好的分辨能力,能提高样本聚类的准确性。相似文献

4.

基于小波特征提取的高频面板数据聚类方法

《统计与信息论坛》2018,(2):46-51

高频面板数据在时间维度的频繁波动给聚类的准确性造成了很大干扰。综合考虑这一问题,从小波分解的角度提取了面板数据主成分降维后指标的综合得分序列,利用小波变换提取综合得分序列的"周期"特征、低频部分的"均值"特征与"趋势"特征、高频部分的"波动"特征,最后采用熵值法对这些特征进行赋权并利用赋权后的特征数据和系统聚类方法实现高频面板数据聚类。通过股票高频面板数据的实证分析表明,该方法的聚类效果良好。相似文献

5.

面板数据聚类方法及应用 总被引：7，自引：0，他引：7

李因果何晓群《统计研究》2010,27(9):73-77

基于面板数据的时序特征和截面特征,综合考虑面板数据“绝对指标”,“增量指标”及其“时序波动”特征,在重构面板数据相似性测度的距离函数和Ward聚类算法的基础上,提出了面板数据聚类方法。并以2003-2007年财政金融面板数据为例,对中国14个沿海开放城市进行了聚类分析,显示了良好的应用性。相似文献

6.

多指标面板数据聚类方法及其应用

任娟《统计与决策》2012,(4):92-95

文章针对多指标面板数据的样品分类问题,从多元统计学理论角度提出一个多指标面板数据的聚类分析方法。该方法综合考虑面板数据的水平指标、增量指标和增量变化率指标的时间序列特征及其非同步时间序列问题,在重新构造了离差平方和函数基础上,提出了一种聚类方法。通过实证分析,表明新方法能够解决多指标面板数据聚类的问题,分类效果较好。相似文献

7.

基于形状特征的多指标面板数据聚类方法及其应用 总被引：1，自引：0，他引：1

任娟陈圻《统计与信息论坛》2011,26(10):28-33

针对多指标面板数据的样品分类问题,从特征提取角度提出一个多指标面板数据的聚类分析方法。该方法将时间序列的局部变化特性与整体距离关系结合起来,将局部变化的信息融入相似测度的计算中,提出一种自适应滑动窗口分段方法,实现时间序列局部变化的特征提取,在重新定义综合距离的基础上,提出一种聚类方法。通过实证分析,表明新方法能够解决多指标面板数据聚类的问题,分类效果较好。相似文献

8.

面板数据聚类分析的投影寻踪模型

徐华锋方志耕《统计与决策》2010,(4)

文章针对面板数据的聚类问题的高维复杂性,利用线性投影技术将其转换为关于投影特征向量的线性聚类问题;从而实现在低维空间对高维数据样本的聚类分析。最后实证分析验证了面板数据聚类分析的投影寻踪模型的可行性与有效性。相似文献

9.

基于密度的面板数据聚类分析

杨娟谢远涛《统计与信息论坛》2014,(2):23-28

研究面板数据聚类问题过程中,在相似性度量上,用Logistic回归模型构造相似系数和非对称相似矩阵。在聚类算法上,目前的聚类算法只适用于对称的相似矩阵。在非对称相似矩阵的聚类算法上,采用最佳优先搜索和轮廓系数,改进DBSCAN聚类方法,提出BF—DBSCAN方法。通过实例分析,比较了BF—DBSCAN和DBSCAN方法的聚类结果,以及不同参数设置对BF—DBSCAN聚类结果的影响,验证了该方法的有效性和实用性。相似文献

10.

基于关系聚类的动态面板数据模型及其应用研究

刘翠霞史代敏《统计与信息论坛》2015,(3):10-16

运用面板数据建模分析时,在考虑截面异质性的情形下存在参数过多的问题。提出一种基于面板数据关系结构的聚类方法,能有效解决模型估计时参数过多的问题;提出内距离与外距离概念,有效解决了聚类分析时定量确定分类数的问题。将此方法运用于动态面板数据的建模分析,统计模拟结果显示有较好的小样本性质。基于理论模型,采用中国1996-2012年的省级面板数据,实证分析了金融发展对房地产业发展的动态影响,分析效果与现实经济发展较吻合,证明该方法有较好的应用性。相似文献

11.

基于改进的自适应传播模型的农业风险区划分析

谢远涛杨娟刘皓宇《统计与信息论坛》2017,(1):33-40

农业险定价中的核心问题是农业风险区划问题,为了体现农业区划中个体指标的动态发展特征,根据近邻传播改进自适应近邻传播聚类方法对数据进行优化,基于轮廓系数、归属度和吸引度得到最佳聚类中心和几何聚类中心,并将聚类转化为新数据集的聚类问题;选取代表性的棉花为例进行实证分析,通过计算生产、销售、收入、财政等指标进行棉花风险区划实例分析,计算最优棉花风险区划,结果表明对于具有动态特征的数据,本模型具有很好的有效性、实用性和解释性。相似文献

12.

Clustering the mixed panel dataset using Gower's distance and k-prototypes algorithms

Özlem Akay Güzin Yüksel 《统计学通讯:模拟与计算》2013,42(10):3031-3041

ABSTRACT

Panel datasets have been increasingly used in economics to analyze complex economic phenomena. Panel data is a two-dimensional array that combines cross-sectional and time series data. Through constructing a panel data matrix, the clustering method is applied to panel data analysis. This method solves the heterogeneity question of the dependent variable, which belongs to panel data, before the analysis. Clustering is a widely used statistical tool in determining subsets in a given dataset. In this article, we present that the mixed panel dataset is clustered by agglomerative hierarchical algorithms based on Gower's distance and by k-prototypes. The performance of these algorithms has been studied on panel data with mixed numerical and categorical features. The effectiveness of these algorithms is compared by using cluster accuracy. An experimental analysis is illustrated on a real dataset using Stata and R package software. 相似文献

13.

面板数据的有序聚类分析及其应用——以全球气候变化聚类分析为例 总被引：1，自引：0，他引：1

杨毅赵国浩秦爱民《统计与信息论坛》2012,27(7):13-18

面板数据的有序聚类分析是多元统计分析的新兴研究领域。借鉴多元统计学中主成分分析方法对面板数据在时间变量上进行降维处理,把变异信息的损失降低到最小,较为准确地反映了样本在各时间段内的整体变化水平;采用费希尔最优求解算法对主成分得分进行有序聚类,为研究有序面板数据的亲疏关系提供一些思路;对全球气候变化进行聚类分析,分析五十年来全球及区域气候变化特点,与国外研究结论对比,显示出良好的应用性。相似文献

14.

面板数据的聚类分析及其应用 总被引：19，自引：0，他引：19

下载免费PDF全文

朱建平陈民恳《统计研究》2007,24(4):11-14

不同于传统的计量建模分析，本文探讨了多元统计方法在面板数据分析上的运用。文中介绍了面板数据的统计描述方法，构造了面板数据之间相似性的统计指标，并在此基础上提出了面板数据聚类分析的有效方法，通过实际应用取得了良好的效果。相似文献

15.

函数数据聚类分析方法探析 总被引：3，自引：0，他引：3

曾玉钰翁金钟《统计与信息论坛》2007,22(5):10-14

函数数据是目前数据分析中新出现的一种数据类型,它同时具有时间序列和横截面数据的特征,通常可以描述为关于某一变量的函数图像,在实际应用中具有很强的实用性。首先简要分析函数数据的一些基本特征和目前提出的一些函数数据聚类方法,如均匀修正的函数数据K均值聚类方法、函数数据层次聚类方法等,并在此基础上,从函数特征分析的角度探讨了函数数据聚类方法,提出了一种基于导数分析的函数数据区间聚类分析方法,并利用中国中部六省的就业人口数据对该方法进行实证分析,取得了聚类结果。相似文献

16.

旅游产业的溢出效应及其集群化测度研究——基于山西省11个地市的实证分析

王军军杜英王建平张爱宁姜玲《统计与信息论坛》2016,(4):74-79

基于2008—2014年的面板数据,以旅游收入和旅游人次为自变量,以地区生产总值为因变量,构建回归模型,对旅游产业的溢出效应进行实证分析。研究发现,旅游收入和旅游人次会对地方经济产生正的溢出效应,适合旅游产业的集群化发展。然后分别运用城市旅游功能、区位熵、产业空间联系方法,通过定性和定量分析,对山西省11个地市的旅游产业集群化程度进行了综合测度与评价,并据此提出了建议。相似文献

17.

一种加权主成分距离的聚类分析方法 总被引：1，自引：0，他引：1

吕岩威李平《统计研究》2016,33(11):102-108

指标之间的高度相关性及其重要性差异导致了传统聚类分析方法往往无法获得良好的分类效果。本文在对传统聚类分析方法及其各种改进方法局限性展开探讨的基础上,运用数学方法重构了分类定义中的距离概念,通过定义自适应赋权的主成分距离为分类统计量,提出一种新的改进的主成分聚类分析方法——加权主成分距离聚类分析法。理论研究表明,加权主成分距离聚类分析法系统集成了已有聚类分析方法的优点,有充分的理论基础保证其科学合理性。仿真实验结果显示,加权主成分距离聚类分析法能够有效解决已有聚类分析方法在特定情形下的失真问题,所得分类效果更为理想。相似文献