期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王德青等《统计研究》2015,32(4):91-96

函数型数据的稀疏性和无穷维特性使得传统聚类分析失效。针对此问题,本文在界定函数型数据概念与内涵的基础上提出了一种自适应迭代更新聚类分析。首先,基于数据参数信息实现无穷维函数空间向有限维多元空间的过渡;在此基础上,依据变量信息含量的差异构建了自适应赋权聚类统计量,并依此为函数型数据的相似性测度进行初始类别划分;进一步地,在给定阈值限制下,对所有函数的初始类别归属进行自适应迭代更新,将收敛的优化结果作为最终的类别划分。随机模拟和实证检验表明,与现有的同类函数型聚类分析相比,文中方法的分类正确率显著提高,体现了新方法的相对优良性和实际问题应用中的有效性。相似文献

2.

基于非负矩阵分解的函数型聚类算法

高海燕等《统计研究》2020,37(8):91-103

函数型聚类分析算法涉及投影和聚类两个基本要素。通常,最优投影结果未必能够有效地保留类别信息,从而影响后续聚类效果。为此,本文梳理了函数型聚类的构成要素及运行过程;借助非负矩阵分解的聚类特性,提出了基于非负矩阵分解的函数型聚类算法,构建了“投影与聚类”并行的实现框架,并采用交替迭代方法更新求解,分析了算法的计算时间复杂度。针对随机模拟数据验证和语音识别数据的实例检验结果显示,该函数型聚类算法有助于提高聚类效果;针对北京市二氧化氮(NO2)污染物小时浓度数据的实例应用表明,该函数型聚类算法对空气质量监测点类型的区分能够充分识别站点布局的空间模式,具有良好的实际应用价值。相似文献

3.

基于函数型主成分的中国股市波动研究 总被引：1，自引：0，他引：1

岳敏朱建平《统计与信息论坛》2009,24(3):52-56

运用函数型主成分分析方法,对中国沪市89支股票的月度收益率进行分析,其结果表明函数型主成分方法能够较为准确地捕捉到月度收益率的时间波动特征,特别是它在时间上的变化方向和形式,为股票收益率的建模和预测提供科学依据. 相似文献

4.

基于基函数展开的函数型数据聚类方法

陈晓锋殷瑞飞《统计与决策》2009,(19)

文章在一个一般性的框架下研究了利用基函数展开进行函数型数据聚类的问题.在这个框架之下,大量传统的聚类方法都可以直接应用到函数型数据分析.另外,我们将Pearson相似系数引入函数型数据聚类分析,解决了欧式距离无法刻画曲线之间形态差异的问题. 相似文献

5.

函数型死亡率预测模型

王洁丹朱建平付荣《统计研究》2013,30(9):87-93

人口死亡率反映人口的死亡水平,是人口规模的重要影响因素,同时也是人寿保险精算的重要数据基础。从数据特征来看,死亡率作为年龄的函数,是一种典型的函数型数据。本文使用函数型数据方法分析中国人口数据,基于1994—2010年中国人口分年龄死亡数据,建立函数型死亡率预测模型,对未来分年龄死亡率进行预测,并通过生命表方法计算了未来平均预期寿命。同时通过对历史数据的预测,说明模型预测结果比较可信。相似文献

6.

消费行为的因子检验与消费价值的聚类统计

廖军《统计与决策》2016,(21):109-112

文章运用主成分分析法实证检验我国大中城市居民消费价值观对休闲消费行为的影响,并对消费者消费行为做出聚类分析.研究发现:消费者价值观可分为自信进取型、时尚享乐型、传统保守型等3大聚类,不同聚类消费者的休闲消费行为呈现出不同特征. 相似文献

7.

期权市场对现货市场波动率影响的实证分析——基于上证50ETF期权上市前后的比较 总被引：3，自引：2，他引：1

刘庞庞《统计与信息论坛》2017,(10):50-58

上证50ETF期权于2015年2月9日正式推出,这是中国第一只场内期权,对推动中国金融衍生品市场的进一步发展有重要的示范意义。结合ARMA-GARCH模型和TGARCH模型对上证50ETF在期权上市前后现货市场的波动情况进行建模分析,发现上证50ETF收益率的波动在期权上市后平均有所减小,但是在期权上市后的第一年波动率增加,第二年比较小;另一方面上证50ETF的收益率在期权上市后的第一年存在显著的非对称波动现象,但是在第二年不明显。相似文献

8.

基于B-样条基底展开的曲线聚类方法 总被引：3，自引：1，他引：3

黄恒君《统计与信息论坛》2013,28(9):3-8

随着大数据时代的来临,近年来函数型数据分析方法成为研究的热点问题,针对曲线的聚类分析方法引起了学界的关注.给出一种曲线聚类的方法:以L2距离作为亲疏程度的度量,在B样条基底函数展开表述下,将曲线本身信息、曲线变化信息引入聚类算法构建,并实现了曲线聚类与传统多元统计聚类方法的对接.作为应用,以城乡收入函数聚类实例验证了该曲线聚类方法,结果表明,在引入曲线变化信息的情况下,比仅考虑曲线本身信息能够取得更好的聚类效果. 相似文献

9.

评价股票聚类的Ward权熵指标

王宁荣喜民何丽《统计与信息论坛》2015,(1):29-34

目前关于股票聚类方法的研究比较多,但针对聚类结果优劣的评价尚无统一标准。针对股票财务聚类要求准确性和面向投资者的实用性等特点,将Ward聚类法的核心思想和信息熵理论相结合,基于偏差和损失最小与信息量损失最小两个角度,提出评价股票聚类结果优劣的Ward权熵指标,以验证在聚合聚类的条件下该指标关于聚类数K单调不降。相似文献

10.

非线性面板数据聚类方法研究

孙艳黄咏宁《统计与信息论坛》2017,(2):32-36

对于一类变量非线性相关的面板数据,现有的基于线性算法的面板数据聚类方法并不能准确地度量样本间的相似性,且聚类结果的可解释性低。综合考虑变量非线性相关问题及聚类结果可解释性问题,提出一种非线性面板数据的聚类方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率聚类,实证表明该方法的有效性及其对聚类结果的可解释性有所提高。相似文献

11.

一种加权主成分距离的聚类分析方法 总被引：1，自引：0，他引：1

吕岩威李平《统计研究》2016,33(11):102-108

指标之间的高度相关性及其重要性差异导致了传统聚类分析方法往往无法获得良好的分类效果。本文在对传统聚类分析方法及其各种改进方法局限性展开探讨的基础上,运用数学方法重构了分类定义中的距离概念,通过定义自适应赋权的主成分距离为分类统计量,提出一种新的改进的主成分聚类分析方法——加权主成分距离聚类分析法。理论研究表明,加权主成分距离聚类分析法系统集成了已有聚类分析方法的优点,有充分的理论基础保证其科学合理性。仿真实验结果显示,加权主成分距离聚类分析法能够有效解决已有聚类分析方法在特定情形下的失真问题,所得分类效果更为理想。相似文献

12.

上证50ETF隐含高阶矩风险对股票收益的预测研究

王琳玉等《统计研究》2020,37(12):75-90

高阶矩是刻画资产收益涨跌非对称和“尖峰厚尾”现象中不可忽略的系统性风险。本文基于我国上证50ETF期权数据采用无模型方法估计隐含波动率、隐含偏度和隐含峰度,通过自回归滑动平均模型提取期权隐含高阶矩新息(Innovations),将它们作为高阶矩风险的度量,探讨其对股票收益的预测作用。研究表明:①在控制换手率和股息率等变量后,隐含波动率对于上证50指数和市场未来4周的超额收益有显著负向的预测作用;②隐含偏度新息越低,上证50指数和市场的超额收益越高,这种预测能力在未来1周和未来4周均显著,但随着时间的推移,隐含偏度新息的预测能力逐渐下降;③隐含偏度风险对于我国股市横截面收益也有显著的解释能力,投资组合在隐含偏度风险因子上的风险暴露越大即因子载荷值越大,则未来的收益会越低;④隐含峰度新息总体上与股票收益负相关。相似文献