首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
目前国内外各种聚类算法数以千百计,本文提出了一个基于聚类算法构成要素的分类框架,进行了文献综述,并指出了四个研究热点。  相似文献   

2.
在数据驱动时代,如何挖掘金融资产的信息、挑选恰当的资产,对稳定收益、控制风险意义重大。多因子量化模型是选择股票的常用方法,选取最优解释力的因子集合是其主要目的之一。现有因子选择方法没有考虑到控制错误发现率(FDR),不利于构建稳健的投资策略。为此,在Logistic回归的基础上引入Knockoff方法进行因子选择,通过Lasso实现因子选择,利用Knockoff控制变量选择的FDR从而提高准确率。基于所选因子,在Logistic回归下进行股票预测,并与线性判别分析、支持向量机以及随机森林模型的预测结果进行对比。对沪深300指数和中证500指数成分股2007—2020年的数据进行实证研究,采用滑动回归法进行收益预测,并建立季度换仓的投资策略。研究表明,从变量选择上来看,基于Knockoff方法选出的因子所构造的选股模型具有更好的市场表现;从模型对比上来看,Logistic回归预测的投资组合具备高收益、低风险的优势。综合来看,将Knockoff方法引入到多因子选股模型有利于提高因子选择的准确度,对优化资产配置具有参考意义。  相似文献   

3.
本文研究的是时间序列的聚类问题。由于现实世界中时间序列多数是非线性的,而现有的时间序列聚类问题大都是基于线性时间序列模型进行聚类的,本文提出了可以用于非线性时间序列的聚类方法。以时间序列的二维核密度估计之间的相似性作为非线性时间序列的距离度量,该距离度量方式是一种非参数的距离度量方法,考虑到了时间序列自相关结构的差异,能够粗糙地识别时间序列形状和动态相关结构的相似性。与理论研究结果相一致,我们的模拟实验结果也验证了这种距离度量的有效性。  相似文献   

4.
对数据集进行聚类分析的过程中,由于数据属性包含的个性信息有差异,导致数据属性在聚类过程中的作用会有差异。因此需要对属性进行加权,以减少包含共性较多的属性对聚类结果的影响。目前粗糙集加权研究仅用于属性值为少数离散值的情况。提出了基于粗糙集指数加权算法,对原始数据集进行预处理,并设计实验,验证了该算法能够有效提高聚类算法的正确率。  相似文献   

5.
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。  相似文献   

6.
文章在信息技术迅速发展的背景下,研究针对海量数据计算机软硬件存储、分析的不足.通过研究海量数据下变量关联问题,构造了基于海量数据的学习算法.并通过数据模拟了该算法的应用原理.  相似文献   

7.
针对用户评分数据稀疏性问题,在对项目进行聚类基础上,文章提出了基于属性聚类的项目评分预测推荐算法。算法从项目属性特征相似性分析出发,利用K-Means聚类算法对项目进行聚类。对于未评分项目找到其所属的类簇;利用用户对类簇中其它项目的评分预测该用户对未评分项目的评分,达到降低数据稀疏性目的;最后结合协同过滤思想为用户提供推荐服务。实验结果表明,与基于项目评分预测的推荐算法相比,文章的算法推荐精度显著提高。  相似文献   

8.
视觉注意分配探讨个体如何选择性地注意外界信息。本文根据人类视觉系统的感知特点,提出一种定量描述视觉注意分配的方法。首先,模拟人类视觉感知机制,描述视线映射到界面上注视点的注意程度;然后,利用模糊核聚类算法计算注视点属于不同界面对象的程度,将注视点的注意程度和隶属度相结合构建两种视觉注意计算模型,分别为KFCM-A模型和KFCM-U模型;最后,设计相关眼动实验来验证视觉注意计算模型的有效性。实验结果表明:视觉注意计算模型能够较好地描述被试者个体的注意分配策略,且KFCM-U模型识别被试者搜索目标的准确率高达94.4%,较优于KFCM-A模型。  相似文献   

9.
介绍了蚁群聚类算法的原理,建立了省域物流发展评价指标体系,同时结合黑龙江省的物流发展情况,应用蚁群算法进行实证研究,并对结果进行分析,从而为科学制定黑龙江省省域物流规划提供了依据。  相似文献   

10.
目前研究的模糊C均值聚类算法(FCM)面临的最重要问题是初始值随机选取,导致其容易陷入局部最优,同时影响运算速度.而灰色预测GM(1,1)模型在形成预测公式时对初始值的选取也没有合理有效的方案.针对以上问题,文章提出坐标密度法,确定初始聚类中心,对FCM算法进行改进;接着提出运用改进的FCM求取GM(1,1)中数据的聚类中心,并把聚类中心作为初始值的方法;通过与已知算法进行比较验证了其可行性和有效性.  相似文献   

11.
苏治  傅晓媛 《统计研究》2013,30(5):54-62
 量化选股一直是金融领域研究的热点。随着人工智能技术的空前发展,量化选股方法取得了很大进步。本文构建了基于核主成分遗传算法改进的支持向量回归机人工智能选股模型(KPCA-GA-SVR),并基于沪深股市股票基本面及交易数据,分别从短期和中长期对其选股性能和预测精度进行了实证分析。主要结论为:①遗传算法(GA)改进的SVR较传统模型预测精度更高,且避免了过度拟合;②与采用主成分降维技术的PCA-GA-SVR模型相比,基于核主成分特征提取的KPCA-GA-SVR模型,具有更好模型稳健性及预测准确性;③中长期内该模型的预测误差随滑窗长度的增加有降低趋势,且一年期预测精度最高;短期内不同滑窗下,一周的预测效果最佳。本研究对个人投资者的投资决策及国家宏观监控股市动态变化都具积极意义。  相似文献   

12.
根据中国股市非市场化特点与股权分置改革的影响等问题,在股票市场价格严重失真情况下,运用非参数核估计方法,拟合了股市的理论收益率指标,通过对比股市实际收益率指标显著性偏离关系,提出了中国股市风险理论的独特含义与计量方法。实证显示:非参数核估计能够很好估计股市理论收益率指标,准确地计量中国股市风险动态变化情况。  相似文献   

13.
高海燕等 《统计研究》2020,37(8):91-103
函数型聚类分析算法涉及投影和聚类两个基本要素。通常,最优投影结果未必能够有效地保留类别信息,从而影响后续聚类效果。为此,本文梳理了函数型聚类的构成要素及运行过程;借助非负矩阵分解的聚类特性,提出了基于非负矩阵分解的函数型聚类算法,构建了“投影与聚类”并行的实现框架,并采用交替迭代方法更新求解,分析了算法的计算时间复杂度。针对随机模拟数据验证和语音识别数据的实例检验结果显示,该函数型聚类算法有助于提高聚类效果;针对北京市二氧化氮(NO2)污染物小时浓度数据的实例应用表明,该函数型聚类算法对空气质量监测点类型的区分能够充分识别站点布局的空间模式,具有良好的实际应用价值。  相似文献   

14.
基于遗传算法的投影寻踪聚类   总被引:2,自引:0,他引:2  
传统的投影寻踪聚类算法PROCLUS是一种有效的处理高维数据聚类的算法,但此算法是利用爬山法(Hill climbing)对各类中心点进行循环迭代、选取最优的过程,由于爬山法是一种局部搜索(local search)方法,得到的最优解可能仅仅是局部最优。针对上述缺陷,提出一种改进的投影寻踪聚类算法,即利用遗传算法(Genetic Algorithm)对各类中心点进行循环迭代,寻找到全局最优解。仿真实验结果证明了新算法的可行性和有效性。  相似文献   

15.
基于核密度估计对VaR值计算方法的改进   总被引:1,自引:0,他引:1  
文章从VaR方法的定义出发,首先对VaR值的两种基本计算方法进行阐述,进而基于核密度估计,提出一种改进的VaR值计算方法.该改进方法将蒙特卡罗模拟法引入到核密度估计规则,并且考虑四分位距来构造核密度估计的窗宽,对股市收益率的变异性以及高峰厚尾现象进行了更好地刻画.实证验证了改进的VaR值计算方法的有效性及优越性.  相似文献   

16.
股票价格常常呈现出集聚效应,并对市场质量产生重要影响,因此需要利用高频数据深入研究中国股票市场价格集聚效应的存在性及其表现特征,同时解释其原因。通过对沪市高频交易数据的统计检验和定量实证研究表明:价格尾数在“0”、“5”和“8”上存在显著的集聚效应,并且可以用“价格决定”假说加以解释,但是不能用“价格吸引”假说解释。投资者通过在这些点位上变动一个最小报价单位进行报价,将可以最小成本获得交易的优先权。  相似文献   

17.
文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用.将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标.  相似文献   

18.
文章介绍了基于高斯混合模型的期望最大化聚类算法,并对模型进行了简化,运用案例分析了该模型在经济管理领域中的应用,利用可视化的图形展示了研究样本的概率密度.  相似文献   

19.
数据分布密度划分的聚类算法是数据挖掘聚类算法的主要方法之一。针对传统密度划分聚类算法存在运算复杂、运行效率不高等缺陷,设计高维分步投影的多重分区聚类算法;以高维分布投影密度为依据,对数据集进行多重分区,产生数据集的子簇空间,并进行子簇合并,形成理想的聚类结果;依据该算法进行实验,结果证明该算法具有运算简单和运行效率高等优良性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号