首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
城市道路交通中交通检测器获得的数据往往不完整,存在缺失现象,需要对其进行修复,以保证交通流预测模型的实际应用精度。现阶段随机森林(RF)方法主要应用于交通流预测方面,在交通流数据修复方面的应用和研究较少。针对低缺失比例的交通流数据修复提出了GA-RF模型的缺失数据修复方法,采用遗传算法(GA)对RF模型进行优化调参,用优化后的GA-RF模型修复交通流缺失数据,并将修复效果和其他修复方法进行比较。实验结果表明:在少量数据缺失情况下,所提出的GA-RF方法能很好地实现路段交通流缺失数据修复,且修复精度高于同等缺失比例的RF方法、历史均值法以及历史相邻加权法。  相似文献   

2.
新常态经济的CPI预测模型——构建与实证比较   总被引:1,自引:0,他引:1  
本文基于新常态经济发展背景研究了居民消费价格指数(CPI)的预测模型,采用传统的方法和机器学习方法进行预测和对比分析,包括普通最小二乘回归、LASSO回归、岭回归、时间序列预测方法、神经网络、随机森林和支持向量回归。结果表明,神经网络的预测结果明显优于传统的回归方法和时间序列预测方法,而且也同样优于支持向量回归方法和随机森林方法。此外,在引入集成学习方法进行综合后,各模型的预测精度进一步提升。  相似文献   

3.
利用中国家庭追踪调查(CFPS)数据,并构建logit模型,分析了中国居民家庭收入对住房租购和类别选择的影响。二元logit模型和多元logit模型的回归结果表明:收入对居民家庭住房租购选择和住房类别选择均存在显著影响。其中,与西部相比,东部家庭收入的提高对其买房概率存在更大影响。与此同时,收入的提高会使中西部家庭提高选择更大户型住宅的可能性,而东部家庭则更倾向于大户型住宅。  相似文献   

4.
通过机器学习算法对大学初期的学生学业表现进行预测和可解释性研究。利用One-Hot对离散型变量进行编码,利用Lasso提取和降维特征变量,基于随机森林、XGBoost、朴素贝叶斯和逻辑回归等机器学习算法训练模型,借助SHAP对最优模型(随机森林特征进行解释。研究结果表明,对于不同层次学业表现的学生,影响其学业的因素存在差异。其中,高考成绩(如数学成绩、外语成绩、学生对录取专业或系别的满意度、在校比赛成绩与操行情况对学生学业表现都存在明显的影响。通过倾向性指标信息能够对学生在大学初期的学业表现作出基本判断,并可据此提前关注可能存在学业困难的学生。  相似文献   

5.
森林碳汇在应对气候变化中的重要作用越来越突显。用可计算一般均衡模型(CGE)分析碳汇政策能够为政策的制订提供强有力的依据,构建CGE模型的前提需要构建基于林业部门的社会核算矩阵(SAM)。SAM中的林业产出和投入各账户、林产品供给和需求各账户,以及隐含的相对价格可以用来模拟碳汇政策对林业的影响。基于《2007年中国投入产出表》并结合其他统计数据,编制了基于林业部门的2007年中国社会核算矩阵。该表的特点是对涉及林业的账户进行了核算,对统计年鉴中没有的数据进行了合理的估算。编制的SAM为CGE模型的构建与应用提供了数据基础。  相似文献   

6.
将EM算法引入到朴素贝叶斯分类研究中,提出一种基于EM的朴素贝叶斯分类算法。首先用未缺失的数据属性的算术均数作为初始值,求得极大似然估计;其次迭代执行算法的E步和M步直至收敛,然后完成缺失数据的填补;最后根据朴素贝叶斯分类算法对数据进行分类。实验结果表明,与朴素贝叶斯分类算法相比,基于EM的朴素贝叶斯分类算法具有较高的分类准确率。  相似文献   

7.
为了提高电机轴承故障的识别准确率,提出了基于自适应多尺度散布熵与会议制随机森林算法的轴承故障诊断方法。分析了电机轴承不同故障信号的特征频率,将局部特征尺度分解和散布熵进行结合,提取了故障信号的自适应多尺度散布熵作为特征向量。在故障模式诊断方面,以随机森林算法为基础融入了决策树的参会权重策略,使专家型决策树具有更大的决策权,从而提高了随机森林算法的故障诊断准确率,将此算法命名为会议制随机森林算法。以美国凯斯西储大学的轴承数据为对象进行实验,在不同故障模式的诊断实验中,会议制随机森林算法的识别准确率比传统算法高出了6.68个百分点;在不同故障程度的内圈故障诊断实验中,会议制随机森林算法的识别准确率比传统算法高出了6.28个百分点,比马尔可夫诊断方法高出了7.86个百分点,以上数据验证了故障诊断方法的有效性。  相似文献   

8.
冯莎 《调研世界》2016,(9):42-49
本文利用2013年CGSS调查数据,通过对国内外主观幸福感的文献综述研究,综合考量主观幸福感的影响因素及其特征,主要是收入因素、宏观社会经济变量和个体特征变量,建立了多种模型,通过对全部数据、训练集、测试集等模型比较验证,并利用评价指标综合考虑,得出随机森林在分类模型中对居民主观幸福感进行预测较为合理且准确.根据模型结果,文章从收入因素、收入差距、社会环境等角度提出了相应的建议.  相似文献   

9.
利用中国2011-2018年省份数据,构建面板回归模型和多重中介模型探讨数字经济的减贫效应及影响机理.研究发现:数字经济与农村贫困发生率存在显著负向关系,在考虑城镇化、经济增长等影响贫困因素的基础上,减贫效应依旧显著;数字经济的收入增长效应和收入分配效应显著,即数字经济可通过促进家庭增收和弱化收入差距的渠道影响贫困,但数据资源配置不均带来的数字鸿沟可能会扩大城乡收入差距,加大相对贫困的治理难度.  相似文献   

10.
精准实现大学生贫困认定是实现高校精准扶贫的重要前提,但是因为贫困认定需要提交的材料涉及隐私和数据非客观性原因,当前贫困认定存在部分学生做假和自卑学生不敢申请的不公平现象。针对该问题,以学生一卡通消费数据和个人基本信息等客观数据为基础,构建贫困特征分箱和特征交叉算法,形成一套大学生贫困认定特征参数。随后,为处理贫困认定数据集不平衡性,提出了数据样本和输入属性双重扰动方法,并与核ELM算法融合,构建了大学生贫困认定DP_KELM算法。实验结果表明:构建的特征在随机森林和KELM算法的准确率方面都超过0.82,而双重扰动模式对提高算法的G-mean值有较好作用,DP_KELM算法在Gmean和AUC上均优于对比的9种算法。DP_KELM算法能够有效识别贫困大学生,为实现校园精准扶贫提供辅助决策工具。  相似文献   

11.
分析和建立深井海水工厂化循环水氨氮含量与养殖对象的数量、均重、饲料投喂量之间的非线性关系。利用离差归一化方法对样本数据进行预处理,并利用Bootstrap方法随机有放回采样生成多个训练集;提出一种基于随机森林回归算法的集成式机器学习方法构建预测模型,对养殖水体中的氨氮含量进行预测,并与支持向量机回归和最小二乘线性回归模型进行对比分析。通过5折交叉验证和8折交叉验证实验表明,以均方根误差和平均绝对误差作为评价指标,以绝对均值误差作为评价函数,所提方法的绝对均值误差为0.135 5,与最小二乘线性回归、支持向量机回归方法进行比较,其误差分别减少62.66%和39.85%。所提方法在进行小样本预测应用中具有较高的预测精度及泛化能力,可为海水工厂化循环水养殖水体中氨氮含量精准预测提供理论依据和参数支持。  相似文献   

12.
国家社保基金收入预测的PCA&BP模型   总被引:1,自引:0,他引:1  
采用1989-2005年数据,利用主成分分析(PCA)与BP神经网络算法对我国社保基金收入进行拟合及预测分析.结果表明,与回归模型相比,PCA&BP模型具有更高的预测精度,相对误差为-0.22%.  相似文献   

13.
大数据时代未成年人刑事信息的高速传播及记忆永恒不仅不利于未成年人回归和成长,还有可能侵犯未成年人的隐私权甚至生命权。然而,我国现有法律法规不足以应对这一困境。未成年人及其监护人要求数据控制者删除未成年人刑事信息的被遗忘权高度契合了未成年人最大利益原则并有效填补了制度漏洞,不过该权利也存在理论层面的不完备、对网络服务商等义务主体要求过高、有效责任承担机制缺失等缺陷。实践中可采用双重基准理论对权利价值进行预判,再辅以考究权利行使是否正当合理、是否尊重知情权、是否均衡保护等三元基准范式的指引下,从单列立法保护、明确第三方数据监管、厘清权利边界、优化权利救济形式等四维路径来构建我国未成年人刑事信息被遗忘权体系,以缓解大数据时代带给未成年人的新挑战。  相似文献   

14.
基于2018年陕西省687份农户调查数据,运用有序Logistic回归考察收入质量对农户品牌生鲜肉消费的主效应,采用层次回归分析收入质量各维度间的交互效应以及安全消费意识对"收入质量-品牌生鲜肉消费"的调节效应,采用分组回归检验农户自给对"收入质量-安全消费意识-品牌生鲜肉消费"模型中主要路径的调节效应。结果表明:收入质量中的收入充足性、收入成长性和收入知识性对农户品牌生鲜肉消费存在显著正向影响,收入充足性分别与收入结构性、收入成长性存在显著两两交互效应;安全消费意识对"收入质量-品牌生鲜肉消费"部分路径存在显著调节作用;农户自给对模型中主要路径关系存在显著调节作用。在此基础上提出应优化农户收入质量、强化安全消费意识、采取差异化品牌生鲜肉农村市场推广策略等政策建议。  相似文献   

15.
扶贫对象的精准识别是实现精准扶贫的重要条件。实现贫困数据的精准分类与识别以及贫困识别由定性到定量、由单维瞄准向多维瞄准的转变是精准扶贫的重要基础。精准识别可以采用大数据分析中的分类算法实现。本文基于可持续生计分析框架,从人力资本、社会资本、自然资本、物质资本、金融资本和生计环境六个方面建立了多维贫困指标体系,运用随机森林算法构建了精准识别模型,并采用中国家庭追踪调查数据(CFPS),对扶贫对象精准识别模型的分类及识别效果进行了评价,结果表明模型效果良好。  相似文献   

16.
基于DPSIR模型建立森林生态安全指标体系,采用熵值法和Lotka-Volterra共生模型分别计算指标权重与森林生态安全情况,并通过阻碍度模型测算森林生态安全的主要阻碍因素。结果表明:部分省份森林生态安全状态并不稳定,随时间变化而不断波动;森林生态安全主要受经济发展因素的制约;不同省份在经济条件、森林资源状况等方面存在较大差距,容易导致“环境倾销”现象的产生。基于此,提出构建新型核算体系、转变林业产业发展模式、加强区域内省份合作等建议。  相似文献   

17.
基于我国1978年-2008年的GDP和政府收入的时间序列数据,构建向量自回归(VAR)模型,运用脉冲响应函数和方差分解进行分析,并进行了协整检验和格兰杰因果检验,构建了向量误差修正(VEC)模型对两者的关系进行了深入的研究。实证结果表明,我国GDP和政府收入长期存在均衡关系,短期主要由其滞后两期值决定,并且政府收入对经济增长的效果显著,而经济增长对我国政府收入的增长并不明显。  相似文献   

18.
从舆情分析视角,将多维度舆情信息纳入网络借贷平台风险分析范畴,针对不同类型的舆情信息采用不同文本处理方式,基于实验研究并结合内部平台基础信息指标与外部舆情信息指标,采用神经网络、支持向量机、随机森林和逻辑回归方法构建网络借贷问题平台甄别模型,验证舆情信息指标对甄别模型的性能提升作用.实验结果表明:第一,综合采用平台基础信息、运营信息和舆情信息进行网络借贷问题平台甄别,准确率更高;第二,相较于随机森林模型、支持向量机模型、逻辑回归模型而言,神经网络模型的甄别效果最佳.本研究有助于金融监管部门科学全面地了解网络借贷平台运营状况,并有针对性地开展精准化监管治理工作.  相似文献   

19.
缺失值是调查中普遍存在的问题,利用变量之间的相关关系,可以通过正态线形模型利用不存在缺失值的变量对存在缺失值的变量进行插补。较之单一插补,多重插补更能有效地估计总体方差,因此更多地被使用;特别是采用贝叶斯多重插补,其模型的差数和残差估计均来自相应后验分布的随机抽取,这样对总体方差的估计更为精确。通过大量模拟试验,发现贝叶斯多重插补较之单一插补和一般多重插补能构建更宽的置信区间从而有更准确的总体参数覆盖率,这点在数据缺失比重很大时优势更明显。  相似文献   

20.
基于2013—2022年31个省、市、自治区(不含港澳台)的面板数据,构建SDPD空间动态面板模型和GWR地理加权回归模型,实证研究结果表明,新型城镇化对城乡收入差距的短期效应为正,长期效应为负,整体呈先扩大后缩小特征,并存在短期的空间溢出效应,短期会扩大相邻地区的城乡收入差距;新型城镇化对城乡收入差距的影响存在地区异质性。基于此,各地区应因地制宜推进新型城镇化进程,改善城乡教育投资体制二元结构,促进产业高级化与城乡一体化协同发展,推进劳动力城乡双向流动,缩小城乡收入差距。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号