首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
国内P2P网贷平台存在的问题及风险令人触目惊心,本研究旨在探索P2P网络借贷这一重要新经济业态的风险甄别问题.本文在我国444家P2P平台基本信息与交易信息基础上,通过网络爬虫获取了30万余条网民评论和新闻数据,利用文本挖掘技术提取了重要的外部信息,综合使用11种统计模型评估变量的重要性并讨论其经济意义.研究表明:①平台风险与基本信息、交易信息和外部信息间存在复杂的非线性关系,SVM、树类模型等非线性模型对预判P2P平台风险更加有效;②网民评论、关注度等基于互联网的非结构化信息,以及平均利率波动、资金净流入波动、未来待还金额波动等信息对甄别风险具有重要的作用;③根据拍拍贷的案例,小额、超短期、男性借款人具有更高的违约风险;④基于线性模式的传统风险指数构建方法并不适用于甄别P2P平台风险.有关部门应从完善法律法规、加大信息披露力度、发布风险预警综合指数等对P2P行业进行监管.  相似文献   

2.
刘展等 《统计研究》2021,38(11):130-140
随着大数据与互联网技术的迅猛发展,网络调查的应用越来越广泛。本文提出网络调查样本的随机森林倾向得分模型推断方法,通过构建若干棵分类决策树组成随机森林,对网络调查样本单元的倾向得分进行估计,从而实现对总体的推断。模拟分析和实证研究结果表明:基于随机森林倾向得分模型的总体均值估计的相对偏差、方差与均方误差均比基于Logistic倾向得分模型的总体均值估计的相对偏差、方差与均方误差小,提出的方法估计效果更好。  相似文献   

3.
非平衡数据集的改进SMOTE再抽样算法   总被引:1,自引:0,他引:1       下载免费PDF全文
薛薇 《统计研究》2012,29(6):95-98
非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想。改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地选择近邻并采用不同策略合成样本。实验表明,分类器在经此算法处理后的非平衡数据集的正负两类上,均可获得较理想的分类效果。  相似文献   

4.
毛笠 《统计与决策》2017,(8):169-172
文章选取Prosper的公开数据,借鉴赫芬达尔-赫希曼指数,设计投资集中度指标,对投资标交易成功率和投资集中度关系进行研究.探究在信息不对称的情况下,羊群行为发生时关注的具体信息.控制相关变量后发现,投资集中度和投资标的成功率之间保持正相关的关系,并且投资集中度的影响随着投资积累程度的上升而减弱.  相似文献   

5.
通过互联网以及社交平台的数据监测社会突发异常事件是当前社交网络传播研究的热点问题,本文基于大数据背景,对网络突发事件动态监测算法进行了创新性研究.论文首先介绍了常用的几种网络动态监测算法,并指出了其在社交网络中应用的局限性,提出了基于Kleinberg的改进算法,最后用改进的算法进行了实证研究,研究结果显示:改进后的算法通过给定合理的调节参数,能迅速准确地监测到网络异常状况的发生,从而不仅避免了传统主观上直接通过突发事件出现的频次来划定临界值的不科学性和直接使用微博量排行榜方式所产生的时间上的滞后性,也避免了直接通过划定一个固定的微博增加量来判断是否有异常事件发生的不合理性.本文在大数据背景下为网络突变事件的动态监测提供了新的研究方法,为政府加强网络安全建设、优化网络监管模式、净化互联网环境具有一定的实践指导意义.  相似文献   

6.
文章基于平台异质性视角构建交易活跃度影响因素模型,并对2014年1月至2015年12月38家P2P网贷平台的月度面板数据进行实证检验.结果表明:平台关注度增加可以显著提高交易活跃度;平台风险水平对交易活跃度影响不明显;资金需求方相对于供给方具有更强的议价能力,且平台项目整体偏好流动性.P2P网贷平台企业寻求良性发展,应当侧重于平台关注度的提高和优质资产端的寻求,平台风险管控需内部治理和外部监督兼修.  相似文献   

7.
贺建风  李宏煜 《统计研究》2021,38(4):131-144
数字经济时代,社交网络作为数字化平台经济的重要载体,受到了国内外学者的广泛关注。大数据背景下,社交网络的商业应用价值巨大,但由于其网络规模空前庞大,传统的网络分析方法 因计算成本过高而不再适用。而通过网络抽样算法获取样本网络,再推断整体网络,可节约计算资源, 因此抽样算法的好坏将直接影响社交网络分析结论的准确性。现有社交网络抽样算法存在忽略网络内部拓扑结构、容易陷入局部网络、抽样效率过低等缺陷。为了弥补现有社交网络抽样算法的缺陷,本文结合大数据社交网络的社区特征,提出了一种聚类随机游走抽样算法。该方法首先使用社区聚类算法将原始网络节点进行社区划分,得到多个社区网络,然后分别对每个社区进行随机游走抽样获取样本网 络。数值模拟和案例应用的结果均表明,聚类随机游走抽样算法克服了传统网络抽样算法的缺点,能够在降低网络规模的同时较好地保留原始网络的结构特征。此外,该抽样算法还可以并行运算,有效提升抽样效率,对于大数据背景下大规模社交网络的抽样实践具有重大现实意义。  相似文献   

8.
随着大数据和网络的不断发展,网络调查越来越广泛,大部分网络调查样本属于非概率样本,难以采用传统的抽样推断理论进行推断,如何解决网络调查样本的推断问题是大数据背景下网络调查发展的迫切需求。本文首次从建模的角度提出了解决该问题的基本思路:一是入样概率的建模推断,可以考虑构建基于机器学习与变量选择的倾向得分模型来估计入样概率推断总体;二是目标变量的建模推断,可以考虑直接对目标变量建立参数、非参数或半参数超总体模型进行估计;三是入样概率与目标变量的双重建模推断,可以考虑进行倾向得分模型与超总体模型的加权估计与混合推断。最后,以基于广义Boosted模型的入样概率建模推断为例演示了具体解决方法。  相似文献   

9.
张宸  韩夏 《统计与决策》2017,(14):45-48
当前网络舆情信息存在数据量大、流动快及数据非结构化等特点,难以实现对其快速、准确的分类.SVM算法和朴素贝叶斯算法都是性能优秀的传统分类算法,但无法满足快速处理海量数据.文章利用Hadoop平台可并行处理分布式数据存储的优良特性,提出了HSVM_WNB分类算法,将采集的舆情文档依照HDFS架构进行本地化存储,并通过MapReduce进程完成并行分类处理.最后利用实验验证,本算法能够有效提升网络舆情分类能力与分类效率.  相似文献   

10.
文章利用2011年2月至2015年9月阿里巴巴研究院公布的网络零售价格(ASPI)指数及其各分类商品价格指数与国家统计局公布的CPI历史数据分别作为线上、线下一般商品价格变动的代理变量,在协整检验的基础上采用向量误差修正模型对线上、线下商品价格变动的关联关系进行了定量分析,并对构成ASPI的各分项商品价格指数与CPI之间的关系进行了分析.研究表明:在误差修正机制的作用下,线上、线下商品价格之间存在稳定均衡的关系.  相似文献   

11.
函数数据挖掘及其在中国消费函数分析中的应用   总被引:1,自引:0,他引:1  
以数据挖掘的思想,提出了利用Bemstein基构建一般函数数据的方法。在此基础上,根据中国31个省(自治区、直辖市)城镇居民的人均年收入和消费性支出的数据,构建了消费函数数据,并进行误差分析,求出消费函数的一阶和二阶导数,进一步挖掘消费函数的发展速率,取得良好的效果。  相似文献   

12.
从投资环境的稳定性、资本流动的合理性及金融市场的有效性三个层次构建三角模型,考察中国对哈萨克斯坦资本流动可能存在的风险问题。研究结果认为:中国对哈萨克斯坦资本流动的整体风险容易受到国际环境及哈萨克斯坦内部环境变化的影响,2008年以后整体风险开始上升。采用GM(1,1)模型对2015—2020年资本流动的风险状态进行预测,结果显示:未来几年中国对哈萨克斯坦资本流动的风险状态主要处于弱安全区,哈萨克斯坦的投资环境、资本流动结构、金融市场稳定性均存在不同程度的恶化,存在较大的资本流动风险。  相似文献   

13.
In prediction problems both response and covariates may have high correlation with a second group of influential regressors, that can be considered as background variables. An important challenge is to perform variable selection and importance assessment among the covariates in the presence of these variables. A clinical example is the prediction of the lean body mass (response) from bioimpedance (covariates), where anthropometric measures play the role of background variables. We introduce a reduced dataset in which the variables are defined as the residuals with respect to the background, and perform variable selection and importance assessment both in linear and random forest models. Using a clinical dataset of multi-frequency bioimpedance, we show the effectiveness of this method to select the most relevant predictors of the lean body mass beyond anthropometry.  相似文献   

14.
利用中国2001-2011年的省际面板数据资料,通过联立方程模型研究中国现行养老保险制度降低缴费率的经济增长效应,研究发现,中国实际上仍为现收现付模式的城镇社会养老保险制度,缴费率变化对个人储蓄率产生显著为负的影响,对居民对子女的教育投资比重的影响为正,但不显著,而个人储蓄率和居民对子女的教育投资比重对经济增长的影响都显著为正。当前养老保险制度通过降低缴费率对经济增长的净效应为负,降低缴费率有利于经济增长。  相似文献   

15.
刘洪  黄燕 《统计研究》2007,24(8):17-21
 本文采用组合模型的形式对时间序列数据的变化特点建模,在模型通过各种检验、具有良好统计预测功能的基础上,从检验异常值的角度来分析预测值与实际值之间差异的程度,找出离群数据,利用数理统计中检验实验观测数据异常值的方法,对离群数据的误差进行统计上的显著检验,从而评估统计数据的质量。文章以我国国内生产总值(GDP)为研究对象,选取我国1978-2003年间的GDP作为样本,运用趋势模拟评估法来评估我国2004年国内生产总值的准确性。对我国经济指标的时间序列数据进行了实证分析。  相似文献   

16.
利用从烟台市某商业银行调研得到的微观数据样本,实证研究中国个人住房抵押贷款提前偿付的影响因素。结果发现:借款人年龄越大、学历越高,提前偿还贷款的概率越大;贷款数额越大、贷款期限越长,借款人提前偿付的概率越大;首付比率高的借款人提前偿付概率较高;外地人比当地人更具有提前偿付的可能性;借款人的债龄越长,提前偿付的可能性越大;借款人的性别、婚否、家庭人口数量、工作行业和月还款额占家庭收入比率等因素对提前偿付的影响不显著。  相似文献   

17.
魏锋  曹中 《统计研究》2007,24(2):44-46
 摘  要:本文运用面板单位根检验、协整检验以及误差修正模型等现代计量经济学方法,对我国东部地区、中部地区和西部地区的服务业与经济增长的关系进行实证研究 。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号