首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
《统计与信息论坛》2019,(2):121-128
在大数据时代,数据挖掘技术在聚合信息客户端中的应用有利于提高聚合信息企业的运行效率。基于聚合信息企业的实际运营和用户数据,从用户登录行为和文章推荐数据库两个角度,利用机器学习算法,构建用户登录行为预测模型和优秀文章分类模型。研究发现,随机森林和Logistic回归模型在互联网大数据分析中的综合表现最好,在分类预测准确度和运行速度方面明显优于其他模型;用户对平台的使用频率和依赖度是决定其登录行为的最关键因素,且区域用户习惯和年龄显著影响用户的登录决策;文章基本信息和自媒体属性均对优秀文章筛选有显著影响,其中,文章等级、自媒体的产量和自媒体专注度等均与文章质量存在显著的负相关关系;发文类型、是否原创和自媒体领域等分类变量各水平之间都存在显著差异,且均会影响用户对文章的青睐程度。  相似文献   

2.
区域开发政策是各级政府为了落实区域开发战略,推动区域经济增长、促进区域开发、优化资源地域空间配置、协调国家和地方经济关系以及区域之间的分工合作关系而制定的一系列经济政策的总和.在不同的经济阶段与条件下,不同区域的社会福利函数存在着差异,全国社会福利函数也存在着差异,中央政府区域开发政策目标选择也会发生变化.从某种程度上讲,正是因为目标差异的存在,才导致中央政府与地方政府选择不同的区域开发战略与区域开发政策.  相似文献   

3.
CAPM模型广泛应用于经济问题分析和预测,从单因子到多因子、非条件到条件分析,CAPM有助于有效区分条件与非条件CAPM.文章在预期报酬、波动率和协方差都随时间变动的背景下,给出了一只股票的无条件定价误差和因子风险表达,以期理论表达条件与非条件CAPM之间的关系.其结果暗示无条件CAPM和条件CAPM定价误差的差别可能导致实证检验中拒绝无条件CAPM而接受条件CAPM.  相似文献   

4.
经典的随机前沿模型忽略了决策单元之间的空间关联性,无法准确估计效率影响因素相关参数,限制了其适用范围。本文在空间自回归随机前沿模型的基础上,引入效率影响因素,构建出一个异质性空间随机前沿模型,基于极大似然估计法给出模型参数的单步估计策略,提出决策单元技术效率的最优预测量。理论分析证明,模型参数在一定的假设条件下具备一致性;模拟实验表明,参数估计量和技术效率预测量较之经典模型具有更高的估计精度,且会随着样本量的扩大而逐渐提升。本文使用所提出理论方法讨论了我国城市数字普惠金融发展与技术效率水平之间的相关关系,发现两者之间存在显著的正相关关系,同时也印证了模型设定和估计方法的可靠性。  相似文献   

5.
廖颖林 《统计教育》2009,(12):16-23
本文利用某电信企业的数据,采用了多种统计分析方法,深入探讨了我国企业中顾客满意度对顾客忠诚度的作用机制,不仅探讨了不同满意程度顾客之间,而且还研究了相似满意程度的顾客内部,顾客满意度对顾客忠诚度的作用大小和作用关系是否存在差异。本文的主要结论如下:(1)顾客满意度的分类和顾客忠诚度的分类之间存在着对应关系。(2)顾客满意度对顾客忠诚度的作用机制并非线性关系。在不满意顾客与满意顾客以及满意顾客与非常满意顾客之间存在闽值;(3)相似满意程度的顾客内部,顾客满意度对顾客忠诚度的作用关系可能唯一,也可能存在差异。非常满意顾客当其同时又是忠诚顾客时,顾客满意度才对顾客忠诚度呈现出显著的线性作用,否则,如果是不忠诚顾客或者潜在忠诚顾客时,这种作用关系仍然不显著。  相似文献   

6.
朴素贝叶斯是一种处理分类问题的常用方法,但它的属性条件独立性假设在实际应用中难以成立,导致其分类性能降低。针对这一问题,文章提出了基于改进PCA的朴素贝叶斯分类算法,该算法通过Pearson和Kendall系数计算出属性间的相关性大小,基于主成分分析筛选出新的属性集,使其尽量满足条件独立性假设,并对新数据集进行朴素贝叶斯分类。实验结果表明,该方法有效地提高了分类准确率。  相似文献   

7.
文章在Parss(i)an(2004)和Debabrata(2010)数据质量评估模型的基础上,根据“不正确、不完整、非成员”三种错误类型来研究数据质量评估.考察了属性分布函数,建立了单一标志属性下的数据质量指标之间的关系模型,且每一属性具有不同的正确率.为了验证模型的效果,进一步用模拟方法构造了一个关系表,与Debabrata模型进行对比分析.结果表明,文章完善了属性值的概率分布函数,修正了Debabrata模型的假设条件,因而得到了一个更加完善的数据质量评估模型.  相似文献   

8.
缺失数据是影响调查问卷数据质量的重要因素,对调查问卷中的缺失值进行插补可以显著提高调查数据的质量。调查问卷的数据类型多以分类型数据为主,数据挖掘技术中的分类算法是处理属性分类问题的常用方法,随机森林模型是众多分类算法中精度较高的方法之一。将随机森林模型引入调查问卷缺失数据的插补研究中,提出了基于随机森林模型的分类数据缺失值插补方法,并根据不同的缺失模式探讨了相应的插补步骤。通过与其它方法的实证模拟比较,表明随机森林插补法得到的插补值准确度更优、可信度更高。  相似文献   

9.
彭寿康 《统计研究》2002,2(11):24-27
一、引言Logistic回归模型是对二分类因变量 (因变量y只取两个值 )进行回归分析时经常使用的统计分析方法。与线性回归不同 ,Logistic回归是一种非线性模型 ,因而普遍采用的参数估计方法是最大似然估计法。可以证明 ,在随机样本条件下 ,Logistic模型的最大似然估计具有一致性、渐进有效性和渐进正态性。然而在有些问题的研究中 ,样本抽取并不完全是随机的 ,而是采用分层抽样方法 ,首先将研究总体按属性特征分类 ,然后在各类中随机抽取样本 ,这就需要考虑分层抽样条件下Logistic模型的参数估计问题。对分层…  相似文献   

10.
文章基于我国国债利率期限结构数据,考察广义Vasicek模型在状态因子相关和状态因子不相关两种假设下实证表现的差异性,以此说明状态因子相关性对仿射利率期限结构模型构建的重要意义。结果发现:水平因子和斜率因子客观上存在很强的负相关性;将状态因子误设为不相关,虽不会显著降低模型拟合能力,但会导致关键参数估计值的严重偏误。因此,模型构建的合理性不能仅通过拟合效果评判,应用仿射利率期限结构模型进行实证研究时,客观描述状态因子相关性是必要的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号