共查询到10条相似文献,搜索用时 31 毫秒
1.
中国人民大学“大数据与应用统计”研究组 《统计研究》2015,32(2):3-9
本文集中介绍了多位顶尖统计学家在大数据研究方面的新进展,内容涉及大数据背景下政府统计需求,统计设计,统计学理论框架的重构,统计学利用大数据在基因学、天文学、宇宙学、流行病学、经济金融学、生命科学和工程学等领域中的应用,以及大数据人才培养问题等。 相似文献
2.
基于大数据时代背景,本文探讨了地方统计数据的特点,地方统计部门实施大数据战略的目的和特点,从技术角度研究了地方统计部门为运行大数据而构建的云框架实例,从统计科研角度,就创新大数据处理技术和其他信息技术手段在采集和处理数据中的优秀表现作了简要叙述,从统计大数据人才培养角度,论述了统计人才梯队建设的一些想法。最终,结合了地方统计发展的一些特点,提出地方统计的大数据战略部署和运作方法。 相似文献
3.
4.
5.
6.
大数据具有数据来源差异性、高维性及稀疏性等特点,如何挖掘数据集间的异质性和共同性并降维去噪是大数据分析的目标与挑战之一。整合分析(Integrative Analysis)同时分析多个独立数据集,避免因地域、时间等因素造成的样本差异而引起模型不稳定,是研究大数据差异性的有效方法。它的特点是将每个解释变量在所有数据集中的系数视为一组,通过惩罚函数对系数组进行压缩,研究变量间的关联性并实现降维。本文从同构数据整合分析、异构数据整合分析以及考虑网络结构的整合分析三方面梳理了惩罚整合分析方法的原理、算法和研究现状。统计模拟发现,在弱相关、一般相关和强相关三种情形下, Group Bridge、 Group MCP、Composite MCP都表现良好,其中 Group Bridge的假阳数最低且最稳定。最后,将整合分析用于研究具有来源差异性的新农合家庭医疗支出,以及具有超高维、小样本等大数据典型特征的癌症基因数据,得到了一些有意义的结论。 相似文献
7.
大数据时代世间万物都可以数据化的特征,对传统的统计工作方式、方法产生重大影响。本文在系统分析大数据时代特点和第三次全国经济普查个体经营户抽样调查方法的基础上,结合对常规抽样调查工作方式方法的理解和思考,尝试提出通过银行、物流、行政单位记录以及企业内部的生产经营相关信息构建第三次全国经济普查个体经营户抽样调查数据来源的第二轨,阐述了第二轨数据所具有的采用自然产生的数据发声,避免瞒报、漏报和社会干扰等有利于保证数据质量的优点。重点对构建三经普个体经营户抽样调查数据来源第二轨的实现路径进行了分析,并探讨了推进大数据在统计系统的全面应用需解决的几个问题。 相似文献
8.
数据作为重要的数据资源存在,不论是其内在蕴含的信息价值还是其已经成为人类社会所需数据有机组成的客观事实,都迫使我们去不断加强对大数据的应用。然而,由于大数据作为信息技术应用的副产品,其复杂性、不确定性和涌现性决定了我们应用大数据并非易事,存在着很多质量上的问题,除了具有传统数据所有的质量问题外,还包括一些独特的新问题。为了更好地应用大数据,本文对如何进行大数据应用的质量控制进行了初步的研究。主要内容包括以下三个方面:一是对什么是大数据质量、受哪些因素影响、可能存在哪些质量问题进行了探讨;二是从做好理论准备、建立质量控制方案、重视对小数据研究、加强大数据管理、加强大数据人才培养和加强大数据法制建设六个方面,提出了大数据应用的质量控制的基本想法;三是对大数据应用中需要引起注意的几个方面进行了讨论,并结合例子进行了阐释。 相似文献
9.
本文从作者第一次了解与接触大数据的因由际遇谈起,概要介绍了国内外利用大数据在价格、就业、人口、交通和公共卫生等方面的应用情况;我国政府和政府统计开始关注大数据、利用大数据的现状,并指出在已经来临的大数据时代,我们共同关注、并需要探讨的话题。 相似文献
10.
大数据时代,传统生产型企业如何加强企业自身与周边相关数据信息的统计与分析是一个亟待关注的问题。本文对生产型企业发生的数据现状与特点进行了总结与概括,深入分析了企业统计工作中存在的精细化程度不够、数据实时性不够等问题,并结合生产型企业的特点,从五个方面提出改进措施,希望对企业提升统计分析能力,以数据支撑科学决策提供一定的借鉴价值。 相似文献