共查询到20条相似文献,搜索用时 15 毫秒
1.
全球大数据每年以50%的增长速度增加,在我国大数据增长过程中政府数据约占总量的80%,而就目前国内政府数据的利用情况来看,多为简单的数据统计和公开,大量有价值的政府数据被低估或废弃,而现今大数据运用由科学研究进入到商业发展模式,大数据逐渐成为国家战略的重要组成部分,大数据时代的技术变革需要政府加快创新数据的能力,政府通过与企业合作开发政府数据的模式,创造出具有市场价值且可流通的政府数据资源,推动政府数据产业的发展. 相似文献
2.
3.
4.
一、问题提出的背景众数 (Mode)是一组数据中出现次数最多的变量值 ,它通常是作为统计分组整理后数据集中趋势的测度值 ,用M0 表示。众数不仅可以用来测度定类数据的集中趋势 ,而且也可以作为定序数据、数值型数据 (即定距数据和定比数据 )集中趋势的测度值。测度定类数据和定序数据的集中趋势 ,由于它们的变量值均为离散型 ,所以根据定义很容易确定众数。而对数值型数据或定量数据 ,则由于这些数据可能是离散型 ,也可能是连续型 ,所以数值型数据集中趋势的测度就较为复杂。目前 ,在数值型数据集中趋势测度中 ,众数的计算分为两种情况 … 相似文献
5.
6.
三路数据主要包含面板数据、纵向数据和三模数据三种立体数据格式。三路数据在社会科学和自然科学研究中受到越来越广泛的关注和应用。传统的聚类分析理论和方法主要基于两路平面数据而建立,对于三路数据,这些理论和方法则显得无能为力。在对传统的两路数据聚类方法做概要回顾的基础上,对国内外主流的三路数据聚类方法做了简要综述和总结。 相似文献
7.
社会网络分析的研究及应用日益增多.和通常数据相比,社会网络数据存在某些特殊的属性.文章首先论述了社会网络分析的特有方法及视角,然后将网络数据和通常数据进行比较,指出社会网络数据是一种具有关系属性的数据,而且网络数据不是“独立的”,探讨了网络数据的收集与测量尺度方面的有关问题. 相似文献
8.
文章基于2012—2019年中国省级面板数据,利用机器学习异质性因果推断方法——因果森林估计了数据要素对制造业增长的影响效应,同时使用个体处理效应估计考察了数据劳动对数据要素促进制造业增长的非线性调节模式。研究发现,数据要素对中国制造业增长的促进效应显著,同时这一促进效应受到数据劳动的“倒U”型调节作用,即在拥有更大数据劳动规模地区的制造业增长中数据要素投入效应更为明显,但是随着数据劳动规模的持续扩大,数据要素投入效应的增长幅度越来越小。 相似文献
9.
10.
本文认为大数据统计与三个问题有关:大数据发展趋向极限无穷,人类社会数据信息将发生什么变化?大数据发展会不会产生危害社会进步的数据垃圾?大数据即使是一场革命,那么作为数据科学的统计学脱胎换骨地继承与发展是什么?本文对此回答包括,提出大数据发展的统计设计观点,从理论和实践上做出了论证分析,并联系我国实际,探讨了我国大数据发展中的统计设计理论和内容要点。 相似文献
11.
在大数据背景下,大数据对政府统计的理论方法和生产方式必将产生影响.文章介绍了扫描数据的基本内涵,并通过部分国家利用扫描数据编制居民消费价格指数的经验,提出在大数据背景下,我国政府统计利用扫描数据编制居民消费价格指数的几点建议. 相似文献
12.
纵观人类文明史,我们看到“数据”与“信息”是一对孪生兄弟,数据是信息的源泉和载体,而“抽样调查”又是人类获取信息的主要手段之一。我们常把亲自动手得到的数据称作“一手数据”其他人调查获取的数据叫做“二手数据”。在获得“一手数据”、使用“二手数据”过程中,有必要对一些常用术语统一说法,对常见概念达成共识。近些年,祖国宝岛台湾有不少“热闹”场面, 相似文献
13.
正互联网、移动终端、物联网等现代信息技术的迅速发展,促使数据呈几何级数增长,数据无处不在,数据内涵不断延展,大数据逐渐成为影响社会经济发展的重要战略资源。大数据的出现,使数据突破传统范畴,向着更全面、更复杂的方向发展。大数据时代的到来,给政府统计带来巨大机遇和挑战,既有利于补充数据源,提高数据准确性,同时也对政府统计的信息化建设提出了更高的要求。 相似文献
14.
<正>一、引言大数据是指那些大小超出了传统意义的尺度,一般软件工具难以捕捉、存储、管理和分析的数据。它除了包括大量的结构化数据外,还涵盖所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频、视频等信息,即非结构化和半结构化的数据。在大数据科技浪潮的背景下,数字化的行政商业记录、网络在线文本、流媒体数据大大拓宽了统计机构收集数据信息的渠道,作为信息和数据最重要的生产部门——政府统计,已经步入以数据为核心的大数据 相似文献
15.
统计人员经常与数字打交道 ,从数据的收集、审核、整理、汇总到分析、使用 ,几乎工作在数据的海洋之中 ,但不少统计人员在上报统计报表之后 ,就将它锁进了档案柜中 ,不加理会 ,这样就使活数据变成了死数据 ,实在太可惜了。有的统计人员看着密密麻麻的数据 ,觉得无从下手 ,使数据不能发挥其应有作用 ,这是对数据缺乏重要性认识的结果。事实上统计数据有着丰富的内涵 ,具有三大鲜明特性。1 .严肃性。数据的严肃性是指数据的合理性、合法性、真实性和准确性 ,它是数据基本特性。统计人员在对数据进行审查时 ,就要审查它所反映的经济现象的合理… 相似文献
16.
近年来,大数据迅速发展,成为新财富,价值堪比黄金和石油.在大数据时代,各种信息网络平台将会全面覆盖整个社会,不仅使数据产生爆炸性的增长,也会使海量数据实时在线可用,大数据时代的数据更加准确和高质、数据的发布更新更加实时快捷、分析应用更加多样灵活、也更加贴近公众需求. 相似文献
17.
为了提升复杂产品供应链碳足迹评估结果的可靠性,文章构建复杂产品供应链碳足迹三维分析模型明确原始数据采集拣选源.通过原始数据收集、数据信息列表编辑阶段规范数据,在数据分配合并基础上,综合考虑数据获取质量和相关性,设计矩阵表模拟数据概率分布.创建HQMC法量化数据不确定性,改进Spearman系数法分析灵敏性,构建二级象限图辨析需改进关键数据.经电力能源实例验证,该方法可有效评估与控制复杂产品供应链碳足迹的数据质量. 相似文献
18.
文章从投入结构的视角,在各地区投入结构化数据失真程度低于全国投入的结构化数据、各地区投入汇总后的结构化数据和全国投入的结构数据具有较强的匹配性两个基本假设的基础上,选取劳动投入和资本投入两方面的数据,验证了基本假设,并且根据数据之间的关系选择VAR模型,对1978~2010年的中国GDP数据质量进行评估,继而进行指数化。得到基本结论:全国投入的结构化数据与地区投入汇总后的结构化数据有很强的匹配性;我国GDP数据质量整体上是较好的,个别年份不同程度地被低估或者高估;从细化成指数的结果来看,我国GDP的数据质量存在阶段性的特征。 相似文献
19.
在大型的数据集中,通常包含一些数据对象,它们与数据的一般行为或既定模型表现不相一致,这些数据对象被称为异常数据.大部分数据挖掘方法将异常数据视为噪声或异常而丢弃;然而在一些数据探索中,如保险欺诈、信用卡欺诈、违规交易等检验中,罕见的事件可能比正常出现的事件更有意义.因此,在利用原始数据进行挖掘之前,有必要对其进行异常数据的查找和检验. 相似文献
20.
关于调查问卷中定性数据处理方法的探讨 总被引:1,自引:0,他引:1
调查问卷的答案中既有定性数据,又有定量数据.相对于定量数据的分析,定性数据的统计处理是难点.文章以某地区学生升学情况的问卷数据为例,对一些常用的定性数据的分析方法进行了探讨,同时列举了一些SAS的基本程序. 相似文献