共查询到20条相似文献,搜索用时 0 毫秒
1.
基层统计都知道,年报数据在Excel中填完后,还要手工录入到Sarp软件中.这种手工录入的方法容易出错且比较费力,特别是对于年龄较大的同志更是费劲. 相似文献
2.
一种新的高维数据降维方法 总被引:1,自引:0,他引:1
一、前言现实世界中存在着大量的复杂事物及现象,人们希望揭示隐藏在这些纷繁芜杂的表象下的事物和现象的客观规律。随着信息技术的发展,我们面对的数据越来越复杂,往往具有如下特点:(1)样本点数量巨大;(2)数据收集的频率越来越高;(3)数据内部存在结构化的特征;(4)指标变量众多。例如天气状况,用来描述气象特征的指标非常多,像温度,湿度,气压,风力,降雨量等等,对于每时每刻的天气状况,可以用多变量组成的向量数据细致的表示。大量出现的高维数据不仅提供了极其丰富、详细的信息,而且对数据分析中的变量选择、多元建模带来了挑战:怎 相似文献
3.
此次四川“一套表”改革不仅仅只是针对部分企业进行试点,而是要以国家统计局企业“一套表”试点为契机,搭建全省统一的数据采集处理平台,强力推行所有企事业单位的统计报表联网直报,在宜宾市和眉山市三上企业试点成功的基础上,将改革推广到全省。 相似文献
4.
数据筛选在大数据处理过程中处于至关重要的地位。如何运用合适的数据筛选算法从大量数据中筛选出有价值的数据是目前需要解决的重要问题之一。文章综合利用统计假设检验的方法设计了一种系统的实验组和对照组差异性的数据筛选算法,并利用MATLAB软件实现了该算法。最后将该算法应用于自闭症的基因表达谱数据(23520个基因),分别筛选出了实验组和对照组表达谱差异较大的244个基因作为自闭症相关的基因。通过基因注释,发现目前文献中已知的与自闭症相关的基因FIGF、MED13、NDRG4、POU3F2、USP8等在筛选的244个基因中,表明了该算法的有效性。 相似文献
5.
6.
在大数据背景下,分类型数据与混合型数据开始大量出现,如何更好地计算这类数据的相异性度量成为研究焦点。相比特定属性代表特定类的表达形式,模糊类中心表达形式因为含有更多信息、可计算欧氏距离、能更完善地展示不同样本之间的差异性等优点而得到推广使用。模糊类中心是定和为1的频率向量,这同时也符合成分数据的定义,因此,文章引入成分数据处理方式,提出一种融合α度量的改进K-prototypes算法(α-K-prototypes)。针对α度量的特殊性设定了权重调整系数,让分类型数据距离更具有解释性。在实验对比后发现,α-K-prototypes算法在UCI的7个数据集上均优于K-prototypes、K-centers、Improved-K-prototypes算法。为了更好地在实际中应用,文章给出了一种较优α计算准则,并证明其在统计意义上是显著的。 相似文献
7.
8.
企业一套表在去年年报业已正式实施,联网直报后企业数据直达国家,企业及时做出真实、准确、完整的原始报表就成了最为关键的因素。那么目前企业源头数据的质量怎样,影响基础数据的因素有哪些,县、市、区统计机构在企业一套表的实施过程中又该担负怎样的使命呢? 相似文献
9.
随着统计方法制度改革的逐步深入,更好地满足各级领导、政府和社会的需要,小型抽样调查、重点调查和典型调查在统计工作中的应用越来越多,过去国家统计局下发的针对于经常性调查(定期报表)的数据处理软件就越来越不适应这种形势的需要,各地区要完成这些统计调查的数据处理任务再依靠国家统计局已不现实, 相似文献
10.
基尼系数是测量收入差距的最常用指标,自提出以来学者们演绎出了很多种测算方法,对于离散数据主要有平均差法、几何方法、矩阵法和协方差法等,但这些方法实质上是一致的,只是形式有所不同。文章以上述方法为基础,以分组数据为研究对象,假定各阶层的收入同分布且与总体分布相似,利用“逼近法”来拟合洛伦兹曲线,并在此基础上提出了一种较为简洁的测算基尼系数的方法。对我国部分年份不同群体基尼系数的测算结果表明,所提方法是可行的。 相似文献
11.
文章基于类别数据集合引入质量和特征向量的概念;确定了计算类别型数据的相似度;给出聚类结果清晰度及其变化率的定义;提出一种对质量和特征向量有效聚类类别型数据的算法. 相似文献
12.
在研究一组相关总体的数量特征、总体间数量特征关系和总体间的交互作用时,如果从每一总体中抽取一组截面数据,就形成了一种不同于截面数据、时间序列数据和面板数据的特殊数据类型——双截面数据,虽然现有数据处理方法可以为双截面数据提供“面板化”、“平行化”和方程结构耐抗性检验等处理思路,但鉴于双截面数据的特殊性,每种思路都有不完善的地方,充分挖掘双截面数据所隐含信息的针对性处理方法仍需进一步探索。 相似文献
13.
除了上帝,谁都要使用数据。未来是数据的天下,一切将被量化。在大数据时代,传统的统计学、经济学乃至计算机技术都处于变革期,这也给加工生产统计数据为主要工作的政府统计提供了更大的机遇和舞台。国家统计局大数据技术在政府统计工作中的应用研究课题组从2012年开始进行大数据理论与应用研究。现将有关成果进行提炼和梳理,并陆续在本刊发表,便于读者从中了解大数据给政府统计带来的积极意义和影响。 相似文献
14.
协动性是研究经济波动经验特征的一个重要方面。文章分析了利用相关系数法测度协动性的缺陷,并从两个数据序列之间对应相邻数据变化的同步性特征入手,给出了同步系数的定义及其计算方法,证明其满足相似系数的三条一般公理;对同步系数的取值范围及含义给出了解释和说明。通过举例比较相关系数法和同步系数法在测度序列之间协动性时的不同结果,说明了同步系数法的科学性。 相似文献
15.
提高灰建模数据列光滑度的一种新方法 总被引:1,自引:1,他引:1
本文在对建模数据序列进行一定处理的基础上,提出了经函数cosx变换来提高数据光滑度的方法,理论上证明了这种变换可以有效地提高建模数据列的光滑度,其模型精度优于对数及幂函数变换所建模型的精度;并通过实例表明了该方法的有效性。 相似文献
16.
17.
本文针对信用数据的重要性特点,结合数字证书的签名、加密、认证功能,提出了基于数字签名的信用数据采集、加工、发布机制,通过引入数字签名技术、数字证书认证技术,分别在信用数据的采集、加工、发布的各环节实现了信用数据提供者、加工者、发布者的不可抵赖性、数据真实性的可鉴别性、数据加工过程输入输出的可鉴别性、数据采集加工发布全过程的可审查性,为信用数据的网络销售和信用数据的推广使用提供了安全的、可行的、有效的技术及管理方法. 相似文献
18.
19.
一种测度数据序列同步波动强度的方法及应用 总被引:1,自引:0,他引:1
同步波动强度是衡量数据序列之间波动关系的重要指标之一。文章在分析已有关于波动强度研究的基础上,提出了同步强度系数,并给出了定义和计算方法;分析了该指标的具体取值范围及含义,并发现同步强度系数可以同时反映数据序列之间的方向和数值强度两个方面特征;最后结合实例说明了同步强度系数的使用过程和分析步骤,认为同步强度系数的应用深度可以进一步挖掘。 相似文献
20.
"ePRAS专业报表应用系统"是国家统计局为第一次经济普查开发的新一代统计业务处理软件,集统计制度管理和发布、统计数据采集、处理、上报和接收等功能于一体,被誉为统计数据处理的"新贵".该系统能满足周期性普查数据处理的需要,也适应在统计年月报数据处理和统计分析决策中广泛应用. 相似文献