首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
文章从统计学的角度介绍了社科研究建模中统计数据的主要来源和数据准备的一些基本方法,无论宏观数据还是微观数据,在建模之前都需要经过充分的准备和初步处理才可以应用。文章认为,样本充足、分布优良和均衡可比的统计数据是成功建模的关键,即好的数据等于建模成功一半。  相似文献   

2.
微观数据发布中的隐私保护问题是近年来微观数据发布研究中的一个热点内容,对微观数据施加匿名处理是微观数据发布过程保护数据主体敏感信息的有效方法之一。文章评述了k-匿名技术的概念、基本思想,对匿名方法相关研究进行了总结,最后指出匿名方法应用于微观数据发布隐私保护的热点研究方向。  相似文献   

3.
 实证研究离不开数据,当前,官方汇总数据日益成为一种公共产品,研究团体和社会公众有很多渠道获取。但是,由于技术、经济、法律、甚至是政治等种种因素的制约,微观统计数据共享和传播渠道缺失,迫使研究团体和个人自己去进行数据收集,造成大量的重复劳动和财力时间的浪费。同时,对于已有微观统计数据的开发不足,降低了数据收集的回报,严重制约了统计能力的提升。本文对微观数据发布的现状进行了中外比较,讨论了微观数据发布的效用与风险,指出最关键的问题是满足日益增长的数据需求和统计泄密风险的矛盾,并且介绍了当前国际上常用的控制泄密风险的方法,并最终结合实际情况对中国的微观数据发布提出相关的建议。  相似文献   

4.
加入CDDS与我国人口就业统计的发展   总被引:1,自引:0,他引:1  
2002年4月15日,国际货币基金组织(IMF)首次以英文公布了中国统计数据文件,标志着中国正式成为IMF“数据公布通用系统”(General Data Dis-semination System,缩写为GDDS)的正式成员。我国加入GDDS是适应经济全球化、金融市场一体化的需要,也是我国进一步改革和扩大对外开放的需要。 一、GDDS的主要要求 (一)统计范围 GDDS将国民经济活动划分为5大经济部门:实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别和指标编制、公布的目标,鼓励以适当的、反  相似文献   

5.
数据是基础性信息资源,对社会和经济的发展有着至关重要的意义。它是国家进行宏观管理和科学决策的依据,是社会公众、国际社会了解中国国情国力、了解数字化中国的主要来源,是满足国民经济和社会信息化建设的基本保障,是满足国家宏观调控的决策需求和全社会微观管理的需求。同时,现代化的处理和应用手段则对于数据的开发和运用起决定性的作用。  相似文献   

6.
《统计与咨询》2002,(1):44-45
GDDS是“数据公布通用系统”(General Data Dis-semination System)的英文简称。它是 IMF(国际货币基金组织)为其成员国的统计体制制订的一个综合框架。IMF通过技术援助帮助GDDS的参加国逐步改进现有统计体制,最终达到与国际接轨。 一、GDDS的主要内容 总体框架主要包括数据特征、公布数据的质量、公布数据的完整性和公众获取四个部分。 1、数据特征 GDDS将国民经济活动划分为五大经济部门:实际部队财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映…  相似文献   

7.
余官胜 《统计研究》2019,36(4):39-49
在微观上探明企业对外直接投资速度的空间特征是理解我国对外直接投资快速增长的重要因素,本文通过匹配《中国工业企业数据库》和《境外投资企业(机构)名录》构建企业对外直接投资速度及其空间关联变量指标进行微观实证研究。研究发现:①企业对外直接投资速度不仅存在直接正向空间关联性,而且存在通过抵消企业低管理效率不利影响的间接正向空间关联性;②企业对外直接投资速度的空间关联性仅存在于邻省之间,并不存在于非邻省之间;③企业对外直接投资速度的邻省空间关联性存在异质性,对发达国家进行投资的企业并不存在这种关联性。研究结果意味着在制定对外直接投资促进政策时应充分考虑空间协调性,发挥空间关联的积极作用。  相似文献   

8.
李文海 《统计研究》2000,17(10):42-45
一、背景统计泄露控制 (StatisticalDisclosureControl)是指统计部门在为社会提供的统计资料中 ,不泄露任一单个个体 (如住户 ,企业等 )的资料。这里有两层意思 ,一层是统计泄露的问题 ,另一层是控制方法的问题 ,两者是密不可分的。世界上有关统计泄露控制的研究已有 2 0多年的历史 ,有专门的人员、项目、机构来从事这个问题的研究。1 统计泄露控制的需求众所周知 ,统计部门对外公布的资料 ,基本上来说有两种 ,即汇总 (综合 )资料和微观资料 (调查单位原始资料 )。事实上 ,原始数据是汇总数据的原材料 ,在计算…  相似文献   

9.
质量功能展开(QFD)提供了以顾客需求驱动的新产品设计架构,以保证产品的设计质量满足顾客的需求.但在确定QFD中相关矩阵和关系矩阵的过程中,目前多采用定性的方法,没有定量数据的支持.文章尝试利用双响应试验设计的方法,将相关矩阵和关系矩阵的确立定量化,通过对试验设计中确定的显著性因子赋值和对响应函数相关系数的分类,解决了QFD中两矩阵的定量化处理问题.  相似文献   

10.
加入GDDS促进我国统计体制改革(下)   总被引:1,自引:0,他引:1  
金玫 《中国统计》2002,(3):10-12
三、GDDS的主要内容 GDDS的主要内容可以从两个方面来看,一是GDDS作为一个公布数据的标准,其总体框架、指标体系是什么,设定的标准有哪些。二是GDDS作为一个公布数据通用系统,要求参加国提供有关描述现行统计数据生产和公布方面的信息和短期、中期的改进计划,因此了解参加国家要提交哪些报表也有助于进一步了解GDDS。 (一)GDDS的总体框架和指标分类 GDDS是IMF为其成员国在经济和金融数据的生产和公布方面制订的一个统整我国的部分分类标准,对一些大的分类再进一步细分,或是增加一些过去没有的分类,如对制造业…  相似文献   

11.
Statistical Agencies manage huge amounts of microdata. The main task of these agencies is to provide a variety of users with general information about for instance the population and the economy. However, in some cases users request additional, more specific information. Many agencies have therefore set up facilities that enable selected users to obtain tailor-made statistical information.A remote access system is an example of such a facility where users can submit queries for statistical information from their own computer. These queries are handled by the statistical agency and the generated, possibly confidentialised, output is returned to the user. This way the agency still keeps control over its own data while the user does not need to make frequent visits to the agency.For some years, the Luxembourg Income Study (LIS) and Luxembourg Employment Study (LES) have made use of an advanced remote access system. At Statistics Netherlands and at other statistical institutes recently the need for a similar system has been expressed. In this article, we discuss the characteristics, limitations and desired properties of a remote access system. We illustrate the discussion by the system used at LIS/LES.  相似文献   

12.
There are no practical and effective mechanisms to share high-dimensional data including sensitive information in various fields like health financial intelligence or socioeconomics without compromising either the utility of the data or exposing private personal or secure organizational information. Excessive scrambling or encoding of the information makes it less useful for modelling or analytical processing. Insufficient preprocessing may compromise sensitive information and introduce a substantial risk for re-identification of individuals by various stratification techniques. To address this problem, we developed a novel statistical obfuscation method (DataSifter) for on-the-fly de-identification of structured and unstructured sensitive high-dimensional data such as clinical data from electronic health records (EHR). DataSifter provides complete administrative control over the balance between risk of data re-identification and preservation of the data information. Simulation results suggest that DataSifter can provide privacy protection while maintaining data utility for different types of outcomes of interest. The application of DataSifter on a large autism dataset provides a realistic demonstration of its promise practical applications.  相似文献   

13.
统计数据失真的动态博弈分析   总被引:3,自引:1,他引:2  
各类统计主体都是利益主体,都有不同全局利益的个体利益。文章从博弈论和统计理论出发,建立了一个新的统计数据生成模型,首次给出了数据提供方报真与统计部门积极查假的充要条件,也提出了更有针对性的政策建议。  相似文献   

14.
When preparing data for public release, information organizations face the challenge of preserving the quality of data while protecting the confidentiality of both data subjects and sensitive data attributes. Without knowing what type of analyses will be conducted by data users, it is often hard to alter data without sacrificing data utility. In this paper, we propose a new approach to mitigate this difficulty, which entails using Bayesian additive regression trees (BART), in connection with existing methods for statistical disclosure limitation, to help preserve data utility while meeting confidentiality requirements. We illustrate the performance of our method through both simulation and a data example. The method works well when the targeted relationship underlying the original data is not weak, and the performance appears to be robust to the intensity of alteration.  相似文献   

15.
周怡等 《统计研究》2014,31(7):58-62
统计信用缺失是影响统计数据失真的重要原因,建立统计信用评级体系是从根本上保障诚信、提高数据质量的最有效的方法。本文运用信息不对称原理和博弈论分析模型对统计信用缺失进行分析,并对统计信用评价体系进行了初步设想。  相似文献   

16.
网上调查的理论与技术初探   总被引:3,自引:0,他引:3       下载免费PDF全文
尹恩山 《统计研究》1999,16(4):35-37
信息传播媒体是人类文明进步的重要标志,从信件到电视、电话,每种新的信息传播媒体的普及运用都会随之产生新的调查方式。新一代信息传播媒体——国际互联网的出现在世纪之交叩响了信息时代的大门,它以光电的速度、多媒体的内容、双向快速的信息交流形式和全球一体化的...  相似文献   

17.
针对统计信息质量评估方法的问题,给出一种基于云理论的统计数据质量评估方法。首先,确定云模型的评价等级语言粒度,对其进行软划分,并根据统计数据质量的评价指标体系从八个维度刻划数据质量评估云模型,利用云模型加权算术平均集成技术构造评价综合云;其次,结合云模型相似性的测度方法,根据综合云与评价等级云模型的相似度判断统计数据质量评估综合云的隶属等级。最后,通过实例表明方法的可行性和有效性,新方法可以作为统计数据质量评估和监管的一个参考。  相似文献   

18.
对某个具体的政府行政职能部门而言,其数据供给和需求常常是不对称的。如何构建一套统计体系,将与其有关的统计数据信息采集、加工、应用、发布通过一个信息系统来实现,以满足其对外的数据供给和对内的数据需求?本文以北京市住建委为例,给出了政府行政职能部门统计体系设计的四个基本步骤:解析行政管理职能,构造统计体系的基本框架,分模块进行具体统计内容设计,落实统计报送周期、数据来源和传输渠道。  相似文献   

19.
This paper presents information theory and statistical analysis as two fundamental conceptual tools for data mining. A data mining technique based on these two conceptual tools consists of three steps. The first step is a statistical approach for discovering data patterns. The second step is an information-theoretic approach for identifying models that encapsulate the statistical behavior of the data patterns. The last step is a probabilistic approach for pattern-based inference that uncovers unknown significant event patterns.  相似文献   

20.
Distributed agent-based simulation is a popular method to realize computational experiment on large-scale artificial society. Meanwhile, the partitioning strategy of the artificial society models among hosts is playing an essential role for simulation engine to offer high execution efficiency as it has great impact on the communication overheads and computational load-balancing during simulation. Aiming at the problem, we firstly analyze the execution and scheduling process of agents during simulation and model it as wide-sense cyclostationary random process. Then, a static statistical partitioning model is proposed to obtain the optimal partitioning strategy with minimum average communication cost and load imbalance factor. To solve the static statistical partitioning model, this paper turns it into a graph-partitioning problem. A statistical movement graph-based partitioning algorithm is then devised which generates task graph model by mining the statistical movement information from initialization data of simulation model. In the experiments, two other popular partitioning methods are used to evaluate the performance of proposed graph-partitioning algorithm. Furthermore, this paper compares the graph-partitioning performance under different task graph model. The results indicate that our proposed statistical movement graph-based static partitioning method outperforms all other methods in reducing the communication overhead while satisfying the load balance constraint.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号