首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
记录链接的技术问题与统计理论密切相关,尤其是在建立记录链接分类规则时需要构建统计模型,识别关键变量以完成数据匹配。在贝叶斯框架下构建分层模型整合行政记录,通过多元回归可以实现匹配错误率的估计,而且一对一限制下的记录链接允许通过模块反映记录信息的来源变化,基于MCMC模拟的后验分布计算方便,有助于提高数据整合效率。  相似文献   

2.
中部六省地级市区金融发展与经济增长的空间面板分析   总被引:4,自引:2,他引:2  
面板数据模型从基本形式拓展到空间面板数据模型,体现了时空特征整合的经济计量建模发展方向.从数据生成过程的时空依赖特征来看,结合传统的统计模型、空间统计模型与空间面板数据模型能够挖掘更加全面的数据信息,揭示经济金融活动的空间自相关性与空间集群性.基于地级市区数据的空间统计与计量经济分析结果表明:中部六省的金融发展与经济增长的空间依赖关系是统计显著的,并为深入进行整合时空特征的区域金融与经济增长关系的统计与计量建模分析提供了有利的证据支持.  相似文献   

3.
林存洁  李扬 《统计研究》2016,33(11):109-112
在大数据时代,传统的统计学是否还有用武之地成为很多人的争议。本文以ARGO模型为案例,介绍了统计方法在大数据分析中的应用和取得的成果,并从统计学的角度出发,提出改进的措施与方法。通过ARGO模型的分析结果发现,大数据分析的很多根本性问题仍然是统计问题,而数据中的统计规律仍然是数据分析要挖掘的最大价值,这也意味着统计思想在大数据分析中只能越来越重要。而对于结构复杂、来源多样的大数据来说,统计学方法也需要新的探索和尝试,这将是统计学所面临的机遇和挑战。  相似文献   

4.
徐蔼婷  杨玉香 《统计研究》2015,32(11):88-96
开展基于行政记录的人口普查被视为有效破解传统人口普查难题的途径之一,亦是顺应大数据时代充分挖掘人口行政记录资源的必然之选。本文较系统地阐述了基于行政记录人口普查方法的基本框架,尝试对“完全模式”人口普查和“组合模式”人口普查的实施步骤进行解析。基于此,本文选择芬兰、奥地利、瑞士、荷兰四个国家,分普查基本情况、行政记录类型选择和基本记录库形成、已存在统计记录系统基本结构、专门组织的抽样调查设计、不同系统间的链接途径、新人口统计信息质量评估方法等六个维度,对实施基于行政记录的人口普查方法进行了国家比较。  相似文献   

5.
金勇进  刘展 《统计研究》2016,33(3):11-17
利用大数据进行抽样,很多情况下抽样框的构造比较困难,使得抽取的样本属于非概率样本,难以将传统的抽样推断理论应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,以基于样本匹配的样本选择为例探讨了具体解决方法。  相似文献   

6.
在实际应用中,一个数据库系统的数据基本模式(物理模式,概念模式,用户模式)往往是相对不变的,而数据统计模式却可能是经常变化的,这是因为面对变化中的市场,变化中的管理方式和变化中的组织结构,企业决策人员可能经常需要新的某种统计结果,要求应用系统能够快速提供出来.对于已经投入运行的应用系统来说,这往往就意味着要开发新的统计功能.如果有一个能够快速反应的工具,无疑具有重要意义.但是,有关的文献中更多地关注数据的基本模型设计,缺少对统计数据模型设计的论述.这要解决好两个问题:如何定义统计模式和如何生成统计.对第一个问题我们设计了统计数据定义语言S-DDL,对第二个问题通过生成程序代码方式解决.本文介绍了我们对统计数据模式化的研究和统计数据定义语言S-DDL.  相似文献   

7.
由广东省统计局主办的“广东统计信息网”最近经过改版 ,已于 6月 2 5日在省政府大院网链接开通。随后 ,广东统计信息网将链接社会公众网开通。改版后的广东统计信息网页信息丰富 ,查询方便。主要栏目有 :1.统计数据 (定期数据 ,年度数据 ) ;2 .决策咨询 (统计报告、统计分析 ) ;3.新闻报道 (统计新闻、统计信息 ) ;4.统计法规 ;5 .制度方法 (调查制度、调查方法、统计分类、指标计算、指标解释 ) ;6 .教育科研 (统计教育、统计科研 ) ;7.统计工作职能 ;8.统计工作动态 ;9.为您服务等。广东统计信息网改版链接开通@冯位东…  相似文献   

8.
在大数据背景下,大数据对政府统计的理论方法和生产方式必将产生影响.文章介绍了扫描数据的基本内涵,并通过部分国家利用扫描数据编制居民消费价格指数的经验,提出在大数据背景下,我国政府统计利用扫描数据编制居民消费价格指数的几点建议.  相似文献   

9.
陆婷 《中国统计》2023,(1):71-74
<正>近年来,大数据引领的新一轮科技革命正向纵深推进,扎实推进统计现代化改革,加快构建现代化统计调查体系,是以习近平同志为核心的党中央对新时代统计事业发展的顶层设计和系统谋划。“十四五”时期统计现代化改革规划指出,推进部门行政记录在住户抽样调查中的应用工作,加强低收入群体、中等收入群体研究测算,探索建立共同富裕统计监测体系。运用大数据和部门行政记录,是对新时代住户调查工作提出的新要求,也是新时代背景下住户调查发展变革的必经之路。  相似文献   

10.
从信息生产角度考查,政府统计如何提高数据的生产、传递效率,是一项人们较少研究的课题.文章从生产管理角度出发,以政府统计网络存在的问题为切入点,认为应当以技术领域为核心结合制度领域和管理领域对统计信息系统进行整合,提出了以数据整合管理为目标的统计网络流程再造.  相似文献   

11.
大数据具有数据来源差异性、高维性及稀疏性等特点,如何挖掘数据集间的异质性和共同性并降维去噪是大数据分析的目标与挑战之一。整合分析(Integrative Analysis)同时分析多个独立数据集,避免因地域、时间等因素造成的样本差异而引起模型不稳定,是研究大数据差异性的有效方法。它的特点是将每个解释变量在所有数据集中的系数视为一组,通过惩罚函数对系数组进行压缩,研究变量间的关联性并实现降维。本文从同构数据整合分析、异构数据整合分析以及考虑网络结构的整合分析三方面梳理了惩罚整合分析方法的原理、算法和研究现状。统计模拟发现,在弱相关、一般相关和强相关三种情形下, Group Bridge、 Group MCP、Composite MCP都表现良好,其中 Group Bridge的假阳数最低且最稳定。最后,将整合分析用于研究具有来源差异性的新农合家庭医疗支出,以及具有超高维、小样本等大数据典型特征的癌症基因数据,得到了一些有意义的结论。  相似文献   

12.
小微企业由于信息严重不对称导致融资难、融资贵、贷款难等问题,基于大数据来源之一的互联网社交媒体的小微企业信息采集是获取小微企业信息数据的重要途径.文章面对爆发式增长的互联网信息资源,利用主题聚焦网络爬虫技术、数据库技术、Java技术等设计并实现由基于链接结构分析的链接地址URL筛选及采集、基于模板节点匹配的网页正文信息抽取、数据入库三个功能模块组成的小微企业统计信息自动采集系统,采集到的数据以结构化数据的形式存储到MySQL数据库中,为后续数据挖掘与分析提供良好的数据支持.结果表明,文章所提出的信息自动采集系统采集效率较高,能够适应小微企业统计信息采集的需求.  相似文献   

13.
本文研究了线性、非线性与广义线性回归模型之间的关系,澄清了一些重要的统计概念,并对广义线性模型作了简要介绍。广义线性模型是当前统计科学发展的一个方向,统计研究与应用的许多高、新领域都在很大程度上以广义线性模型为其理论基础。将其介绍给我国广大读者对于促进我国统计事业的发展,建设大统计学科有重要意义。  相似文献   

14.
在大数据时代背景下,如何应用大数据提高统计水平已成为统计部门的重要课题.本文以浦东新区为例,对应用大数据建立就业形势监测预警体系进行了初步探索,并探讨了监测预警体系的具体应用方案.  相似文献   

15.
曹春雨 《山西统计》2003,(12):30-30
一、践行“三个代表”重要思想,必须提升统计信息化建设水平,促进统计工作的现代化加快统计信息化建设,主要围绕三个层面进行:①统计信息化建设要围绕统计业务来开展。在已形成的数据库基本框架基础上进行整合提升,使数据管理与统计工作流程实行动态链接;建立统计电子业务平台,要以数据仓库技术为指导,进行数据库结构设计,集综合数据与基层数据、综合数据与专业数据、年度数据与进度数据、企业名录库与项目数据为一体的覆盖广泛的数据库体系,它具有实现各种统计报表的设计、自动生成和管理的功能;统计网络要为统计数据采集、传输、处理、贮…  相似文献   

16.
无回答在大数据应用中频繁发生。通常,实际数据的无回答率较低,在这样的情况下,采用倾向得分模型对无回答单元与回答单元进行匹配,易导致倾向得分匹配插补法的插补效果显著下降。为此,将合成少数类过采样算法的思想融入到倾向得分匹配插补法中,提出基于少数类过采样的倾向得分匹配插补法。利用统计模拟与实证研究,在不同无回答率、插补重数和误差分布情形下,演示新插补法的统计性质和应用效果。统计模拟显示,新插补法具有明显高于倾向得分匹配插补法的精度,统计性质受无回答率、插补重数和误差分布的影响小。实证结果显示,新插补法在实际数据中具有较好的应用性。基于少数类过采样的倾向得分匹配插补法提供了处理无回答问题的新思路,并具有较好的扩展性。  相似文献   

17.
本文集中介绍了多位顶尖统计学家在大数据研究方面的新进展,内容涉及大数据背景下政府统计需求,统计设计,统计学理论框架的重构,统计学利用大数据在基因学、天文学、宇宙学、流行病学、经济金融学、生命科学和工程学等领域中的应用,以及大数据人才培养问题等。  相似文献   

18.
<正>统计量化测度和统计模型是统计学的核心,从统计学诞生之日起,其生命力就在于能够对现实进行量化测度和用统计模型分析实际问题。没有量化测度,经济统计学就不会相对独立于经济学。没有模型应用,数理统计学就还是数学,就不会从数学中分离出来。目前社会已经发展到网络和大数据时代,传统和现代的统计模型无论在方法上还是在应用中都已经受到了挑战。  相似文献   

19.
生物统计学是以解决生物学、医学、公共卫生学、农学等领域科学问题为目标的应用型学科,近年来在精准医疗的背景下得以快速发展.另一方面,生物统计研究面对的数据存在海量化、复杂化和异质化的大数据特征,对理论与应用研究者都提出了新的挑战.本文围绕生物统计研究中的流行病学研究、临床试验设计、生存数据分析和基因数据分析展开讨论,在介绍基本思路的基础上对最新挑战及前沿发展方向进行展望.  相似文献   

20.
随着信息技术与产业的快速发展,人类开始进入大数据时代.现如今,人们生活所涉及的各个领域都会有大数据的出现.大数据具有四大特征[1]:一是数据的容量巨大,数量级已从TB级别达到了PB级别;二是数据类型多样化,地理位置信息逐渐增多,逐步取代普通的图片、文字、视频,类型越来越多样化;三是价值密度降低,在连续事件发生的过程中,可以使用的数据有可能只会出现一两秒的时间:四是处理数据的速度加快,某些应用的意义将会通过实时地分析与预测得以阐述. 我们可以将大数据时代定义为通过现代网络渠道收集广泛大量的数据资源,对数据存储“价值提炼”智能处理和展示的信息时代[1].然而,大数据的前提和基础是统计.目前主流的统计软件无法在适宜的时间段内对人们生活中产生的巨大数据量进行抓获,并及时进行分析整理,挖掘出对人们决策有用的信息.未来统计制度与方法的发展方向也必然全面应用大数据思维,顺应大数据发展的趋势,这必将为统计制度及方法带来一些变革.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号