首页 | 本学科首页   官方微博 | 高级检索  
     

数据分析中的数据质量识别
引用本文:吴喜之,闫洁. 数据分析中的数据质量识别[J]. 统计与信息论坛, 2006, 21(6): 12-16,27
作者姓名:吴喜之  闫洁
作者单位:中国人民大学,统计学院,北京,100872
基金项目:自然科学基金重点项目(10431010),教育部重点基地重大项目(05JJD910001),中国人民大学应用统计中心资助。
摘    要:
数据的质量直接影响数据分析的效率和分析结果的可靠性。数据质量包括数据结构质量和给定数据结构后的数据真实性、一致性和完整性。在着重考虑拿到数据之后,从单元格、记录、变量三个角度如何识别数据中潜在的质量问题,并以案例为支撑,介绍了各种可能出现的问题。

关 键 词:数据质量  缺失值  异常值  无效记录  无效变量
文章编号:1007-3116(2006)06-0012-06
修稿时间:2006-09-05

The Identification of Data Quality in Data Analysis
WU Xi-zhi,YAN Jie. The Identification of Data Quality in Data Analysis[J]. Statistics & Information Tribune, 2006, 21(6): 12-16,27
Authors:WU Xi-zhi  YAN Jie
Abstract:
Keywords:data quality  missing values  abnormal values  invalid records  invalid variables
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号