注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库数据清洗基础与实践

数据清洗基础与实践

数据清洗基础与实践

定 价:¥22.00

作 者: 谢东亮 著
出版社: 西安电子科技大学出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787560654607 出版时间: 2019-09-01 包装: 平装
开本: 16开 页数: 字数:  

内容简介

  数据清洗是大数据开发的基础环节,也是重要的环节之一。数据清洗就是发现并纠正数据源中存在的错误,对错误值、异常值、缺失值等可疑数据按照一定的规则和方法,使用必要的工具进行清洗与整理,使其变得干净,达到可以进行数据分析的目的。 本书分为两篇,共九章,系统地讲解了数据清洗的理论与实践。第一篇为基础篇,其中第一章介绍数据清洗的基本概念、数据标准化以及数据仓库的概念等;第二章介绍数据格式类型与数据编码,从文件以及文本的格式、文档的归档与压缩、字符编码与数据转换方面做了介绍;第三章对常用的文本与电子表格数据清洗做了介绍;第四章介绍了数据清洗的基本技术、方法与工具;第五章从文本、Web文件、数据库数据的抽取方面做了介绍;第六章介绍了数据的转换与加载和数据的质量评估。第二篇为实战篇,其中第七章介绍了五种常用的数据清洗工具;第八章专门讲解了如何对Web的数据进行采集及预处理;第九章介绍了从RDBMS数据源中获取数据及进行数据的脱敏、清洗等操作。 本书可作为应用型本科及高职高专学生的大数据课程教材,也可供学习数据清洗的其他读者使用。

作者简介

暂缺《数据清洗基础与实践》作者简介

图书目录

暂缺《数据清洗基础与实践》目录

本目录推荐