近日,工业和信息化部教育与考试中心印发了“2019年上半年信息技术水平考试工作安排的通知”,公布了2019年上半年信息技术水平考试科目及考试时间、工作日程安排以及教材目录等。其中,由刘鹏教授主编、清华大学出版社出版的“大数据应用人才培养系列教材”中的《Python语言》、《数据清洗》、《大数据系统运维》三册图书同时入选“2019年上半年信息技术水平考试教材目录”。
全国信息技术水平考试是由工业和信息化部教育与考试中心(全国电子信息应用教育中心)负责具体实施的全国统一考试。该考试是对从事或即将从事信息技术的专业人员技术水平的综合评价,其目的是加快国民经济信息化技术人才的培养,同时为企业合理选拔聘用信息化技术人才提供有效凭证。
本书以WIN10 和Python3.6.5 搭建Python开发基础平台为起点,重点阐述Python语言的基础知识和三个典型的项目实战案例。全书以理论引导、案例驱动、上机实战为理念打造Python语言学习的新模式。具体内容分为两大部分:第一部分以Python编程语言基础知识普及为主,分别介绍了Python3概述、基本语法、流程控制、Python组合数据类型、字符串与正则式、函数、模块、类和对象、异常处理、文件操作;第二部分:以项目实战为核心,以学以致用为导向,以切近生活的案例为依托,分别介绍 Python爬虫项目实战、Python数据可视化项目实战、Python数据分析项目实战。本书以作者十多年的计算机专业课程教学经验及相应的项目实战心得为依托,力争做到以理论知识为基础、以案例实战为手段、以解决问题为根本的初衷。让读者从书中汲取他们所需要的编程知识和实战体验。
本书可作为高等学校尤其是高职院校各专业的Python语言启蒙教材,同时也可作为广大Python语言爱好者自学的参考书。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误。该步骤针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行“清理”,使“脏”数据变为“干净”数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍了Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验和数据错误处理,数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集等;第8章介绍RDBMS的数据清洗方法和数据脱敏处理技术等。
本书系统地讲解了数据清洗理论和实际应用,可以作为培养应用型人才的课程教材,也适用于希望了解数据清洗的广大读者。
本书是大数据应用人才培养系列教材中的一册,讲解了大数据系统运行维护过程中的各个主要阶段及其任务,包括配置管理、系统管理、故障管理、性能管理、安全管理、高可用性管理、应用变更管理、升级管理及服务资源管理,内容全面且翔实,兼具基础理论知识与运维实践经验,特别是重点介绍了大数据系统的运维特点及运维技能,以保障大数据系统的稳定可靠运行,更好地支撑大数据的商业应用价值。
本书具有很强的系统性和实践指导性,可以作为培养应用型人才的课程教材,也同样适合于有意从事IT系统运维工作的广大从业者和爱好者作为参考书。
在大数据行业愈发火热,人才需求不断增加的趋势下,清华大学博士、南京大数据研究院院长刘鹏教授策划编写了这套“大数据应用人才培养系列教材”。除了以上3册图书之外,该套丛书还包括《大数据实践》、《大数据导论》、《数据挖掘基础》、《R语言》、《云计算导论》、《数据标注工程》6册图书。此外,该套丛书还有配套资源,免费提供教学课件PPT,学习以及实验资料等。
本套丛书的讲解侧重于应用,对知识点给出具体的操作,并且有配套的动手实验。内容安排遵循从简单到复杂、从理论到实践的学习过程;同时也遵循系统性和覆盖面宽的原则。本套丛书可以作为培养应用型人才的课程教材,也同样适用于有意从事大数据系统基础工作的IT从业人员作为参考书。
订购图书可前往天猫搜索“清华大学出版社官方旗舰店”店铺: