数据分析专业书籍 大数据分析与数据挖掘书籍

35白皮书 2023-01-15

学习大数据不是一蹴而就的。即使是工作多年的开发工程师也需要不断补充新的知识。目前学习大数据知识可以通过视频和书籍来学习。视频的好处是可以把老师的个人发展经验传授给学习者而书籍的好处是可以随时浏览内容丰富。

下面是零基础学习大数据的10本经典书籍。希望同学们通过不同的学习方式全面掌握大数据开发技能。

大数据学习推荐的10本经典书籍

1、大数据时代

《大数据时代》是国外大数据系统研究的第一部作品。本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用之一”。他有在哈佛大学、牛津大学、耶鲁大学、新加坡国立大学等多个互联网研究中心任教的经验。早在2010年他就在《经济学人》上发表了一篇长达14页的关于大数据应用的前瞻性研究。大数据时代认为大数据的核心是预测。大数据将为人类生活创造前所未有的可量化维度。该书展示了谷歌、微软、IBM、苹果、facebook、twitter和VISA等大数据先行者的宝贵应用案例。围绕“不要采样万物不要效率准确不要相关性因果”三大理念作者通过数十个商业和学术案例分析了数据挖掘和数据复用万物的巨大价值。

2、《理解大数据的书》

进入大数据时代让数据说话将是我们公司空常见的事情。本书将从大数据时代的前因后果入手全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇与挑战等。并展现一个客观、立体、自由、开放的大数据时代。

3。Hadoop权威指南

Hadoop是大数据技术的核心内容之一。这本书内容丰富展示了如何使用Hadoop构建一个可靠的、可扩展的分布式系统。程序员可以探索如何分析海量数据集管理员可以学习如何设置和运行Hadoop集群。

4、Hive编程指南

Hive是基于Hadoop的数据仓库工具。ApacheHive的编程指南旨在介绍如何使用Hive的SQL方法。通过大量的实例首先介绍了如何在用户环境下安装和配置Hive并详细阐述了Hadoop和MapReduce演示Hive如何在Hadoop生态系统中工作。

5。HBase的权威指南

HBase是一个分布式面向列的开源数据库。如何利用与HBase高度集成的Hadoop使HBase的扩展性变得简单;将大型数据集分发到相对便宜的商业服务器集群;了解HBase架构的细节包括存储格式、预写日志、后台进程等。在HBase中集成MapReduce框架;了解如何调整集群、设计模式、复制表格、导入批量数据和删除节点。

6、Flink与实战入门

Flink是开源的流处理框架其Hexi是用Java和Scala编程的分布式流数据流引擎。这是一本Flink入门书力图详细完整地描述Flink的基本理论和实际操作旨在帮助读者从零开始快速掌握Flink的基本原理和核心功能。

7。卡夫卡的介绍与实践

Kafka是一个高吞吐量的分布式发布订阅消息系统可以处理网站中消费者的所有动作流数据。本书基于Kafka 0 . 10 . 1 . 1版本深入剖析Kafka源代码和框架。书中大量事例来自作者在实际工作中的实践具有现实指导意义。

8、星火快大数据分析

这是一本给Spark初学者的书。没有深入太多的实现细节更关注上层用户的具体使用情况。但本书不仅仅局限于Spark的用法还对Spark的核心概念和基本原理进行了全面的介绍让读者知其然知其所以然。

9。大数据技术的完整解决方案:基础、设计、开发和实践

可以作为计算机软件专业本科生和研究生的大数据技术教材也可以作为大数据技术开发培训和大数据系统咨询策划培训的教材更是大数据领域一线需求分析师、系统分析师、开发人员和开发经理的必备参考书。重点不是大数据技术的原理介绍而是从实战的角度出发如何为客户设计、安装、开发一个基于hadoop开源软件的大数据系统。《大数据技术完整解决方案:基础、设计、开发、实践》还重点分享了一些具体实践中的案例不仅对从事大数据系统开发的it技术人员具有宝贵的参考价值对准备实施大数据系统项目的企业客户也有指导作用。

10、大数据项目实战

本书定位于实战系统学习大数据技术的实现由传智播客教育黑马程序员系统编写。本书旨在让读者具备Hadoop生态系统的分析能力并构建强大的解决方案来执行大数据分析同时毫不费力地从大数据分析结果中获得敏锐的洞察力。本书涉及Java语言、Hadoop、Hive、Sqoop的综合应用实现了大数据分析的可视化结果。本书适合初学者阅读Hadoop也可以作为高校相关课程的教学参考书。读者不仅可以通过实际项目巩固基础知识的学习效果还可以学习商业智能系统的开发过程。全书共分六章分别是项目概述、构建大数据集群环境、数据采集、数据预处理、数据分析和数据可视化。

以上10本书基本涵盖了目前大数据领域的大部分常用技术无论对于零基础的入门级大数据还是初级大数据开发工程师都非常有用。