Spark与Hadoop大数据分析比较系统地讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,既涵盖ApacheSpark和Hadoop的基础知识,又深入探讨所有Spark组件——SparkCore、SparkSQL、DataFrame、DataSet、普通流、结构化流、MLlib、Graphx,以及Hadoop的核心组件(HDFS、MapReduce和Yarn)等,并配套详细的实现示例,是快速掌握大数据分析基础架构及其实施方法的详实参考。

全书共10章,第1章从宏观的角度讲解大数据分析的概念,并介绍在Hadoop和Spark平台上使用的工具和技术,以及一些*常见的用例;第2章介绍Hadoop和Spark平台的基础知识;第3章深入探讨并学习Spark;第4章主要介绍DataSourcesAPI、DataFrameAPI和新的DatasetAPI;第5章讲解如何用SparkStreaming进行实时分析;第6章介绍Spark和Hadoop配套的笔记本和数据流;第7章讲解Spark和Hadoop上的机器学习技术;第8章介绍如何构建推荐系统;第9章介绍如何使用GraphX进行图分析;第10章介绍如何使用SparkR。


《Spark与Hadoop大数据分析》电子书籍下载地址:

刘遄

您只需扫描右侧二维码或者手动添加微信好友:"liuchuan665",即可看到验证码了~而如果您想要获得更多原创文章、对交流学习Linux技术干货感兴趣的话,可以申请成为刘遄老师的好友,每天在朋友圈中分享资源哦→

该页面的验证码:

此账号由刘遄老师亲自运营,抵制微商和发广告的非技术人士,请仔细阅读后再添加!

本文原创地址:https://www.linuxprobe.com/spark-hadoop-pdf.html编辑:小花,审核员:逄增宝