《Spark Cookbook 中文版》一导读

xiaoxiao2024-06-27 163

前言

Spark Cookbook 中文版随着Hadoop这个大数据平台的成功，用户的期望也水涨船高，他们既希望解决不同分析问题的功能提高，又希望减少延迟。由此，各类工具应运而生。Apache Spark这个可以解决所有问题的单一平台也出现在了Hadoop的大舞台上。“Spark一出，谁与争锋”，它终结了需要使用多种工具来完成复杂挑战和学习曲线的局面。通过使用内存进行持久化存储和计算，Apache Spark避免了磁盘上的中间存储过程并将速度提高了100倍，并且提供了一个单一平台用来完成诸如机器学习、实时streaming等诸多分析作业。

第1章　 [开始使用Apache Spark]()1.1　 [简介]()1.2　 [使用二进制文件安装Spark]()1.3　 [通过Maven构建Spark源码]()1.4　 [在Amazon EC2上部署Spark]()1.5　 [在集群上以独立模式部署Spark]()1.6　 [在集群上使用Mesos部署Spark]()1.7　 [在集群上使用YARN部署]()1.8　 [使用Tachyon作为堆外存储层]()第2章　使用Spark开发应用第3章　外部数据源第4章　Spark SQL第5章　Spark Streaming第6章　机器学习——MLlib第7章　监督学习之回归——MLlib第8章　监督学习之分类——MLlib第9章　无监督学习——MLlib第10章　推荐系统第11章　图像处理——GraphX第12章　优化及调优

相关资源：APACHE COOKBOOK（中文版）

最新回复(0)

《Spark Cookbook 中文版》一导读

前 言

目 录

前言

目录