分享

Spark 高级分析:第一章第3节关于本书

feilong 2017-9-15 07:35:48 发表于 推荐型 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 6951
本帖最后由 feilong 于 2017-9-15 10:08 编辑



      本书的其余部分不会是关于Spark的优缺点。 还有一些其他的东西,它也不会介绍。 本书将介绍Spark编程模型和Scala基础知识,但它不会尝试成为Spark参考,也不会为其所有难点提供全面的指南。它不会尝试成为机器学习、统计或线性代数参考,尽管许多章节将在使用它们之前提供一些背景知识。

      相反,它将尝试帮助读者了解如何在大型数据集上使用Spark进行复杂分析。它将涵盖整个管道:不仅仅是建立和评估模型,而是清理、预处理和探索数据,并将结果转化为生产应用程序。我们认为最好的教学方式就是举例说明,因此,在描述Spark及其生态系统的章节之后,其余章节将是使用Spark分析来自不同领域的数据的示例。

       在可能的情况下,我们将尽力不提供“解决方案”,而不是为了演示完整的数据科学工作流程,及其所有的迭代,阻塞和重启。 这本书将有助于你更了解Scala、Spark以及机器学习和数据分析。但是,这些都是为了更大的目标,我们希望这本书最重要的是教会你如何处理本章第一句中描述的任务。每一章二十页左右,将尝试尽可能接近地展示如何构建这些数据应用程序。



没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条