Spark SQL内核剖析 pdf epub mobi txt 电子书下载 2025

☆☆☆☆☆

朱锋，博士毕业于中科院软件所，研究方向为分布式计算与软件工程。长期关注数据分析、数据库技术和大数据相关系统，并积极参与开源社区贡献。2017年加入腾讯，负责Spark SQL相关平台的开发、优化和维护工作，在SQL-on-Hadoop方面积累了丰富的经验。

张韶全，香港中文大学博士，博士期间研究方向为系统最优分布式算法。曾任香港应用研究院研究员、联想香港研发中心高级研究员。现任腾讯大数据平台高级研发工程师，负责腾讯大数据SQL平台的建设与研发，平台规模达到上万台服务器，百万级别业务量，PB级日数据计算量，支撑着腾讯全公司的数据分析业务，拥有多年互联网公司一线的大数据平台设计与研发经验。旨在传播大数据技术和实践经验，使其在不同行业落地生根。

黄明，腾讯T4专家，Spark中国区早期研究者和布道者之一。

出版者:电子工业出版社

作者:朱锋

出品人:博文视点

页数:268

译者:

出版时间:2018-8

价格:69.00元

装帧:平装

isbn号码:9787121343148

丛书系列:

图书标签:

Spark
SQL
大数据
计算机
数据库
数据平台
Scala
编程

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到图书目录大全

book.wenda123.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

Spark SQL 是 Spark 技术体系中较有影响力的应用（Killer application），也是 SQL-on-Hadoop 解决方案中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成，从源码层面深入介绍 Spark SQL 内部实现机制，以及在实际业务场景中的开发实践，其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregation 算子和 Join 算子的实现与执行、Tungsten 优化技术、生产环境中的一些改造优化经验等。

《Spark SQL内核剖析》不属于入门级教程，需要读者对基本概念有一定的了解。在企业中任职的系统架构师和软件开发人员，以及对大数据、分布式计算和数据库系统实现感兴趣的研究人员，均适合阅读《Spark SQL内核剖析》。

具体描述

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

很好

评分☆☆☆☆☆

内容不错，讲得很细。语言组织的也不错。值得推荐。

评分☆☆☆☆☆

1. 内容详实，从Parser、Optimizer到Codegen都有涉及 2. 没有贴太多代码，画的图倒还不错 3. 不足之处在于，仍是从代码到原理，而更符合思维逻辑的是从Why到How；分析的深度有限，例如如何实现Join谓词下推、等价类推导并没有展开 4. 感觉书的行文逻辑略奇怪，不断讲解这个class是什么意思、那个method是什么，却没有一个连贯的逻辑来分析从why到how的过程

评分☆☆☆☆☆

目前市面上，专门分析讲解Spark SQL的书并不多，包括网上的资料都比较单薄不成系统。该书算是比较系统的介绍Spark SQL的书籍。本书的篇幅不多，不过对于没有数据库原理基础的读者看起来还是有点费劲的。先说说该书一些可圈可点之处： 1. 本书的叙述思路还是比较清晰的。 2. 书中代码不多，比较简洁。图例比较多，比较好理解。不过，也发现了一些问题： 1. 该书感觉像是由几个人分别撰写一部分，然后拼在一起的，明显有些基础内容是有重叠的。而且，撰写逻辑和讲述方式前后不太一致。 2. 正如我之前提到的，该书对于没有数据库原理的读者，是不太友好的（前几章还可以，有先脱离Spark SQL介绍一下ANTLR4，比较好理解）。 3. 在书的最后还介绍了腾讯的TDW，感觉完全没有必要。

评分☆☆☆☆☆

可以当2.0版本的工具书。一些细节说的都非常详细，难得的国人佳作。