Spark大数据处理:技术、应用与性能优化

Spark大数据处理:技术、应用与性能优化

 Spark大数据处理:技术、应用与性能优化|200

  • 作者: 高彦杰
  • 简介: 这是一本依据最新技术版本,系统、全面、详细讲解Spark的著作,作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;然后从应用角度讲解了一些简单的、有代表性的案例;最后对Spark的性能优化进行了探讨。
  • 出版时间: 2014-11-01
  • ISBN: 9787111483861
  • 分类: 计算机-数据库
  • 出版社: 机械工业出版社
  • 字数: 221477
  • 在线阅读: 微信读书
  • 划线数量: 1
  • 想法数量: 0

笔记

9.2 调优技巧

📌 Spark中提供了两个序列化库和两种序列 化方式:使用Java标准序列化库进行序列化的方式和使用Kyro库进行序列化的方式。Java标准序列化库兼容性好,但体积大、速度慢,Kyro库兼容性略差,但是体积小、速度快。所以在能使用Kyro的情况下,还是推荐使用Kyro进行序列化。

  • ⏱ 2026-01-24 20:46:28 ^56-18582-18720