Spark—GraphX编程指南如何优化长尾推荐系统?
- 内容介绍
- 文章标签
- 相关推荐
本文共计9558个文字,预计阅读时间需要39分钟。
Spark面试题(一)- 数据倾斜调优Spark面试题(二)- Spark资源调优Spark面试题(三)- Spark性能调优Spark面试题(四)- Spark内存调优Spark面试题(五)- Spark序列化Spark面试题(六)- Spark缓存Spark面试题(七)- Spark广播
Spark系列面试题
- Spark面试题(一)
- Spark面试题(二)
- Spark面试题(三)
- Spark面试题(四)
- Spark面试题(五)——数据倾斜调优
- Spark面试题(六)——Spark资源调优
- Spark面试题(七)——Spark程序开发调优
- Spark面试题(八)——Spark的Shuffle配置调优
GraphX 是新的图形和图像并行计算的Spark API。从整理上看,GraphX 通过引入 弹性分布式属性图(Resilient Distributed Property Graph)继承了Spark RDD:一个将有效信息放在顶点和边的有向多重图。为了支持图形计算,GraphX 公开了一组基本的运算(例如,subgraph,joinVertices和mapReduceTriplets),以及在一个优化后的 PregelAPI的变形。此外,GraphX 包括越来越多的图算法和 builder 构造器,以简化图形分析任务。
图并行计算的背景从社交网络到语言建模,日益扩大的规模和图形数据的重要性已带动许多新的图像并行系统(例如,Giraph和 GraphLab)。
本文共计9558个文字,预计阅读时间需要39分钟。
Spark面试题(一)- 数据倾斜调优Spark面试题(二)- Spark资源调优Spark面试题(三)- Spark性能调优Spark面试题(四)- Spark内存调优Spark面试题(五)- Spark序列化Spark面试题(六)- Spark缓存Spark面试题(七)- Spark广播
Spark系列面试题
- Spark面试题(一)
- Spark面试题(二)
- Spark面试题(三)
- Spark面试题(四)
- Spark面试题(五)——数据倾斜调优
- Spark面试题(六)——Spark资源调优
- Spark面试题(七)——Spark程序开发调优
- Spark面试题(八)——Spark的Shuffle配置调优
GraphX 是新的图形和图像并行计算的Spark API。从整理上看,GraphX 通过引入 弹性分布式属性图(Resilient Distributed Property Graph)继承了Spark RDD:一个将有效信息放在顶点和边的有向多重图。为了支持图形计算,GraphX 公开了一组基本的运算(例如,subgraph,joinVertices和mapReduceTriplets),以及在一个优化后的 PregelAPI的变形。此外,GraphX 包括越来越多的图算法和 builder 构造器,以简化图形分析任务。
图并行计算的背景从社交网络到语言建模,日益扩大的规模和图形数据的重要性已带动许多新的图像并行系统(例如,Giraph和 GraphLab)。

