SparkSQL

共收录篇相关文章

本文共计1277个文字，预计阅读时间需要6分钟。环境准备：- Hadoop版本：2.6.5- Spark版本：2.3.0- Hive版本：1.2.2- 主机：192.168.100.201- 从机：192.168.100.201- POM.

2026-05-214阅读0评论

本文共计3032个文字，预计阅读时间需要13分钟。SparkSQL是Spark生态系统中至关重要的组件。在面向企业级服务时，SparkSQL存在易用性差异的问题，导致难以满足日常业务开发的需求。本文将详细解读如何通过构建SparkSQL服务

2026-05-0610阅读0评论

本文共计286个文字，预计阅读时间需要2分钟。1. SparkSQL框架对表格列的增删改： - 增加一列`year`，使用`add_time`列的年份：`df.withColumn(year, year(col(add_time))).sh

2026-04-0213阅读0评论