如何使用pyspark在dataframe中添加新列的示例代码?
- 内容介绍
- 相关推荐
本文共计553个文字,预计阅读时间需要3分钟。
熟悉pandas的Pythoner应该知道,给DataFrame增加一列非常容易,直接以字典形式指定即可。而在PySpark中就不一样了,搜索了一番后,可以使用如下方式添加:
pythonfrom pyspark import SparkContext
sc=SparkContext()
这样就能添加一列了。
本文共计553个文字,预计阅读时间需要3分钟。
熟悉pandas的Pythoner应该知道,给DataFrame增加一列非常容易,直接以字典形式指定即可。而在PySpark中就不一样了,搜索了一番后,可以使用如下方式添加:
pythonfrom pyspark import SparkContext
sc=SparkContext()
这样就能添加一列了。

