0
点赞
收藏
分享

微信扫一扫

微信小程序有几个文件

书写经典 2024-01-01 阅读 8
spark

rdd.glom()

对rdd的数据进行嵌套,嵌套按照分区来进行

    rdd = sc.parallelize([1, 2, 3, 4, 5, 6, 7, 8, 9], 2)
    print(rdd.glom().collect())

输出:[[1,2,3,4],[5,6,7,8,9]]

参考

  • PySpark基础入门(2):RDD及其常用算子_spark rdd 随机抽样-CSDN博客
举报

相关推荐

0 条评论