mapPartitions
里是耗时的(batch型的)模型推理
dataframe.repartition(500).rdd.mapPartitions
改为
dataframe.repartition(5000).rdd.mapPartitions
Spark,mapPartitions之前的repartition增大可以显著加快速度
阅读 46
2022-07-27
mapPartitions
里是耗时的(batch型的)模型推理
dataframe.repartition(500).rdd.mapPartitions
改为
dataframe.repartition(5000).rdd.mapPartitions
相关推荐
精彩评论(0)