吴wuwu

关注

spark 等频 等宽 分箱的一个小问题

吴wuwu

关注

阅读 79

2022-01-05

文章大纲

  • spark 等频 等宽 分箱 数据量较少时的现象
  • 分箱编号不同的原因剖析
  • 参考文献


spark 等频 等宽 分箱 数据量较少时的现象

这里有一个很有趣的问题,当分箱数比较少 ,少于数据个数时候,等频分箱箱子编号是从0开始的。

当分箱数比较多的时候,多于数据数量,箱子编号是从1 开始编号的
在这里插入图片描述
在这里插入图片描述


分箱编号不同的原因剖析


参考文献

python 分箱

相关推荐

宁静的猫

python_等频分箱_等距分箱_特征无监督分桶

宁静的猫 68 0 0

鲤鱼打个滚

数据挖掘实验(二)数据预处理【等深分箱与等宽分箱】

鲤鱼打个滚 35 0 0

c一段旅程c

mysql使用in函数的一个小问题

c一段旅程c 117 0 0

晚熟的猫

PPT版本兼容的一个小问题

晚熟的猫 173 0 0

程序员漫画编程

盘点一个Python图像读取的小问题

程序员漫画编程 31 0 0

君心浅语

盘点一个Pandas写入csv文件的小问题

君心浅语 160 0 0

陈情雅雅

LitePal在Kotlin中使用的一个小问题

陈情雅雅 24 0 0

七千22

用LangChain调用Ollama的时候一个小问题

七千22 30 0 0

梯梯笔记

盘点一个日常需求:Excel公式小问题

梯梯笔记 75 0 0

未定义变量

ejb的bean布署中的一个烦人小问题

未定义变量 41 0 0

精彩评论(0)

0 0 举报