0
点赞
收藏
分享

微信扫一扫

pd drop_duplicates返回结果count和to_csv的结果不一致


目的是从表中找出不重复的公司个数,一开始采用了drop_duplicates获取一个去重后的表,count()后发现是500多家,神奇的是当我将结果导入csv,发现只有不到100条。然后我采用groupby的方式获取分组结果,发现分组后的公司确实是500多家,导入csv与count的结果是一致的,这里记录一下,还没有解决。


举报

相关推荐

0 条评论