0
点赞
收藏
分享

微信扫一扫

pandas_profiling:一行代码生成你的数据分析报告

笔者最近发现一款将pandas数据框快速转化为描述性数据分析报告的package——pandas_profiling。一行代码即可生成内容丰富的EDA内容,两行代码即可将报告以.html格式保存。笔者当初也是从数据分析做起的,所以深知这个工具对于数据分析的朋友而言极为方便,在此特地分享给大家。

我们以uci机器学习库中的人口调查数据集adult.data为例进行说明。

数据集地址:

https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data

常规情况下我们拿到数据做EDA的时候这几种函数是必用的:

这是最简单最快速了解一个数据集的方法。当然,更深层次的EDA一定是要借助统计图形来展示的。基于scipy、matplotlib和seaborn等工具的展示这里权且略过。

现在我们有了pandas_profiling。上述过程以及各种统计相关性计算、统计绘图全部由pandas_profiling打包搞定了。pandas_profiling安装,包括pip、conda和源码三种安装方式。

pip:

pip install pandas-profiling
pip install https://github.com/pandas-profiling/pandas-profiling/archive/master.zip

conda:

conda install -c conda-forge pandas-profiling

source:

先下载源码文件,然后解压到setup.py所在的文件目录下:

python setup.py install

举报

相关推荐

0 条评论