目录
- 1、Pandas Profiling
- 2、AutoViz
- 3、Dataprep
- 4、SweetViz
- 5、D-Tale
- 技术交流
我们能否使用一些自动化工具代替人来完成数据分析的过程呢,现有一些成熟的 AutoEDA 工具可以一定程度上完成上述过程。本文中,我将盘点常见的 AutoEDA 工具,欢迎收藏学习,喜欢点赞支持,文末提供技术交流群,欢迎畅聊。
1、Pandas Profiling
https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html
Pandas Profiling
是款比较成熟的工具,可以直接传入DataFrame即可完成分析过程,将结果展示为HTML格式,同时分析功能也比较强大。
- 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、重复行分析
- 耗时:较少
2、AutoViz
https://github.com/AutoViML/AutoViz
AutoViz
是款美观的数据分析工具,在进行可视化的同时将结果保存为图片格式。
- 功能:相关性分析、数值变量箱线图、数值变量分布图
- 耗时:较多
3、Dataprep
https://dataprep.ai/
Dataprep
是款比较灵活也比较强大的工具,也是笔者最喜欢的。它可以指定列进行分析,同时也可以在Notebook中进行交互式分析。
- 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
- 耗时:较多
4、SweetViz
https://github.com/fbdesignpro/sweetviz
SweetViz
是款强大的数据分析工具,可以很好的分析训练集和测试集,以及目标标签与特征之间的关系。
- 功能:数据集对比分析、字段类型分析、变量分布分析、目标变量分析
- 耗时:中等
5、D-Tale
https://github.com/man-group/dtale
D-Tale
是款功能最为强大的数据分析工具,对单变量的分析过程支持比较好。
- 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
- 耗时:中等
技术交流
欢迎转载、收藏、有所收获点赞支持一下!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)