作者:AI算法与图像处理
本人最近在做图像的特征聚类,搞了一段时间,从理论到实践,踩了不少坑,然后我发现了这个好东西(scikit-learn),和大家分享一下,希望能够帮大家提高效率。
什么是scikit-learn
scikit-learn 是基于 Python 语言的机器学习工具。
- 简单高效的数据挖掘和数据分析工具
- 可供大家在各种环境中重复使用
- 建立在 NumPy ,SciPy 和 matplotlib 上
- 开源,可商业使用 - BSD许可证
scikit-learn都有什么功能
Scikit-learn的基本功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。
上面是中文的,下面是英文的
可以根据自己的喜好来选择,但是中文版的代码我不知道为啥我自己打不开
但英文的链接里面的都会附有代码的实例
当然皇天不负有心人,我也找到目前这个翻译团队正在更新的中文文档以及相应打代码链接,收藏起来没错的
https://github.com/apachecn/scikit-learn-doc-zh
看个例子吧——对数据进行聚类
只需输入数据,定义簇数n_cluster,后面random_state都可以设置为默认的便能够实现聚类,开发的效率非常的高。
还有详细的算法讲解和比较