Scikit-learn:一款基于Python的机器学习工具
分类:开源
时间:2023-06-16 03:25
浏览:906
概述
Scikit-learn是一款基于Python的机器学习工具,主要强调数据挖掘与数据分析。其提供多种算法以实现分类、回归、聚类、降维、模型选择以及预处理等等。该项目在GitHub上拥有超过25300颗星评与超过12900次fork。
内容
概述
基于其它三个开源项目(NumPy、SciPy以及matplotlibe)的Scikit-learn是一款基于Python的机器学习工具,主要强调数据挖掘与数据分析。其提供多种算法以实现分类、回归、聚类、降维、模型选择以及预处理等等。其用户包括Spotify、Evernote、OKCupid以及Change.org等等。其最初属于谷歌Summer of Code项目,并在随后的发展当中得到了多个组织机构的资助——具体包括INRIA、Paris-Saclay数据科学中心、纽约大学、Télécom Paristech、哥伦比亚大学、Alfred P. Sloan基金会与悉尼大学等。该项目在GitHub上拥有超过25300颗星评与超过12900次fork。
安装
依赖关系
scikit-learn 需要:
[hidecontent type="logged" desc="隐藏内容:登录后可查看"]
- Python (>= 3.8)
- NumPy (>= 1.17.3)
- SciPy (>= 1.5.0)
- joblib (>= 1.1.1)
- threadpoolctl (>= 2.0.0)
Scikit-learn 0.20 是最后一个支持 Python 2.7 和 Python 3.4 的版本。 scikit-learn 1.0 及更高版本需要 Python 3.7 或更新版本。scikit-learn 1.1 及更高版本需要 Python 3.8 或更新版本。
Scikit-learn 绘图功能(即函数以“Display”开头plot_
,类以“Display”结尾)需要 Matplotlib (>= 3.1.3)。要运行示例,需要 Matplotlib >= 3.1.3。一些示例需要 scikit-image >= 0.16.2,一些示例需要 pandas >= 1.0.5,一些示例需要 seaborn >= 0.9.0 和 plotly >= 5.14.0。
用户安装
如果您已经安装了 numpy 和 scipy,安装 scikit-learn 的最简单方法是使用pip
:
pip install -U scikit-learn
或conda
:
conda 安装-c conda-forge scikit-learn
该文档包括更详细的安装说明。
变更日志
有关 scikit-learn 显着更改的历史记录,请参阅更改日志。
测试
安装后,您可以从源目录外部启动测试套件(您需要安装pytest
>= 7.1.2):
测试sklearn
[/hidecontent]