大家好,我是小寒。

原文链接

scikit-learn 是用 Python 构建机器学习最常用的库之一。它的受欢迎程度可归因于其简略且共同的代码结构,这对初学者很友爱。

该库包含多个用于分类、回归和聚类的机器学习模型。

在本文中,咱们将经过各种算法探索多类分类问题。让咱们深入研究并构建咱们的 scikit-learn 模型。

装置 scikit-learn 库

pip install scikit-learn

加载数据集

使用 scikit-learn 自带的 “Wine” 数据集。该数据集共有 178 个样本和 3 个类别。

使用 scikit-learn 进行多分类

切分练习和测验数据

保存 67% 的数据用于练习,其余 33% 用于测验。

使用 scikit-learn 进行多分类

咱们将实验 5 种不同复杂度的模型,并在咱们的数据集上评价它们的结果。

练习模型

逻辑回归

使用 scikit-learn 进行多分类

使用 scikit-learn 进行多分类

KNN

使用 scikit-learn 进行多分类

使用 scikit-learn 进行多分类

朴素贝叶斯

使用 scikit-learn 进行多分类

使用 scikit-learn 进行多分类

决策树

使用 scikit-learn 进行多分类

使用 scikit-learn 进行多分类

随机森林

使用 scikit-learn 进行多分类

使用 scikit-learn 进行多分类

使用 scikit-learn 进行多分类

在这个算法中,咱们进行了一些超参数调整以到达最佳精度。

咱们定义了一个参数网格,其间包含多个值供每个参数选择。

此外,咱们使用随机查找算法来查找模型的最佳参数空间。

最后,咱们将获得的参数提供给分类器并练习模型。