大家好,我是小寒。
原文链接
scikit-learn 是用 Python 构建机器学习最常用的库之一。它的受欢迎程度可归因于其简略且共同的代码结构,这对初学者很友爱。
该库包含多个用于分类、回归和聚类的机器学习模型。
在本文中,咱们将经过各种算法探索多类分类问题。让咱们深入研究并构建咱们的 scikit-learn 模型。
装置 scikit-learn 库
pip install scikit-learn
加载数据集
使用 scikit-learn 自带的 “Wine” 数据集。该数据集共有 178 个样本和 3 个类别。
切分练习和测验数据
保存 67% 的数据用于练习,其余 33% 用于测验。
咱们将实验 5 种不同复杂度的模型,并在咱们的数据集上评价它们的结果。
练习模型
逻辑回归
KNN
朴素贝叶斯
决策树
随机森林
在这个算法中,咱们进行了一些超参数调整以到达最佳精度。
咱们定义了一个参数网格,其间包含多个值供每个参数选择。
此外,咱们使用随机查找算法来查找模型的最佳参数空间。
最后,咱们将获得的参数提供给分类器并练习模型。