Image Name

🍨 本文为🔗365天深度学习练习营中的学习记载博客

🍦 参阅文章：Pytorch实战 | 第P2周：彩色图片辨认：完成mnist手写数字辨认

🍖 原作者：K同学啊|接辅导、项目定制

⏲往期文章：

深度学习实战练习 | 第8周：猫狗辨认
深度学习实战练习 | 第7周：咖啡豆辨认
深度学习实战练习 | 第6周：好莱坞明星辨认
深度学习实战练习 | 第5周：运动鞋品牌辨认

☕ Pytorch实战

Pytorch实战 | 第P1周：完成mnist手写数字辨认

难度：新手入门⭐

语言：Python3、Pytorch

🍺 要求：

学习怎么编写一个完好的深度学习程序

手动推导卷积层与池化层的核算进程

🏡 我的环境：

语言环境：Python3.8
编译器：jupyter notebook
深度学习环境：Pytorch

一、前期预备

1. 设置GPU

假如设备上支撑GPU就运用GPU,不然运用CPU

import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import torchvision
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device

device(type='cuda')

2. 导入数据

运用dataset下载MNIST数据集，并划分好练习集与测验集

运用dataloader加载数据，并设置好根本的batch_size

⭐ torchvision.datasets.MNIST详解

torchvision.datasets是Pytorch自带的一个数据库，咱们能够经过代码在线下载数据，这儿运用的是torchvision.datasets中的MNIST数据集。

函数原型：

torchvision.datasets.MNIST(root, train=True, transform=None, target_transform=None, download=False)

参数阐明：

root (string) ：数据地址
train (string) ：True = 练习集，False = 测验集
download (bool,optional) : 假如为True，从互联网上下载数据集，并把数据集放在root目录下。
transform (callable, optional )：这儿的参数选择一个你想要的数据转化函数，直接完成数据转化
target_transform (callable,optional) ：承受目标并对其进行转化的函数/转化。

train_ds = torchvision.datasets.CIFAR10('data',
                                      train=True, 
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)
test_ds  = torchvision.datasets.CIFAR10('data', 
                                      train=False, 
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)

Files already downloaded and verified
Files already downloaded and verified

batch_size = 32
train_dl = torch.utils.data.DataLoader(train_ds, 
                                       batch_size=batch_size, 
                                       shuffle=True)
test_dl  = torch.utils.data.DataLoader(test_ds, 
                                       batch_size=batch_size)

# 取一个批次查看数据格式
# 数据的shape为：[batch_size, channel, height, weight]
# 其间batch_size为自己设定，channel，height和weight分别是图片的通道数，高度和宽度。
imgs, labels = next(iter(train_dl))
imgs.shape

torch.Size([32, 3, 32, 32])

3. 数据可视化

squeeze()函数的功能是从矩阵shape中，去掉维度为1的。例如一个矩阵是的shape是（5, 1），运用过这个函数后，成果为（5, ）。

import numpy as np
 # 指定图片巨细，图画巨细为20宽、5高的绘图(单位为英寸inch)
plt.figure(figsize=(20, 5)) 
for i, imgs in enumerate(imgs[:20]):
    # 维度减缩
    npimg = imgs.numpy().transpose((1, 2, 0))
    # 将整个figure分成2行10列，制作第i+1个子图。
    plt.subplot(2, 10, i+1)
    plt.imshow(npimg, cmap=plt.cm.binary)
    plt.axis('off')

二、构建简略的CNN网络

关于一般的CNN网络来说，都是由特征提取网络和分类网络构成，其间特征提取网络用于提取图片的特征，分类网络用于将图片进行分类。

⭐1. torch.nn.Conv2d()详解

函数原型：

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode=’zeros’, device=None, dtype=None)

要害参数阐明：

in_channels ( int ) – 输入图画中的通道数
out_channels ( int ) – 卷积发生的通道数
kernel_size ( int or tuple ) – 卷积核的巨细
stride ( int or tuple , optional ) — 卷积的步幅。默认值：1
padding ( int , tuple或str , optional ) – 增加到输入的一切四个边的填充。默认值：0
padding_mode (字符串,可选) – ‘zeros’, ‘reflect’, ‘replicate’或’circular’. 默认：’zeros’

⭐2. torch.nn.Linear()详解

函数原型：

torch.nn.Linear(in_features, out_features, bias=True, device=None, dtype=None)

要害参数阐明：

in_features：每个输入样本的巨细
out_features：每个输出样本的巨细

⭐3. torch.nn.MaxPool2d()详解

函数原型：

torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)

要害参数阐明：

kernel_size：最大的窗口巨细
stride：窗口的步幅，默认值为kernel_size
padding：填充值，默以为0
dilation：操控窗口中元素步幅的参数

⭐4. 关于卷积层、池化层的核算：

下面的网络数据shape改动进程为：

3, 32, 32（输入数据）
-> 64, 30, 30（经过卷积层1）-> 64, 15, 15（经过池化层1）
-> 64, 13, 13（经过卷积层2）-> 64, 6, 6（经过池化层2）
-> 128, 4, 4（经过卷积层3） -> 128, 2, 2（经过池化层3）
-> 512 -> 256 -> num_classes(10)

请根据我在练习营中发布的【卷积层的核算】与【池化层的核算】这两篇文章手动推导这个进程。

import torch.nn.functional as F
num_classes = 10  # 图片的类别数
class Model(nn.Module):
     def __init__(self):
        super().__init__()
         # 特征提取网络
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3)   # 第一层卷积,卷积核巨细为3*3
        self.pool1 = nn.MaxPool2d(kernel_size=2)       # 设置池化层，池化核巨细为2*2
        self.conv2 = nn.Conv2d(64, 64, kernel_size=3)  # 第二层卷积,卷积核巨细为3*3   
        self.pool2 = nn.MaxPool2d(kernel_size=2) 
        self.conv3 = nn.Conv2d(64, 128, kernel_size=3) # 第二层卷积,卷积核巨细为3*3   
        self.pool3 = nn.MaxPool2d(kernel_size=2) 
        # 分类网络
        self.fc1 = nn.Linear(512, 256)          
        self.fc2 = nn.Linear(256, num_classes)
     # 前向传达
     def forward(self, x):
        x = self.pool1(F.relu(self.conv1(x)))     
        x = self.pool2(F.relu(self.conv2(x)))
        x = self.pool3(F.relu(self.conv3(x)))
        x = torch.flatten(x, start_dim=1)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

加载并打印模型

from torchinfo import summary
# 将模型转移到GPU中（咱们模型运行均在GPU中进行）
model = Model().to(device)
summary(model)

=================================================================
Layer (type:depth-idx)                   Param #
=================================================================
Model                                    --
├─Conv2d: 1-1                            1,792
├─MaxPool2d: 1-2                         --
├─Conv2d: 1-3                            36,928
├─MaxPool2d: 1-4                         --
├─Conv2d: 1-5                            73,856
├─MaxPool2d: 1-6                         --
├─Linear: 1-7                            131,328
├─Linear: 1-8                            2,570
=================================================================
Total params: 246,474
Trainable params: 246,474
Non-trainable params: 0
=================================================================

三、练习模型

1. 设置超参数

loss_fn    = nn.CrossEntropyLoss() # 创建丢失函数
learn_rate = 1e-2 # 学习率
opt        = torch.optim.SGD(model.parameters(),lr=learn_rate)

2. 编写练习函数

1. optimizer.zero_grad()

函数会遍历模型的一切参数，经过内置方法截断反向传达的梯度流，再将每个参数的梯度值设为0，即上一次的梯度记载被清空。

2. loss.backward()

PyTorch的反向传达(即tensor.backward())是经过autograd包来完成的，autograd包会根据tensor进行过的数学运算来主动核算其对应的梯度。

具体来说，torch.tensor是autograd包的根底类，假如你设置tensor的requires_grads为True，就会开始跟踪这个tensor上面的一切运算，假如你做完运算后运用tensor.backward()，一切的梯度就会主动运算，tensor的梯度将会累加到它的.grad特点里边去。

更具体地说，丢失函数loss是由模型的一切权重w经过一系列运算得到的，若某个w的requires_grads为True，则w的一切上层参数（后面层的权重w）的.grad_fn特点中就保存了对应的运算，然后在运用loss.backward()后，会一层层的反向传达核算每个w的梯度值，并保存到该w的.grad特点中。

假如没有进行tensor.backward()的话，梯度值将会是None，因此loss.backward()要写在optimizer.step()之前。

3. optimizer.step()

step()函数的作用是履行一次优化过程，经过梯度下降法来更新参数的值。因为梯度下降是基于梯度的，所以在履行optimizer.step()函数前应先履行loss.backward()函数来核算梯度。

注意：optimizer只担任经过梯度下降进行优化，而不担任发生梯度，梯度是tensor.backward()方法发生的。

# 练习循环
def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)  # 练习集的巨细，一共60000张图片
    num_batches = len(dataloader)   # 批次数目，1875（60000/32）
    train_loss, train_acc = 0, 0  # 初始化练习丢失和正确率
    for X, y in dataloader:  # 获取图片及其标签
        X, y = X.to(device), y.to(device)
        # 核算猜测误差
        pred = model(X)          # 网络输出
        loss = loss_fn(pred, y)  # 核算网络输出和实在值之间的距离，targets为实在值，核算二者差值即为丢失
        # 反向传达
        optimizer.zero_grad()  # grad特点归零
        loss.backward()        # 反向传达
        optimizer.step()       # 每一步主动更新
        # 记载acc与loss
        train_acc  += (pred.argmax(1) == y).type(torch.float).sum().item()
        train_loss += loss.item()
    train_acc  /= size
    train_loss /= num_batches
    return train_acc, train_loss

3. 编写测验函数

测验函数和练习函数大致相同，可是由于不进行梯度下降对网络权重进行更新，所以不需求传入优化器

def test (dataloader, model, loss_fn):
    size        = len(dataloader.dataset)  # 测验集的巨细，一共10000张图片
    num_batches = len(dataloader)          # 批次数目，313（10000/32=312.5，向上取整）
    test_loss, test_acc = 0, 0
    # 当不进行练习时，停止梯度更新，节省核算内存消耗
    with torch.no_grad():
        for imgs, target in dataloader:
            imgs, target = imgs.to(device), target.to(device)
            # 核算loss
            target_pred = model(imgs)
            loss        = loss_fn(target_pred, target)
            test_loss += loss.item()
            test_acc  += (target_pred.argmax(1) == target).type(torch.float).sum().item()
    test_acc  /= size
    test_loss /= num_batches
    return test_acc, test_loss

4. 正式练习

1. model.train()

model.train()的作用是启用 Batch Normalization 和 Dropout。

假如模型中有BN层(Batch Normalization）和Dropout，需求在练习时增加model.train()。model.train()是确保BN层能够用到每一批数据的均值和方差。关于Dropout，model.train()是随机取一部分网络连接来练习更新参数。

2. model.eval()

model.eval()的作用是不启用 Batch Normalization 和 Dropout。

假如模型中有BN层(Batch Normalization）和Dropout，在测验时增加model.eval()。model.eval()是确保BN层能够用悉数练习数据的均值和方差，即测验进程中要确保BN层的均值和方差不变。关于Dropout，model.eval()是利用到了一切网络连接，即不进行随机放弃神经元。

练习完train样本后，生成的模型model要用来测验样本。在model(test)之前，需求加上model.eval()，不然的话，有输入数据，即使不练习，它也会改动权值。这是model中含有BN层和Dropout所带来的的性质。

epochs     = 10
train_loss = []
train_acc  = []
test_loss  = []
test_acc   = []
for epoch in range(epochs):
    model.train()
    epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, opt)
    model.eval()
    epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)
    train_acc.append(epoch_train_acc)
    train_loss.append(epoch_train_loss)
    test_acc.append(epoch_test_acc)
    test_loss.append(epoch_test_loss)
    template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%，Test_loss:{:.3f}')
    print(template.format(epoch+1, epoch_train_acc*100, epoch_train_loss, epoch_test_acc*100, epoch_test_loss))
print('Done')

Epoch: 1, Train_acc:13.5%, Train_loss:2.280, Test_acc:19.8%，Test_loss:2.150
Epoch: 2, Train_acc:24.6%, Train_loss:2.022, Test_acc:29.0%，Test_loss:1.931
Epoch: 3, Train_acc:33.2%, Train_loss:1.811, Test_acc:36.9%，Test_loss:1.712
Epoch: 4, Train_acc:40.4%, Train_loss:1.637, Test_acc:40.8%，Test_loss:1.609
Epoch: 5, Train_acc:44.0%, Train_loss:1.535, Test_acc:46.4%，Test_loss:1.470
Epoch: 6, Train_acc:47.4%, Train_loss:1.449, Test_acc:47.4%，Test_loss:1.432
Epoch: 7, Train_acc:50.9%, Train_loss:1.365, Test_acc:53.1%，Test_loss:1.313
Epoch: 8, Train_acc:53.9%, Train_loss:1.289, Test_acc:55.2%，Test_loss:1.256
Epoch: 9, Train_acc:56.1%, Train_loss:1.226, Test_acc:50.4%，Test_loss:1.458
Epoch:10, Train_acc:58.4%, Train_loss:1.175, Test_acc:58.9%，Test_loss:1.156
Done

四、成果可视化

import matplotlib.pyplot as plt
#躲藏正告
import warnings
warnings.filterwarnings("ignore")               #疏忽正告信息
plt.rcParams['font.sans-serif']    = ['SimHei'] # 用来正常显现中文标签
plt.rcParams['axes.unicode_minus'] = False      # 用来正常显现负号
plt.rcParams['figure.dpi']         = 100        #分辨率
epochs_range = range(epochs)
plt.figure(figsize=(12, 3))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, train_acc, label='Training Accuracy')
plt.plot(epochs_range, test_acc, label='Test Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')
plt.subplot(1, 2, 2)
plt.plot(epochs_range, train_loss, label='Training Loss')
plt.plot(epochs_range, test_loss, label='Test Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

Pytorch实战 | 第P2周：彩色图片识别

一、前期预备

1. 设置GPU

2. 导入数据

3. 数据可视化

二、构建简略的CNN网络

三、练习模型

1. 设置超参数

2. 编写练习函数

3. 编写测验函数

4. 正式练习

四、成果可视化

作者信息

Pytorch实战 | 第P2周：彩色图片识别

一、 前期预备

1. 设置GPU

2. 导入数据

3. 数据可视化

二、构建简略的CNN网络

三、 练习模型

1. 设置超参数

2. 编写练习函数

3. 编写测验函数

4. 正式练习

四、 成果可视化

相关文章

说好的杀疯了呢？微软 Loop 公测体验

带你认识一下多模态对比语言图像预训练CLIP

【AI】浅析恶意文件静态检测及部分问题解决思路

【车间调度】基于matlab遗传算法求解车间调度问题【含Matlab源码 1396期】

作者信息

一、前期预备

三、练习模型

四、成果可视化