Pytorch——波士顿房价预测模型搭建

携手创造，一起生长！这是我参与「日新计划 8 月更文应战」的第22天，点击查看活动概况

前语

在上一篇文章中，咱们介绍神经网络的根本概念，包括感知器的根本概念，前向计算，反向传播，分类与回归，过拟合和欠拟合，正则化问题。

今日，咱们来运用运用Pytorch进行波士顿房价猜测模型建立。

1.1 Pytorch建立神经网络根本组成模块
数据：对练习数据进行加载，而且用于对网络参数进行练习
网络结构：建立的神经网络最重要的一个模块
丢失：在进行问题建模的时分，针对分类问题和回归问题结构出来的优化方式，怎么去计算猜测值和实在值之间的误差，而且运用计算出来的误差完成对网络参数的优化
优化：选用的优化算法，如：梯度下降法
测验：对练习好的网络进行测验，测验是伴随在练习的进程中的操作
推理：对练习好的网络进行推理，推理是在练习好网络之后，运用网络来完成咱们想要解决的一些任务
1.2 Pytorch完成波士顿房价猜测模型建立
- 波士顿返奖这些数据于1978年开端计算，共506个数据点，涵盖了麻省波士顿不同郊区房屋14种特征信息
- 数据集下载地址：t.cn/RfHTAgY
- 丢失函数： MSE-LOSS

代码实现：

1.2.1 数据集加载

# data
import numpy as np
import re
data = []
ff = open("housing.data").readlines()    # 将数据的每一列都读取出来
for item in ff:
    out = re.sub(r"\s{2,}", " ", item).strip()
    print(out)
    data.append(out.split(" "))
data = np.array(data).astype(np.float64)  # 将数据进行类型转换为float
print(data.shape)

运转成果：

(506, 14)

1.2.2 数据集的区分

# 这些数据前十三个是x，后一个是y
# 切分数据
Y = data[:, -1]
X = data[:, 0:-1]
# 区分测验集和练习集，界说前496个样本为练习集的样本
X_train = X[0:496, ...]
Y_train = Y[0:496, ...]
X_test = X[496:, ...]
Y_test = Y[496:, ...]
print(X_train.shape)
print(Y_train.shape)
print(X_test.shape)
print(Y_test.shape)

运转成果：

(496, 13)
(496,)
(10, 13)
(10,)

能够看到，练习集由496个样本，测验集有10个样本

1.2.3 界说网络结构

在这里，只界说一个简单的回归网络结构

# 界说一个简单的神经网络:只要一个躲藏层，也就是线性层
class Net(torch.nn.Module):
    def __init__(self, n_feature, n_output):
        super(Net, self).__init__()
        self.predict = torch.nn.Linear(n_feature, n_output)
    def forward(self, x):
        out = self.predict(x)
        return out
# 初始化网络
net = Net(13, 1)

1.2.4 界说loss和optimizer

选用MES-LOSS的办法

# loss
# 选用均方丢失
loss_func = torch.nn.MSELoss()
# optimizer
optimizer = torch.optim.SGD(net.parameters(), lr=0.01)

1.2.5 界说练习的进程

在经过线性函数拿到的pred是一个二维的，而y_data经过Y_train来进行初始化的时分，是一维的，这时，能够对pred做一个维度的删去，或者对y_data做维度的扩展

# training
for i in range(1000):
    x_data = torch.tensor(X_train, dtype=torch.float32)
    y_data = torch.tensor(Y_train, dtype=torch.float32)
    pred = net.forward(x_data)
    pred = torch.squeeze(pred)
    loss = loss_func(pred, y_data)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    # 打印迭代次数和loss的变化
    print("ite:{}, loss_train:{}".format(i, loss))
    print(pred[0:10])
    print(y_data[0:10])

履行当时的脚本之后会发现，咱们计算出来的丢失都是nan，那么loss为什么会产生nan的情况呢？

学习率可能太高了
loss自身太大了

将loss降低1000倍，将lr降低100倍

# optimizer
optimizer = torch.optim.SGD(net.parameters(), lr=0.0001)
# training
for i in range(1000):
    x_data = torch.tensor(X_train, dtype=torch.float32)
    y_data = torch.tensor(Y_train, dtype=torch.float32)
    pred = net.forward(x_data)
    pred = torch.squeeze(pred)
    loss = loss_func(pred, y_data) * 0.001
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    # 打印迭代次数和loss的变化
    print("ite:{}, loss_train:{}".format(i, loss))
    print(pred[0:10])
    print(y_data[0:10])

这时能够发现loss不再为nan了

最终loss收敛在了97这个位置上，观察猜测成果和实在成果之间的误差还是比较大的，这说明咱们的模型处于欠拟合的状况，

关于模型处于欠拟合的状况能够做的：

加大练习的次数
在初始学习的时分运用大的学习率，在迭代过必定次数之后对学习率进行动态的调整
选用其他的优化函数，比方dam
将模型变得更杂乱，比方再加入一个躲藏层

打印测验集的loss

# test
x_data = torch.tensor(X_test, dtype=torch.float32)
y_data = torch.tensor(Y_test, dtype=torch.float32)
pred = net.forward(x_data)
pred = torch.squeeze(pred)
loss_test = loss_func(pred, y_data) * 0.001
print("ite:{}, loss_test:{}".format(i, loss))

能够发现，测验集的loss也是下降的，在多轮练习之后，练习集的loss在3.5，测验集的loss在6.0

1.2.6 保存模型

把模型悉数保存下来

torch.save(net, "model.pkl")

保存模型的参数：

torch.save(net.state_dict(), "params.pkl")

1.2.7 推理

加载模型

import torch
torch.load("model.kpl")

推理代码展现：

class Net(torch.nn.Module):
    def __init__(self, n_feature, n_output):
        super(Net, self).__init__()
        self.hidden = torch.nn.Linear(n_feature, 100)
        self.predict = torch.nn.Linear(100, n_output)
    def forward(self, x):
        out = self.hidden(x)
        out = torch.relu(out)
        out = self.predict(out)
        return out
data = []
ff = open("housing.data").readlines()    # 将数据的每一列都读取出来
for item in ff:
    out = re.sub(r"\s{2,}", " ", item).strip()
    data.append(out.split(" "))
data = np.array(data).astype(np.float64)  # 将数据进行类型转换为float
print(data.shape)
# 这些数据前十三个是x，后一个是y
# 切分数据
Y = data[:, -1]
X = data[:, 0:-1]
# 区分测验集和练习集，界说前496个样本为练习集的样本
X_train = X[0:496, ...]
Y_train = Y[0:496, ...]
X_test = X[496:, ...]
Y_test = Y[496:, ...]
print(X_train.shape)
print(Y_train.shape)
print(X_test.shape)
print(Y_test.shape)
net = torch.load("model.pkl")
loss_func = torch.nn.MSELoss()
# test
x_data = torch.tensor(X_test, dtype=torch.float32)
y_data = torch.tensor(Y_test, dtype=torch.float32)
pred = net.forward(x_data)
pred = torch.squeeze(pred)
loss_test = loss_func(pred, y_data) * 0.001
print("loss_test:{}".format(loss_test))

运转成果：

loss_test:0.006096621975302696

经过save和load model就能够完成对模型的保存

Pytorch——波士顿房价预测模型搭建

1.1 Pytorch建立神经网络根本组成模块

1.2 Pytorch完成波士顿房价猜测模型建立

1.2.1 数据集加载

1.2.2 数据集的区分

1.2.3 界说网络结构

1.2.4 界说loss和optimizer

1.2.5 界说练习的进程

1.2.6 保存模型

1.2.7 推理

更多文章

评估基准在人工智能研究中的重要性

Nop入门：动态SQL管理

Android gralde 脚本迁移到 Kotlin DSL

AST-GREP：基于语法和语义的代码搜索与替换，你需要了解一下！