本文已参与「新人创造礼」活动,一起敞开创造之路。
前言
PyTorch是目前最受欢迎的深度学习结构之一,本文介绍PyTorch中的一些基本概念及操作,包含张量、主动微分等,最后经过练习一个用于图画分类的神经网络简略介绍用PyTorch结构练习神经网络的基本流程,期望对新入门PyTorch的读者有所帮助。
本文首要参阅PyTorch官方文档及网络上的一些教程,如有侵权,请联络删去。
Tensor(张量)
Tensor是一种专用的数据结构,相似于数组和矩阵。在 PyTorch 中,咱们运用张量对模型的输入和输出以及模型的参数进行编码。
Tensor与NumPy的ndarray相似,不同的是PyTorch中的 Tensor 能够在 GPU 或其他专用硬件上运行以加快核算。
importtorch
importnumpyasnp
Tensor有几种初始化方法:
#用其他数据进行初始化
data=[[1,2],[3,4]]
x_data=torch.tensor(data)
#用NumPy数组进行初始化
np_array=np.array(data)
x_np=torch.from_numpy(np_array)
#用其他Tensors进行初始化
x_ones=torch.ones_like(x_data)#与x_data的特点坚持特性共同
x_rand=torch.rand_like(x_data,dtype=torch.float)#另外指定数据类型
Tensor的特点包含: shape, datatype, device等
tensor=torch.rand(3,4)
print("Shapeoftensor:",tensor.shape)
print("Datatypeoftensor:",tensor.dtype)
print("tensorisstoredon:",tensor.device)
Shape of tensor: torch.Size([3, 4])
Datatype of tensor: torch.float32
tensor is stored on: cpu
咱们能够把Tensor放到GPU上核算:
iftorch.cuda.is_available():
tensor=tensor.to('cuda')
print("tensorisstoredon:",tensor.device)
tensor is stored on: cuda:0
PyTorch中支撑超过100个Tensor操作,包含转置、索引、切片、数学运算、线性代数、随机采样等等。
print(tensor,"\n")
#切片
print(tensor[:,1],'\n')
#对应元素相乘
print("tensor.mul(tensor):\n{}\n".format(tensor.mul(tensor)))
#或许
print("tensor*tensor:\n{}\n".format(tensor*tensor))
#矩阵乘法
print("tensor.matmul(tensor.T):\n{}\n".format({tensor.matmul(tensor.T)}))
#或许:
print("tensor@tensor.T:\n{}\n".format({tensor@tensor.T}))
#零内存复制的操作
tensor.add_(5)
print(tensor)
tensor([[0.7988, 0.5616, 0.4597, 0.0974],
[0.9885, 0.7940, 0.4081, 0.4274],
[0.5799, 0.3978, 0.6393, 0.6365]], device='cuda:0')
tensor([0.5616, 0.7940, 0.3978], device='cuda:0')
tensor.mul(tensor):
tensor([[0.6381, 0.3154, 0.2114, 0.0095],
[0.9771, 0.6305, 0.1665, 0.1826],
[0.3363, 0.1583, 0.4087, 0.4051]], device='cuda:0')
tensor * tensor:
tensor([[0.6381, 0.3154, 0.2114, 0.0095],
[0.9771, 0.6305, 0.1665, 0.1826],
[0.3363, 0.1583, 0.4087, 0.4051]], device='cuda:0')
tensor.matmul(tensor.T):
{tensor([[1.1744, 1.4648, 1.0426],
[1.4648, 1.9568, 1.4220],
[1.0426, 1.4220, 1.3084]], device='cuda:0')}
tensor @ tensor.T:
{tensor([[1.1744, 1.4648, 1.0426],
[1.4648, 1.9568, 1.4220],
[1.0426, 1.4220, 1.3084]], device='cuda:0')}
tensor([[5.7988, 5.5616, 5.4597, 5.0974],
[5.9885, 5.7940, 5.4081, 5.4274],
[5.5799, 5.3978, 5.6393, 5.6365]], device='cuda:0')
PyTorch中的Tensor与NumPy中的数组能够相互转化,并且会同享内存方位,更改其中一个的内容同样会影响另一个的值。
t=torch.ones(3)
n=t.numpy()
print("t:",t)
print("n:",n)
#更改Tensor会影响NumPy数组
t.add_(1)
print("\nt:",t)
print("n:",n)
#Tensor由NumPy数组初始化
n=np.ones(6)
t=torch.from_numpy(n)
print("\nn:",n)
print("t:",t)
#更改NumPy数组会影响Tensor
np.add(n,1,out=n)
print("\nn:",n)
print("t:",t)
t: tensor([1., 1., 1.])
n: [1. 1. 1.]
t: tensor([2., 2., 2.])
n: [2. 2. 2.]
n: [1. 1. 1. 1. 1. 1.]
t: tensor([1., 1., 1., 1., 1., 1.], dtype=torch.float64)
n: [2. 2. 2. 2. 2. 2.]
t: tensor([2., 2., 2., 2., 2., 2.], dtype=torch.float64)
Autograd(主动微分)机制
Autograd包是PyTorch中一切神经网络的中心,它为Tensors上的一切操作供给主动微分,为神经网络练习进程中的反向传达供给驱动力。关于每一个Tensor,如果设置它的特点 .requires_grad 为 True,那么Autograd将会追踪关于该张量的一切操作。当完结核算后能够经过调用.backward(),来主动核算一切的梯度。这个张量的一切梯度将会主动累加到.grad特点中。
x=torch.ones(3,3)
ifnotx.requires_grad:
x.requires_grad_(True)
print(x)
tensor([[1., 1., 1.],
[1., 1., 1.],
[1., 1., 1.]], requires_grad=True)
对Tensor做一些操作:
y=x*2
print(y,'\n')
z=y*y*2
print(z)
tensor([[2., 2., 2.],
[2., 2., 2.],
[2., 2., 2.]], grad_fn=<MulBackward0>)
tensor([[8., 8., 8.],
[8., 8., 8.],
[8., 8., 8.]], grad_fn=<MulBackward0>)
进行横竖传达,求x的梯度x.grad:
z.backward(x)
print('x.grad:{}\n'.format(x.grad))
x.grad: tensor([[16., 16., 16.],
[16., 16., 16.],
[16., 16., 16.]])
能够经过将代码块包装在 with torch.no_grad(): 中,来阻止Autograd去跟踪设置了.requires_grad=True 的Tensor的历史记录:
withtorch.no_grad():
print((x*2).requires_grad)
False
神经网络
在PyTorch中咱们能够经过torch.nn包来构建神经网络。一个典型的神经网络练习进程如下:
- 构建一个神经网络;
- 经过神经网络处理输入数据(Forward);
- 依据神经网络输出的结果和真实的值,由丢失函数核算loss;
- 将梯度反向传达给网络的参数(Backward);
- 更新网络的权重;
- 在数据集上迭代2-5步的进程直至练习完结。
1. 界说神经网络
importtorch
importtorch.nnasnn
importtorch.nn.functionalasF
#nn.Module是一切神经网络模型的基类
classNet(nn.Module):
def__init__(self):
super(Net,self).__init__()
self.conv1=nn.Conv2d(1,6,5)#输入1通道,输出6通道,5x5卷积核
self.conv2=nn.Conv2d(6,16,5)
self.fc1=nn.Linear(16*5*5,120)
self.fc2=nn.Linear(120,84)
self.fc3=nn.Linear(84,10)
defforward(self,x):
#2x2Maxpooling
x=F.max_pool2d(F.relu(self.conv1(x)),(2,2))
x=F.max_pool2d(F.relu(self.conv2(x)),(2,2))
x=x.view(-1,self.num_flat_features(x))
x=F.relu(self.fc1(x))
x=F.relu(self.fc2(x))
x=self.fc3(x)
returnx
defnum_flat_features(self,x):
size=x.size()[1:]#除去批处理维度的其他一切维度
num_features=1
forsinsize:
num_features*=s
returnnum_features
net=Net()
print(net)
Net(
(conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
(conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
(fc1): Linear(in_features=400, out_features=120, bias=True)
(fc2): Linear(in_features=120, out_features=84, bias=True)
(fc3): Linear(in_features=84, out_features=10, bias=True)
)
咱们只需求界说 forward 函数,能够在中运用任何针对张量的操作和核算。backward函数用来核算导数,会经过autograd主动界说。
2. 输入数据,前向传达
给网络输入32×32的数据:
input=torch.randn(1,1,32,32)
output=net(input)
print(output)
tensor([[-0.1158, -0.0385, 0.1082, 0.0346, -0.0512, 0.0358, 0.1280, 0.1219,
-0.0250, 0.0036]], grad_fn=<AddmmBackward>)
3. 核算loss
target=torch.randn(10)#运用模拟数据
target=target.view(1,-1)#使目标值与数据值尺寸共同
criterion=nn.MSELoss()
loss=criterion(output,target)#运用均方差错丢失函数
print(loss)
tensor(1.6162, grad_fn=<MseLossBackward>)
4. 反向传达
首要需求清零现有的梯度,否则当前梯度会与已有的梯度累加,然后再调用loss.backward()来反向传达差错。
net.zero_grad()#清零一切参数的梯度缓存
print('conv1.bias.gradbeforebackward:')
print(net.conv1.bias.grad)
loss.backward()
print('conv1.bias.gradafterbackward:')
print(net.conv1.bias.grad)
conv1.bias.grad before backward:
None
conv1.bias.grad after backward:
tensor([ 0.0106, -0.0016, 0.0181, 0.0205, 0.0186, -0.0276])
5. 更新权重
假设选用随机梯度下降(SGD)法来更新神经网络的权重:
importtorch.optimasoptim
#创立SGD优化器
optimizer=optim.SGD(net.parameters(),lr=0.01)
optimizer.step()#更新权重
练习图画分类器
torchvision包中包含了核算机视觉中常用的Imagenet、CIFAR10、MNIST等数据集,能够经过torchvision.datasets来引证。一起PyTorch中供给数据加载器torch.utils.data.DataLoader用于加载数据集。
在本例程中,咱们运用CIFAR10数据集来练习一个神经网络,用于对图画进行分类。CIFAR10数据集有10个类别,每张图片都是32×32像素的3通道彩色图片。
cifar10.png
1. 加载CIFAR10数据集并进行标准化
首要导入需求的包:
importtorch
importtorchvision
importtorchvision.transformsastransforms
用torchvision加载数据集后输出的是范围在[0, 1]之间的PILImage,咱们需求将其标准化为范围在[-1, 1]之间的张量。
transform=transforms.Compose(
[transforms.ToTensor(),
transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))])
trainset=torchvision.datasets.CIFAR10(root='./data',train=True,download=True,transform=transform)
trainloader=torch.utils.data.DataLoader(trainset,batch_size=4,shuffle=True,num_workers=2)
testset=torchvision.datasets.CIFAR10(root='./data',train=False,download=True,transform=transform)
testloader=torch.utils.data.DataLoader(testset,batch_size=4,shuffle=False,num_workers=2)
classes=('airplane','automobile','bird','cat',
'deer','dog','frog','horse','ship','truck')
Files already downloaded and verified
Files already downloaded and verified
2. 界说神经网络
classNet(nn.Module):
def__init__(self):
super(Net,self).__init__()
self.conv=nn.Sequential(
nn.Conv2d(3,6,5),
nn.ReLU(),
nn.MaxPool2d(2,2),
nn.Conv2d(6,16,5),
nn.ReLU(),
nn.MaxPool2d(2,2)
)
self.fc=nn.Sequential(
nn.Linear(16*5*5,120),
nn.ReLU(),
nn.Linear(120,84),
nn.ReLU(),
nn.Linear(84,10)
)
defforward(self,x):
feature=self.conv(x)
output=self.fc(feature.view(x.shape[0],-1))
returnoutput
net=Net()
3. 界说丢失函数和优化器
importtorch.optimasoptim
#运用交叉熵丢失函数
criterion=nn.CrossEntropyLoss()
#运用SGD优化器
optimizer=optim.SGD(net.parameters(),lr=0.001,momentum=0.9)
4. 练习网络
经过数据加载器,将练习集数据输入给网络和优化器进行练习:
total_epoches=5
forepochinrange(total_epoches):
totoal_loss=0.0
i=0
fordataintrainloader:
#读取数据
inputs,labels=data
#对网络一切参数的梯度进行清零
optimizer.zero_grad()
#Forward
outputs=net(inputs)
#核算丢失
loss=criterion(outputs,labels)
#Backward
loss.backward()
#更新参数
optimizer.step()
totoal_loss+=loss.item()
#每5000个batch打印一次
ifi%5000==4999:
print('[%d,%5d]loss:%.3f'%(epoch+1,i+1,totoal_loss/5000))
totoal_loss=0.0
i+=1
print('练习完结')
[1, 5000] loss: 2.036
[1, 10000] loss: 1.607
[2, 5000] loss: 1.384
[2, 10000] loss: 1.326
[3, 5000] loss: 1.216
[3, 10000] loss: 1.177
[4, 5000] loss: 1.103
[4, 10000] loss: 1.094
[5, 5000] loss: 1.012
[5, 10000] loss: 1.034
练习完结
保存练习好的模型:
SAVE_PATH='./cifar10_net.pth'
torch.save(net.state_dict(),SAVE_PATH)
在测试集上测试模型的效果:
net=Net()
net.load_state_dict(torch.load(SAVE_PATH))
correct=0
total=0
withtorch.no_grad():
fordataintestloader:
images,labels=data
outputs=net(images)
_,predicted=torch.max(outputs.data,1)
total+=labels.size(0)
correct+=(predicted==labels).sum().item()
print('Theaccuracyofthenetworkonthe%dtestimages:%d%%'%(total,100*correct/total))
The accuracy of the network on the 10000 test images: 62 %
在GPU上练习模型
device=torch.device("cuda:0"iftorch.cuda.is_available()else"cpu")
#如果有多个GPU,则选用数据并行的方法在多个GPU上进行练习
iftorch.cuda.device_count()>1:
#默许在全部GPU上进行练习
net=nn.DataParallel(net)
#或许在指定的GPU上进行练习
#net=nn.DataParallel(net,device_ids=[0,1])
#还能够先经过环境变量设置GPU,再调用nn.DataParallel
#os.environ["CUDA_VISIBLE_DEVICES"]='1,2'
net.to(device)
Net(
(conv): Sequential(
(0): Conv2d(3, 6, kernel_size=(5, 5), stride=(1, 1))
(1): ReLU()
(2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(3): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
(4): ReLU()
(5): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
)
(fc): Sequential(
(0): Linear(in_features=400, out_features=120, bias=True)
(1): ReLU()
(2): Linear(in_features=120, out_features=84, bias=True)
(3): ReLU()
(4): Linear(in_features=84, out_features=10, bias=True)
)
)
如果在GPU上练习,那么练习数据也需求送入到GPU上
inputs,labels=inputs.to(device),labels.to(device)