前言 目前,根据机器视觉的外表缺点已经在各个工业范畴广泛取代人工视觉检测,包括3C、汽车、家电、机械制造、半导体电子、化工、制药、航空航天、轻工等职业。许多根据深度学习的缺点检测办法也被广泛应用于各种工业场景。
本文的代码实战,是根据YOLOv5目标检测算法,在NEU外表缺点数据集上完成钢材外表缺点检测。要求Python>=3.7.0,PyTorch>=1.7。
本文转载自笑傲算法江湖
作者 | Ctrl CV
欢迎关注大众号CV技能攻略,专心于计算机视觉的技能总结、最新技能跟踪、经典论文解读、CV招聘信息。
计算机视觉入门1v3辅导班
一、YOLOv5
选取YOLOv5,一方面是因为从终究效果来看YOLOv5已经相当优秀,是发展的比较完备、运用比较广泛的一个版别;而更重要的是YOLOv5的调用、练习和猜测都十分方便,为初学者供给了杰出的练手工具。YOLOv5的另一个特色便是它为不同的设备需求和不同的应用场景供给了巨细和参数数量不同的网络。
如图所示,大一点的模型比方YOLOv5l和YOLOv5x参数更多,在大规模的COCO数据集上有更高的猜测准确率;而小模型比方YOLOv5n或YOLOv5s占空间更小,合适布置在移动设备上,且推理速度更快,合适于高帧 率视频的实时检测。
参考代码:github.com/ultralytics…
二、钢材外表缺点数据集
东北大学(NEU)外表缺点数据集,收集了热轧带钢6种典型的外表缺点,即轧内垢(RS)、斑块(Pa)、裂纹(Cr)、点蚀面(PS)、夹杂物(In)和划痕(Sc)。该数据库包括1800张灰度图画:6种不同类型的典型外表缺点各300个样本。
下图为6种典型外表缺点的样本图画,每张图画的原始分辨率为200200像素。从图中,咱们能够清楚地观察到类内缺点在外观上存在较大差异,例如划痕(终究一列)可能是水平划痕、垂直划痕和歪斜划痕等。与此一起,类间缺点也具有类似的特征,如滚积垢、裂纹和坑状外表。此外,由于光照和资料改变的影响,类内缺点图画的灰度会发生改变。总归,NEU外表缺点数据库包括两个难题,即类内缺点存在较大外观差异,类间缺点具有类似方面,缺点图画受到光照和资料改变的影响。
对于缺点检测任务,数据集供给了标示,标示了每个图画中缺点的类别和位置。下图展现了数据集上的一些检测成果示例。对于每个缺点,黄色框是表明其位置的边界框,绿色标签是类分数。
数据地址:faculty.neu.edu.cn/songkechen/…
三、YOLOv5数据格局
YOLOv5标签文件中每一行的数据为class, x, y, w, h,其间class是该物体的类别,x,y是检测框中心坐标,w,h是检测框的宽和高。
四、格局转化voc2yolo
从网上获取一些目标检测的数据集资源标签的格局都是VOC(xml格局)的,而YOLOv5练习所需求的文件格局是YOLO(txt格局)的,这儿就需求对xml格局的标签文件转化为txt文件。一起练习自己的YOLOv5检测模型的时分,数据集需求划分为练习集和验证集。这儿供给了一份代码将xml格局的标示文件转化为txt格局的标示文件,并按比例划分为练习集和验证集。
import xml.etree.ElementTree as ET
import os
from os import getcwd
from tqdm import tqdm
classes = ["crazing", "inclusion", "patches", "pitted_surface", "rolled-in_scale", "scratches"]
def convert(size, box):
dw = 1. / size[0]
dh = 1. / size[1]
x = (box[0] + box[1]) / 2.0
y = (box[2] + box[3]) / 2.0
w = box[1] - box[0]
h = box[3] - box[2]
x = x * dw
w = w * dw
y = y * dh
h = h * dh
return (x, y, w, h)
def convert_annotation(image_id):
in_file = './xml/%s.xml' % (image_id)
out_file = open('./labels/%s.txt' % (image_id), 'w')
tree = ET.parse(in_file)
root = tree.getroot()
size = root.find('size')
w = int(size.find('width').text)
h = int(size.find('height').text)
for obj in root.iter('object'):
difficult = obj.find('Difficult').text
cls = obj.find('name').text
if cls not in classes or int(difficult) == 1:
continue
cls_id = classes.index(cls)
xmlbox = obj.find('bndbox')
b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
float(xmlbox.find('ymax').text))
bb = convert((w, h), b)
out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
if __name__ == "__main__":
wd = getcwd()
print(wd)
if not os.path.exists('./labels/'):
os.makedirs('./labels/')
image_ids = os.listdir('./datasets')
for image_id in tqdm(image_ids):
convert_annotation(image_id.split('.')[0])
五、练习
YOLOv5是经过yaml格局的装备文件来找到对应的练习测验数据,因此在练习前需求对该文件进行简单装备。咱们能够经过修正YOLOv5的装备文件来完成,需求修正的装备文件有两个,咱们先仿制一份data/coco.yaml,这儿将其重命名为my_coco.yaml
- 在
download
前加上一个#
注释掉这段代码 - 将
train
、val
、test
修正为自己的途径,以train为
例,NEU-DET/train/images/
- 将
nc
修正为数据的类别数,如钢材外表缺点,故修正为6 - 将
names
修正自己数据的类名,如names: [“crazing”, “inclusion”, “patches”, “pitted_surface”, “rolled-in_scale”, “scratches”]
下一个需求修正的文件为模型装备文件,在models文件夹中有四个模型的装备文件:yolov5s.yaml
、yolov5m.yaml
、yolov5l.yaml
和yolov5x.yaml
,能够根据需求选择相应的模型,这儿以yolo5s.yaml
为例,翻开文件,修正文件中的nc
为自己的类别数即可。
python train.py --weights weights/yolov5s.pt --cfg models/yolov5s.yaml --data data/my_coco.yaml --epoch 30 --batch-size 32
六、测验
练习结束后,在runs/exp0
文件夹下会自动生成练习成果,其间包括模型权重、混淆矩阵、PR曲线等。
进行测验时,翻开detect.py文件,修正source为检测图片的文件夹,运行之后,在run->detect中输出检测成果;或者经过如下办法进行测验。
python detect.py --source ./data/images/example.jpg --weights runs/exp0/weights/best.pt --conf-thres 0.25
终究猜测的成果如下,能够看出模型缺点检测效果。
本文仅做学术共享,如有侵权,请联系删文。
欢迎关注大众号CV技能攻略,专心于计算机视觉的技能总结、最新技能跟踪、经典论文解读、CV招聘信息。
计算机视觉入门1v3辅导班
【技能文档】《从零建立pytorch模型教程》122页PDF下载
QQ沟通群:444129970。群内有大佬担任回答我们的日常学习、科研、代码问题。
其它文章
深度了解变分自编码器(VAE) | 从入门到通晓
计算机视觉入门1v3辅导班
计算机视觉沟通群
用于超大图画的练习战略:Patch Gradient Descent
CV小常识评论与分析(5)究竟什么是Latent Space?
【免费送书活动】关于语义切割的亿点考虑
新方案:从过错中学习,点云切割中的自我规范化层次语义表明
Transformer沟通群
经典文章:Transformer是怎么进军点云学习范畴的?
CVPR 2023 Workshop | 首个大规模视频全景切割比赛
怎么更好地应对下流小样本图画数据?不平衡数据集的建模的技巧和策
U-Net在2022年相关研究的论文推荐
用少于256KB内存完成边缘练习,开支不到PyTorch千分之一
PyTorch 2.0 重磅发布:一行代码提速 30%
Hinton 最新研究:神经网络的未来是前向-前向算法
聊聊计算机视觉入门
FRNet:上下文感知的特征强化模块
DAMO-YOLO | 超越所有YOLO,兼顾模型速度与精度
《医学图画切割》综述,胪陈六大类100多个算法
怎么高效完成矩阵乘?万文长字带你从CUDA初学者的视点入门
近似乘法对卷积神经网络的影响
BT-Unet:医学图画切割的自监督学习框架
语义切割该怎么走下去?
轻量级模型设计与布置总结
从CVPR22动身,聊聊CAM是怎么激活咱们文章的热度!
入门必读系列(十六)经典CNN设计演变的要害总结:从VGGNet到EfficientNet
入门必读系列(十五)神经网络不work的原因总结
入门必读系列(十四)CV论文常见英语单词总结
入门必读系列(十三)高效阅览论文的办法
入门必读系列(十二)池化各要点与各办法总结
TensorRT教程(三)TensorRT的装置教程
TensorRT教程(一)初度介绍TensorRT
TensorRT教程(二)TensorRT进阶介绍