1、难的是需要搞清楚v5的原理以及如何将最新的一些算法加入到v5,针对性地提高自己训练集的效果。如果你够厉害的话也可以针对v5的一个板块提出自己新的算法,比如改进CIOU之类的。文献综述好好写,论文格式好好弄。
解决方法:png--- jpg格式 使用 ls和 xargs命令来转换 PNG 和 JPG ls 命令 可以列出所有的 png 图像文件,xargs使得可以从标准输入构建和执行convert命令,从而将所有.png图像转换为.jpg 图像。
YOLO2尝试利用ImageNet非常大量的分类样本,联合COCO的对象检测数据集一起训练,使得YOLO2即使没有学过很多对象的检测样本,也能检测出这些对象。
当我们测试 yolov5l.pt 这个模型进行预训练的时候,会报 Unable to find a valid cuDNN algorithm to run convolution 这个错误,当你重新安装 cudnn 后仍然不能解决问题。
YOLO v2 对 YOLO v1 的缺陷进行优化,大幅度高了检测的性能,但仍存在一定的问题, 如无法解决重叠问题的分类等。
这样训练得到的模型,在检测时用448*448的图像作为输入可以顺利检测。
1、YOLOv1使用ImageNet的图像分类样本采用224x224作为输入,来训练CNN卷积层。然后在训练对象检测时,检测用的图像样本采用更高分辨率的448x448的图像作为输入。但这样切换对模型性能有一定影响。
2、在训练之前,先在ImageNet上进行了预训练,其预训练的分类模型采用图中前20个卷积层,然后添加一个average-pool层和全连接层。预训练之后,在预训练得到的20层卷积层之上加上随机初始化的4个卷积层和2个全连接层。
3、检测通常需要有细密纹理的视觉信息,所以为提高图像精度,在训练检测模型时,将输入图像分辨率从224 × 224 resize到448x448。训练时B个bbox的ground truth设置成一样的.YOLOv1优缺点 最后有必要总结一下YOLO的优缺点。
4、YOLOv1使用端到端的网络训练模型,速度快,但准确度相对低些,主要用于实时检测,例如视频目标检测。 由于YOLOv1是端到端进行训练,因此YOLOv1只有一条单一的网络分支。
5、ms每秒左右。由于yolov5s模型数据集都比较小,使用cpu训练1个epoch也就一两分钟平均,300ms每秒,每轮训练后更新模型验证精度。
YOLO是一种深度学习算法,可以检测给定图像中的任何物体,并返回识别的物体的位置和类别。YOLO可以整体上理解图像,而不是细分成多个部分,从而大大缩短检测和识别的时间。
YOLOv3是YOLO(YouOnlyLookOnce)系列目标检测算法中的第三版,相比之前的算法,尤其是针对小目标,精度有显著提升。 yoloV3的流程如下图所示,对于每一幅输入图像,YOLOv3会预测三个不同尺度的输出,目的是检测出不同大小的目标。
yolo容易漏检,但ssd不容易。YOLO虽然能够达到实时的效果,但是其mAP与刚面提到的的结果有很大的差距,每个网格只预测一个物体,容易造成漏检。