YOLO & Attention

2019-04-13 | 字数统计: 556字 | 阅读时长: 2分

阅读次数:

deep learning YOLO Attention

这周准备了3场笔试，所以学习新知识的时间不多。主要将Andrew Ng的深度学习课程的最后一节序列模型和注意力机制学完了，同时回顾了一下前面学习的YOLO算法，下面做一个总结。。

YOLO算法，首先将图像网格化，然后将目标按中心所在位置分配给所在格子，然后利用卷积网络的参数共享特性，只需要一次卷积就可以得出结果，加速计算，能做到实时。
对每个格子都预测B个bounding boxes，每个bounding box都包含5个预测值：x,y,w,h和confidence，在原文中作者取S=7，B=2.
为了解决有很多检测框的问题，h和confidence，保留最大的，其他的删除。
为了解决有多个目标出现在同一个grid里的情况，通过预先设置Anchor box模板，来解决，假设会有2个目标同时出现在同一个grid中，行人和汽车，就设置两个Anchor box1和Anchor box2，同时将输出y，这里y里面的元素就会有10个了。再对于每个类别，单独运行非极大值抑制，就可以得到最后的结果。
如何选择anchor box：
1、可以人工的指定Anchor box的形状，使其包含训练集中的大多数样本，个数一般5-10个左右。
2、还有更好的做法，k-means算法，对形状进行聚类。