写在前面的话:文章内容来源于但不限于网络、书籍、个人心得体会等,意在总结和方便各位同行快速参考,共同学习进步,记录自己的问题。错误在所难免,有请各位批评斧正。如有侵权,烦请第一时间通知,我会立即删除相关内容,万分感谢!
为每个anchor分配一个二进制标签(是/否目标)
1)任意与ground truth有大于0.7的IoU交叠的anchor赋值为1
2)选取ground truth的IoU最大的anchor赋值为1
3)分配负标签给与所有ground truth包围盒的IoU比率都低于0.3的anchor
一个ground truth包围盒可能分配正标签给多个anchor
每个卷积特征映射大约2000个anchor
对一个图像的损失函数:
其中:
i是一个mini-batch中anchor的索引;
Pi是anchor i是目标的预测概率;
ground truth标签Pi* 就是1,如果anchor为负,Pi* 就是0;
ti是一个向量,表示预测的包围盒的4个参数化坐标;
ti* 是与正anchor对应的ground truth的坐标向量。
Ncls:mini-batch的大小 (256 )
Nreg:anchor位置的数量 (大约2400) λ=10
分类损失函数:
位置损失函数:
简单网络目标检测速度达到17fps,在PASCAL VOC上准确率为59.9%;复杂网络达到5fps,准确率78.8%
缺点:
1.无法达到实时
2.预先获取候选区域,在对每个proposal分类计算量比较大