Faster R-CNN学习记录

xiaoxiao2022-07-01 187

写在前面的话：文章内容来源于但不限于网络、书籍、个人心得体会等，意在总结和方便各位同行快速参考，共同学习进步，记录自己的问题。错误在所难免，有请各位批评斧正。如有侵权，烦请第一时间通知，我会立即删除相关内容，万分感谢！

为每个anchor分配一个二进制标签（是/否目标）

1）任意与ground truth有大于0.7的IoU交叠的anchor赋值为1

2）选取ground truth的IoU最大的anchor赋值为1

3）分配负标签给与所有ground truth包围盒的IoU比率都低于0.3的anchor

一个ground truth包围盒可能分配正标签给多个anchor

每个卷积特征映射大约2000个anchor

对一个图像的损失函数：

其中：

i是一个mini-batch中anchor的索引；

Pi是anchor i是目标的预测概率；

ground truth标签Pi* 就是1，如果anchor为负，Pi* 就是0；

ti是一个向量，表示预测的包围盒的4个参数化坐标；

ti* 是与正anchor对应的ground truth的坐标向量。

Ncls：mini-batch的大小（256 ）

Nreg：anchor位置的数量（大约2400） λ=10

分类损失函数：

位置损失函数：

简单网络目标检测速度达到17fps，在PASCAL VOC上准确率为59.9%；复杂网络达到5fps，准确率78.8%

缺点：

1.无法达到实时

2.预先获取候选区域，在对每个proposal分类计算量比较大

最新回复(0)