Faster R-CNN学习记录

    xiaoxiao2022-07-01  122

    写在前面的话:文章内容来源于但不限于网络、书籍、个人心得体会等,意在总结和方便各位同行快速参考,共同学习进步,记录自己的问题。错误在所难免,有请各位批评斧正。如有侵权,烦请第一时间通知,我会立即删除相关内容,万分感谢! 

    为每个anchor分配一个二进制标签(是/否目标)

    1)任意与ground truth有大于0.7的IoU交叠的anchor赋值为1

    2)选取ground truth的IoU最大的anchor赋值为1

    3)分配负标签给与所有ground truth包围盒的IoU比率都低于0.3的anchor

    一个ground truth包围盒可能分配正标签给多个anchor 

                                                                        每个卷积特征映射大约2000个anchor 

    对一个图像的损失函数:

    其中:

         i是一个mini-batch中anchor的索引;          

         Pi是anchor i是目标的预测概率;          

         ground truth标签Pi* 就是1,如果anchor为负,Pi* 就是0;          

        ti是一个向量,表示预测的包围盒的4个参数化坐标;            

        ti* 是与正anchor对应的ground truth的坐标向量。            

        Ncls:mini-batch的大小  (256 )            

        Nreg:anchor位置的数量  (大约2400)          λ=10 

    分类损失函数:

    位置损失函数:

     简单网络目标检测速度达到17fps,在PASCAL VOC上准确率为59.9%;复杂网络达到5fps,准确率78.8%

    缺点:

              1.无法达到实时

              2.预先获取候选区域,在对每个proposal分类计算量比较大

     

     

     

     

     

     

     

     

     

    最新回复(0)