PaddlePaddle复现PANet在文字识别中的应用效果如何?
- 内容介绍
- 文章标签
- 相关推荐
本文共计572个文字,预计阅读时间需要3分钟。
相关专题内容,请直接输入关键词查询,避免使用图片解答、避免使用俚语,不超过100字。
Discrimination Loss
Ldis用于是不同文本实例的kernel的loss,其作用是保证任意两个kernel之间的距离> δdis。即对于每一个文本实例kernel,分别计算和其他kernel的距离,公式如上所示。
其中,δdis是一个常量,默认3。当两个kernel之间的距离∣∣G(Ki)−G(Kj)∣∣> δdis时,就表示这两个kernel的距离已经足够远了。
另外,在训练过程中,Ltex的计算使用的OHEM,正负像素之比是1:3,计算Lker,Lagg和Ldis时均只考虑ground truth内的文本像素。
后处理
- 从kernel中通过连通域确定初始的文本实例集合K。
- 对于每一个文本实例Ki,按4方向从text_region中融合文本像素。融合条件: 文本像素点p和K之间similarity vectors的欧式距离< d (测试过程中d默认为6)。
- 重复步骤2直到text_region没有文本像素。
本文共计572个文字,预计阅读时间需要3分钟。
相关专题内容,请直接输入关键词查询,避免使用图片解答、避免使用俚语,不超过100字。
Discrimination Loss
Ldis用于是不同文本实例的kernel的loss,其作用是保证任意两个kernel之间的距离> δdis。即对于每一个文本实例kernel,分别计算和其他kernel的距离,公式如上所示。
其中,δdis是一个常量,默认3。当两个kernel之间的距离∣∣G(Ki)−G(Kj)∣∣> δdis时,就表示这两个kernel的距离已经足够远了。
另外,在训练过程中,Ltex的计算使用的OHEM,正负像素之比是1:3,计算Lker,Lagg和Ldis时均只考虑ground truth内的文本像素。
后处理
- 从kernel中通过连通域确定初始的文本实例集合K。
- 对于每一个文本实例Ki,按4方向从text_region中融合文本像素。融合条件: 文本像素点p和K之间similarity vectors的欧式距离< d (测试过程中d默认为6)。
- 重复步骤2直到text_region没有文本像素。

