PaddlePaddle复现PANet在文字识别中的应用效果如何?

2026-05-07 23:471阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计572个文字,预计阅读时间需要3分钟。

PaddlePaddle复现PANet在文字识别中的应用效果如何?

相关专题内容,请直接输入关键词查询,避免使用图片解答、避免使用俚语,不超过100字。

Discrimination Loss 

       

LdisLdis用于是不同文本实例的kernel的loss,其作用是保证任意两个kernel之间的距离> δdisδdis。即对于每一个文本实例kernel,分别计算和其他kernel的距离,公式如上所示。

其中,δdisδdis是一个常量,默认3。当两个kernel之间的距离G(Ki)G(Kj)∣∣G(Ki)−G(Kj)∣∣> δdisδdis时,就表示这两个kernel的距离已经足够远了。

另外,在训练过程中,LtexLtex的计算使用的OHEM,正负像素之比是1:3,计算LkerLker,LaggLagg和LdisLdis时均只考虑ground truth内的文本像素。

后处理

  1. 从kernel中通过连通域确定初始的文本实例集合KK。
  2. 对于每一个文本实例KiKi,按4方向从text_region中融合文本像素。融合条件: 文本像素点pp和KK之间similarity vectors的欧式距离< dd (测试过程中dd默认为6)。
  3. 重复步骤2直到text_region没有文本像素。

本文共计572个文字,预计阅读时间需要3分钟。

PaddlePaddle复现PANet在文字识别中的应用效果如何?

相关专题内容,请直接输入关键词查询,避免使用图片解答、避免使用俚语,不超过100字。

Discrimination Loss 

       

LdisLdis用于是不同文本实例的kernel的loss,其作用是保证任意两个kernel之间的距离> δdisδdis。即对于每一个文本实例kernel,分别计算和其他kernel的距离,公式如上所示。

其中,δdisδdis是一个常量,默认3。当两个kernel之间的距离G(Ki)G(Kj)∣∣G(Ki)−G(Kj)∣∣> δdisδdis时,就表示这两个kernel的距离已经足够远了。

另外,在训练过程中,LtexLtex的计算使用的OHEM,正负像素之比是1:3,计算LkerLker,LaggLagg和LdisLdis时均只考虑ground truth内的文本像素。

后处理

  1. 从kernel中通过连通域确定初始的文本实例集合KK。
  2. 对于每一个文本实例KiKi,按4方向从text_region中融合文本像素。融合条件: 文本像素点pp和KK之间similarity vectors的欧式距离< dd (测试过程中dd默认为6)。
  3. 重复步骤2直到text_region没有文本像素。