PaddlePaddle复现PANet在文字识别中的应用效果如何？

2026-05-07 23:471阅读0评论SEO问题

本文共计572个文字，预计阅读时间需要3分钟。

相关专题内容，请直接输入关键词查询，避免使用图片解答、避免使用俚语，不超过100字。

$L d i s$ Ldis用于是不同文本实例的kernel的loss，其作用是保证任意两个kernel之间的距离> $δ d i s$ δdis。即对于每一个文本实例kernel，分别计算和其他kernel的距离，公式如上所示。

其中， $δ d i s$ δdis是一个常量，默认3。当两个kernel之间的距离 $∣ ∣ G (K i) - G (K j) ∣ ∣$ ∣∣G(Ki)−G(Kj)∣∣> $δ d i s$ δdis时，就表示这两个kernel的距离已经足够远了。

另外，在训练过程中， $L t e x$ Ltex的计算使用的OHEM，正负像素之比是1:3，计算 $L k e r$ Lker， $L a g g$ Lagg和 $L d i s$ Ldis时均只考虑ground truth内的文本像素。

后处理

从kernel中通过连通域确定初始的文本实例集合 $K$ K。
对于每一个文本实例 $K i$ Ki，按4方向从text_region中融合文本像素。融合条件: 文本像素点 $p$ p和 $K$ K之间similarity vectors的欧式距离< $d$ d (测试过程中 $d$ d默认为6)。
重复步骤2直到text_region没有文本像素。

本文共计572个文字，预计阅读时间需要3分钟。

相关专题内容，请直接输入关键词查询，避免使用图片解答、避免使用俚语，不超过100字。

从kernel中通过连通域确定初始的文本实例集合 $K$ K。
对于每一个文本实例 $K i$ Ki，按4方向从text_region中融合文本像素。融合条件: 文本像素点 $p$ p和 $K$ K之间similarity vectors的欧式距离< $d$ d (测试过程中 $d$ d默认为6)。
重复步骤2直到text_region没有文本像素。