百度网盘AI大赛文档检测优化赛第7名方案有哪些亮点?

2026-05-07 04:591阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计576个文字,预计阅读时间需要3分钟。

百度网盘AI大赛文档检测优化赛第7名方案有哪些亮点?

相关专题

比赛链接

一、比赛介绍

生活中人们使用手机进行文档扫描逐渐成为一件普遍的事情,为了提高人们的使用体验,我们期望通过算法技术去除杂乱的拍摄背景并精准框取文档边缘,选手需要通过深度学习技术训练模型,对给定的真实场景下采集得到的带有拍摄背景的文件图片进行边缘智能识别,并最终输出处理后的扫描结果图片。

评测方式说明

  1. 参赛选手提交的代码和模型只预测文档边缘的heatmap图,由后台评测脚本中预置的算法回归出文档区域的四个角的坐标点,并生成规则的四边形,与GT计算IoU值;
  2. 参赛选手提交的代码和模型直接回归文档区域的四个角的坐标点,并生成规则的四边形,与GT计算IoU值。 注:两种评测方式的结果会放在一个排行榜内,评测脚本中预置的角点回归算法会存在一定的局限性,如果各位参赛选手希望获得更高的分数,建议采用第二种评测方式。

二、赛题分析

本次比赛要求选手设计算法在给定图片中划定一块四边形区域,以尽可能与图片中的文档部分重合。

因此,本次任务可以同时看作回归问题和分割问题。

  • 作为回归问题,设计模型直接回归四个角点坐标(x1, y1; x2, y2; x3, y3; x4, y4),并利用L1Loss、L2Loss等损失函数优化模型
  • 作为分割问题,直接将数据中的segments作为标签训练选取/设计的分割模型,然后根据预测的heatmap图回归出角点坐标

本项目将本次任务看作回归问题来处理,使用Res2Net101_vd_26w_4s+注意力双分支Linear层的网络结构回归四个角的坐标。

三、数据处理

获取数据

本文共计576个文字,预计阅读时间需要3分钟。

百度网盘AI大赛文档检测优化赛第7名方案有哪些亮点?

相关专题

比赛链接

一、比赛介绍

生活中人们使用手机进行文档扫描逐渐成为一件普遍的事情,为了提高人们的使用体验,我们期望通过算法技术去除杂乱的拍摄背景并精准框取文档边缘,选手需要通过深度学习技术训练模型,对给定的真实场景下采集得到的带有拍摄背景的文件图片进行边缘智能识别,并最终输出处理后的扫描结果图片。

评测方式说明

  1. 参赛选手提交的代码和模型只预测文档边缘的heatmap图,由后台评测脚本中预置的算法回归出文档区域的四个角的坐标点,并生成规则的四边形,与GT计算IoU值;
  2. 参赛选手提交的代码和模型直接回归文档区域的四个角的坐标点,并生成规则的四边形,与GT计算IoU值。 注:两种评测方式的结果会放在一个排行榜内,评测脚本中预置的角点回归算法会存在一定的局限性,如果各位参赛选手希望获得更高的分数,建议采用第二种评测方式。

二、赛题分析

本次比赛要求选手设计算法在给定图片中划定一块四边形区域,以尽可能与图片中的文档部分重合。

因此,本次任务可以同时看作回归问题和分割问题。

  • 作为回归问题,设计模型直接回归四个角点坐标(x1, y1; x2, y2; x3, y3; x4, y4),并利用L1Loss、L2Loss等损失函数优化模型
  • 作为分割问题,直接将数据中的segments作为标签训练选取/设计的分割模型,然后根据预测的heatmap图回归出角点坐标

本项目将本次任务看作回归问题来处理,使用Res2Net101_vd_26w_4s+注意力双分支Linear层的网络结构回归四个角的坐标。

三、数据处理

获取数据