群佬们,请教一个开发+OCR+自动裁剪学生解答题的问题?有没有更好的方案哇

2026-04-11 14:190阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

我真的崩溃了,现在想做一个学生答题卡上传,然后自动裁剪学生作答的解答题部分转成坐标进行裁剪,用了 AI 相关的 OCR 或者视觉识别模型都不行,百度相关也用了 有没有好一点的方案

网友解答:
--【壹】--: xinuo:

opencv

这个也试过了,裁剪的不是很理想,不是把学生答题卡的整个答题部分裁剪出来,比如 17,18,19 等


--【贰】--:

传统YOLO


--【叁】--:

好的好的,我去查一下,真的测试了很多,都不是很理想


--【肆】--:

试试飞桨 https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5


--【伍】--:

好的,谢谢大佬 我去瞅瞅


--【陆】--:

好嘞好嘞


--【柒】--:

楼上两位提到的OpenCV+YOLO组合试试呢? OpenCV纠偏,YOLO 检测裁剪。


--【捌】--:

这种直接opencv处理不就行了


--【玖】--:

答题卡上没有用于定位的二维码之类的嘛


--【拾】--:

支持楼上佬友的 传统yolo ,感觉用大模型反而增加了复杂性和不确定性


--【拾壹】--:

感觉大模型不可控因素太多了,还是传统比较好


--【拾贰】--:

掘金上有个人之前就是做学生答题识别的,你可以查一下

标签:软件开发
问题描述:

我真的崩溃了,现在想做一个学生答题卡上传,然后自动裁剪学生作答的解答题部分转成坐标进行裁剪,用了 AI 相关的 OCR 或者视觉识别模型都不行,百度相关也用了 有没有好一点的方案

网友解答:
--【壹】--: xinuo:

opencv

这个也试过了,裁剪的不是很理想,不是把学生答题卡的整个答题部分裁剪出来,比如 17,18,19 等


--【贰】--:

传统YOLO


--【叁】--:

好的好的,我去查一下,真的测试了很多,都不是很理想


--【肆】--:

试试飞桨 https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5


--【伍】--:

好的,谢谢大佬 我去瞅瞅


--【陆】--:

好嘞好嘞


--【柒】--:

楼上两位提到的OpenCV+YOLO组合试试呢? OpenCV纠偏,YOLO 检测裁剪。


--【捌】--:

这种直接opencv处理不就行了


--【玖】--:

答题卡上没有用于定位的二维码之类的嘛


--【拾】--:

支持楼上佬友的 传统yolo ,感觉用大模型反而增加了复杂性和不确定性


--【拾壹】--:

感觉大模型不可控因素太多了,还是传统比较好


--【拾贰】--:

掘金上有个人之前就是做学生答题识别的,你可以查一下

标签:软件开发