群佬们,请教一个开发+OCR+自动裁剪学生解答题的问题?有没有更好的方案哇
- 内容介绍
- 文章标签
- 相关推荐
我真的崩溃了,现在想做一个学生答题卡上传,然后自动裁剪学生作答的解答题部分转成坐标进行裁剪,用了 AI 相关的 OCR 或者视觉识别模型都不行,百度相关也用了 有没有好一点的方案
网友解答:--【壹】--: xinuo:
opencv
这个也试过了,裁剪的不是很理想,不是把学生答题卡的整个答题部分裁剪出来,比如 17,18,19 等
--【贰】--:
传统YOLO
--【叁】--:
好的好的,我去查一下,真的测试了很多,都不是很理想
--【肆】--:
试试飞桨 https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5
--【伍】--:
好的,谢谢大佬 我去瞅瞅
--【陆】--:
好嘞好嘞
--【柒】--:
楼上两位提到的OpenCV+YOLO组合试试呢? OpenCV纠偏,YOLO 检测裁剪。
--【捌】--:
这种直接opencv处理不就行了
--【玖】--:
答题卡上没有用于定位的二维码之类的嘛
--【拾】--:
支持楼上佬友的 传统yolo ,感觉用大模型反而增加了复杂性和不确定性
--【拾壹】--:
感觉大模型不可控因素太多了,还是传统比较好
--【拾贰】--:
掘金上有个人之前就是做学生答题识别的,你可以查一下
我真的崩溃了,现在想做一个学生答题卡上传,然后自动裁剪学生作答的解答题部分转成坐标进行裁剪,用了 AI 相关的 OCR 或者视觉识别模型都不行,百度相关也用了 有没有好一点的方案
网友解答:--【壹】--: xinuo:
opencv
这个也试过了,裁剪的不是很理想,不是把学生答题卡的整个答题部分裁剪出来,比如 17,18,19 等
--【贰】--:
传统YOLO
--【叁】--:
好的好的,我去查一下,真的测试了很多,都不是很理想
--【肆】--:
试试飞桨 https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5
--【伍】--:
好的,谢谢大佬 我去瞅瞅
--【陆】--:
好嘞好嘞
--【柒】--:
楼上两位提到的OpenCV+YOLO组合试试呢? OpenCV纠偏,YOLO 检测裁剪。
--【捌】--:
这种直接opencv处理不就行了
--【玖】--:
答题卡上没有用于定位的二维码之类的嘛
--【拾】--:
支持楼上佬友的 传统yolo ,感觉用大模型反而增加了复杂性和不确定性
--【拾壹】--:
感觉大模型不可控因素太多了,还是传统比较好
--【拾贰】--:
掘金上有个人之前就是做学生答题识别的,你可以查一下

