openrouter上线免费的qianfan-ocr模型
- 内容介绍
- 相关推荐
Qianfan-OCR-Fast (free) - API Pricing & Providers
Qianfan-OCR-Fast is a domain-specific multimodal large model purpose-built for OCR. $0 per million input tokens, $0 per million output tokens. 65,536 token context window, maximum output of 28,672 tokens.
网友解答:--【壹】--:
那我觉得你这样的需求,ocr只是工具或者说,应该要给出一个"新表头"的定义和转换的例子,然后让多模态模型把pdf转为文本data,再用程序转成pdf好一点。无思考的ocr,终究不能理解工作是什么,一般只能提取文字了,就算能把表格提取出来后续还是要处理
--【贰】--:
现在ocr王者不是阿里开源那个什么Logics-Parsing-v2么?
我记得本地部署8G显存就可以了好像
--【叁】--:
真不错,后面的这种 ocr 服务价格可以打下来能把很多文档都提取成 md 来用。
--【肆】--:
第一眼看成qianfen-ocr了,还以为可以一键识别千芬操作并自动砸蛋
--【伍】--:
我前段时间做了一个很长的重复工作,就是把pdf日程表规格统一,因为每个人处理的日程表有不同的表头,然后要把所有的日程表统一成相同的表头,再重新生成pdf,我是让我的claw去做的,然后第1个思路是。
Qianfan-OCR-Fast (free) - API Pricing & Providers
Qianfan-OCR-Fast is a domain-specific multimodal large model purpose-built for OCR. $0 per million input tokens, $0 per million output tokens. 65,536 token context window, maximum output of 28,672 tokens.
网友解答:--【壹】--:
那我觉得你这样的需求,ocr只是工具或者说,应该要给出一个"新表头"的定义和转换的例子,然后让多模态模型把pdf转为文本data,再用程序转成pdf好一点。无思考的ocr,终究不能理解工作是什么,一般只能提取文字了,就算能把表格提取出来后续还是要处理
--【贰】--:
现在ocr王者不是阿里开源那个什么Logics-Parsing-v2么?
我记得本地部署8G显存就可以了好像
--【叁】--:
真不错,后面的这种 ocr 服务价格可以打下来能把很多文档都提取成 md 来用。
--【肆】--:
第一眼看成qianfen-ocr了,还以为可以一键识别千芬操作并自动砸蛋
--【伍】--:
我前段时间做了一个很长的重复工作,就是把pdf日程表规格统一,因为每个人处理的日程表有不同的表头,然后要把所有的日程表统一成相同的表头,再重新生成pdf,我是让我的claw去做的,然后第1个思路是。

