打破 20 年垄断排行!百度 PaddleOCR 超越 Google Tesseract 登顶全球 OCR 开源第一
- 内容介绍
- 文章标签
- 相关推荐
在全球开源代码托管平台 GitHub 上,一项长达 20 年的纪录被中国项目改写。百度文心衍生模型 PaddleOCR 的 GitHub Star 数正式超越 Google 的老牌项目 Tesseract OCR,成为全球排名第一的 OCR开源项目。
在刚刚公布的 CVPR 2026 入选名单中,PaddleOCR 凭借两篇高质量论文再次惊艳学术界。其中最受瞩目的 PP-OCRv5 模型,参数量仅为 5M,却在特定 OCR 任务上展现出了媲美 GPT-4o(千亿级参数)的性能。
百度研发团队发现,模型能力的提升不再仅仅依赖架构堆叠,而在于精细化的数据策略。通过寻找模型的“难度甜点区”——即像教小孩做题一样,避开过于简单或过于超纲的题目,在“舒适区”边缘进行高效的题海战术。
为了回馈社区,百度官方宣布:PaddleOCR 官网的免费解析额度从每天 1 万页直接翻倍至 2 万页!
此外,对于需要高精度 PDF 解析的用户,现在可以直接在 OpenClaw 中调用 PaddleOCR Skill。
17748671856107776989962712095565679×448 32 KB
17748672187482509486052227528297900×1200 102 KB
17748672352946428423758743567913900×1200 204 KB
GitHub - PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured...
Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
网友解答:--【壹】--: Bunn:
参数量仅为 5M,却在特定 OCR 任务上展现出了媲美 GPT-4o(千亿级参数)的性能
嗯,专门优化过
--【贰】--:
v5 server版本确实可以的
--【叁】--:
百度本身paddle OCR就很强
--【肆】--:
大模型火起来之前,paddle飞桨知名度就已经挺不错的
--【伍】--:
paddle确实强 对百度ai唯一感觉的特色
但是不知道现在有没有什么横向评测
--【陆】--:
paddleocr算是百度唯一一个能打的了 没必要太过于质疑
--【柒】--:
还行,百度这个 OCR 模型是我硅基流动还在用的唯二的模型(另一个是语音模型)
--【捌】--:
牛牛牛,百度雄起
--【玖】--:
@ grok is that ture
--【拾】--:
star 数。
这算什么第一。这有什么垄断。
--【拾壹】--:
好家伙,百度
--【拾贰】--:
摆渡软广???
--【拾叁】--:
确实好用的,现在很多新出来OCR模型的基模都是paddle的
--【拾肆】--: Bunn:
百度研发团队发现,模型能力的提升不再仅仅依赖架构堆叠,而在于精细化的数据策略。
--【拾伍】--:
时代变了,AI太重要了
--【拾陆】--:
彦宏nb!
--【拾柒】--:
飞桨是百度硕果仅存的几个大项目之一了,实力是有的
--【拾捌】--:
百度?哈?真的吗?
--【拾玖】--:
你这真的很像软广呀(不过看了历史发帖,的确是经常发这种前沿帖子,摆脱怀疑了)
不过话说不知道什么时候起我对于百度系的产品有一种本能的抵制,有没有佬跟我一样的?
在全球开源代码托管平台 GitHub 上,一项长达 20 年的纪录被中国项目改写。百度文心衍生模型 PaddleOCR 的 GitHub Star 数正式超越 Google 的老牌项目 Tesseract OCR,成为全球排名第一的 OCR开源项目。
在刚刚公布的 CVPR 2026 入选名单中,PaddleOCR 凭借两篇高质量论文再次惊艳学术界。其中最受瞩目的 PP-OCRv5 模型,参数量仅为 5M,却在特定 OCR 任务上展现出了媲美 GPT-4o(千亿级参数)的性能。
百度研发团队发现,模型能力的提升不再仅仅依赖架构堆叠,而在于精细化的数据策略。通过寻找模型的“难度甜点区”——即像教小孩做题一样,避开过于简单或过于超纲的题目,在“舒适区”边缘进行高效的题海战术。
为了回馈社区,百度官方宣布:PaddleOCR 官网的免费解析额度从每天 1 万页直接翻倍至 2 万页!
此外,对于需要高精度 PDF 解析的用户,现在可以直接在 OpenClaw 中调用 PaddleOCR Skill。
17748671856107776989962712095565679×448 32 KB
17748672187482509486052227528297900×1200 102 KB
17748672352946428423758743567913900×1200 204 KB
GitHub - PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured...
Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
网友解答:--【壹】--: Bunn:
参数量仅为 5M,却在特定 OCR 任务上展现出了媲美 GPT-4o(千亿级参数)的性能
嗯,专门优化过
--【贰】--:
v5 server版本确实可以的
--【叁】--:
百度本身paddle OCR就很强
--【肆】--:
大模型火起来之前,paddle飞桨知名度就已经挺不错的
--【伍】--:
paddle确实强 对百度ai唯一感觉的特色
但是不知道现在有没有什么横向评测
--【陆】--:
paddleocr算是百度唯一一个能打的了 没必要太过于质疑
--【柒】--:
还行,百度这个 OCR 模型是我硅基流动还在用的唯二的模型(另一个是语音模型)
--【捌】--:
牛牛牛,百度雄起
--【玖】--:
@ grok is that ture
--【拾】--:
star 数。
这算什么第一。这有什么垄断。
--【拾壹】--:
好家伙,百度
--【拾贰】--:
摆渡软广???
--【拾叁】--:
确实好用的,现在很多新出来OCR模型的基模都是paddle的
--【拾肆】--: Bunn:
百度研发团队发现,模型能力的提升不再仅仅依赖架构堆叠,而在于精细化的数据策略。
--【拾伍】--:
时代变了,AI太重要了
--【拾陆】--:
彦宏nb!
--【拾柒】--:
飞桨是百度硕果仅存的几个大项目之一了,实力是有的
--【拾捌】--:
百度?哈?真的吗?
--【拾玖】--:
你这真的很像软广呀(不过看了历史发帖,的确是经常发这种前沿帖子,摆脱怀疑了)
不过话说不知道什么时候起我对于百度系的产品有一种本能的抵制,有没有佬跟我一样的?

