[开源] 做了一个用LLM来OCR的工具,欢迎各位佬友使用!

2026-04-11 12:190阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


github.com

GitHub - RRRRUDDDD/LLM_OCR: 通过多模态大语言模型来进行OCR

通过多模态大语言模型来进行OCR

做这个项目的起因是我自己有 ocr 大量文本的需求,现在多模态大模型的 ocr 效果确实非常好,准确率高,速度也还行,但是市面上并没有很好的工具,于是就自己做了个,欢迎各位佬友使用并提出意见。佬友们觉得好用的话可以点个小星星嘛,这是我最大的动力!

可识别的图片格式基本覆盖了日常会使用到的格式,也对 pdf 直接上传做了适配,可以直接用 pdf 来上传。支持直接复制,markdown,txt,word 四种导出方式。

移动端和 pc 端也都做了适配,方便日常使用。