发现Gemini解析PDF能力很弱

2026-04-13 13:240阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

最近在用Gemini看论文,发现Gemini对PDF的解析能力很弱,总是读出来一些奇奇怪怪的结果,10个公式他有7个都读不对,按理说Gemini的多模态是比较强的,有点奇怪。。另,有没有佬有好的解决办法?

网友解答:
--【壹】--:

真的假的哦,啥PDF,贴出来一份大伙儿试试?


--【贰】--:

MinerU API 文档 | PDF 解析接口文档 | 开发者文档 | MinerU
用mineru ocr一下然后md文档喂给gemini


--【叁】--:

不应该啊,我怎么感觉在这方面Gemini是最强的那一档,定位也非常准确


--【肆】--:

转换成图片?之前还试过它自己说看不了pdf,我截图给过去读出来的效果还行,特大文件转不过来可能就得用知识库了

问题描述:

最近在用Gemini看论文,发现Gemini对PDF的解析能力很弱,总是读出来一些奇奇怪怪的结果,10个公式他有7个都读不对,按理说Gemini的多模态是比较强的,有点奇怪。。另,有没有佬有好的解决办法?

网友解答:
--【壹】--:

真的假的哦,啥PDF,贴出来一份大伙儿试试?


--【贰】--:

MinerU API 文档 | PDF 解析接口文档 | 开发者文档 | MinerU
用mineru ocr一下然后md文档喂给gemini


--【叁】--:

不应该啊,我怎么感觉在这方面Gemini是最强的那一档,定位也非常准确


--【肆】--:

转换成图片?之前还试过它自己说看不了pdf,我截图给过去读出来的效果还行,特大文件转不过来可能就得用知识库了