发现Gemini解析PDF能力很弱
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
最近在用Gemini看论文,发现Gemini对PDF的解析能力很弱,总是读出来一些奇奇怪怪的结果,10个公式他有7个都读不对,按理说Gemini的多模态是比较强的,有点奇怪。。另,有没有佬有好的解决办法?
网友解答:--【壹】--:
真的假的哦,啥PDF,贴出来一份大伙儿试试?
--【贰】--:
MinerU API 文档 | PDF 解析接口文档 | 开发者文档 | MinerU
用mineru ocr一下然后md文档喂给gemini
--【叁】--:
不应该啊,我怎么感觉在这方面Gemini是最强的那一档,定位也非常准确
--【肆】--:
转换成图片?之前还试过它自己说看不了pdf,我截图给过去读出来的效果还行,特大文件转不过来可能就得用知识库了
问题描述:
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
最近在用Gemini看论文,发现Gemini对PDF的解析能力很弱,总是读出来一些奇奇怪怪的结果,10个公式他有7个都读不对,按理说Gemini的多模态是比较强的,有点奇怪。。另,有没有佬有好的解决办法?
网友解答:--【壹】--:
真的假的哦,啥PDF,贴出来一份大伙儿试试?
--【贰】--:
MinerU API 文档 | PDF 解析接口文档 | 开发者文档 | MinerU
用mineru ocr一下然后md文档喂给gemini
--【叁】--:
不应该啊,我怎么感觉在这方面Gemini是最强的那一档,定位也非常准确
--【肆】--:
转换成图片?之前还试过它自己说看不了pdf,我截图给过去读出来的效果还行,特大文件转不过来可能就得用知识库了

