为什么cherry studio不识别pdf呢,我看模型也支持视觉呢(可以识别图片)

2026-04-11 14:000阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

image2559×1368 221 KB
image1751×299 17.7 KB

网友解答:
--【壹】--:

读pdf不是用视觉能力吧,PDF是二进制文件
如果PDF文本内容有OCR出来(也就是PDF上的文本可以复制),理论上模型就能读了,不过也读不了PDF里的图片


--【贰】--:

搜嘎,谢谢佬


--【叁】--:

Openai chat兼容端点只能识别PDF内的文字作为文本类型回传,Openai response,Gemini,Claude端点都支持PDF的base64回传,你打开调试窗口可以看到,是否能够支持识别看上游供应商


--【肆】--:

明白了,佬


--【伍】--:

不只是翻译,翻译完还要学习论文,要问些论文里不懂的东西


--【陆】--:

这个通常和上游质量有关 和软件本身没什么关系 或者说很小


--【柒】--:

mark一下


--【捌】--:

后续/我的解决方案
我目前找的最便捷的方式是,找个pdf转word的在线工具,转成word,然后就可以用了;
MinerU虽然免费也可用,但是只能用来构建知识库,只会选取精华内容留存,会缺少些内容(如果想直接甩给cs也还是识别不了pdf)


--【玖】--:

你可以用那个啥

MinerU

MinerU | 一站式 PDF 文档解析工具

从 PDF 中提取表格、公式、文字与图片,精准转换为 Markdown、JSON 等多种格式

这玩意