几百页pdf 翻译请教
- 内容介绍
- 文章标签
- 相关推荐
各位大佬,头疼了,今晚临时接到个明天需要干的工作,需要协助翻译有个几百页日语的pdf资料,将其翻译为中文,并且格式对应统一不变形,原pdf有文字和图片配文字等。
所以哪个工具或者ai可以做到呢?
--【壹】--: Carb:
格式对应统一不变形
这个有办法做到么?好像可以用带格式信息的原始json文件来做?
--【贰】--:
这个翻译出来到时候那格式会变么,因为它里面有一些图片也有日语的,但是他图片日语是不可复制的,因为他是嵌套在图片里面,应该都不知道能不能识别翻译。
--【叁】--:
这个思路也可以,谢谢老,谢谢谢谢谢谢谢谢谢
--【肆】--:
佬,可以参考下这个
大量PDF如何翻译 搞七捻三佬,看下通义阅读 [tpl20251122_142838] 可以还原排版: [tpl20251122_143113] 可以导出还原排版的PDF [tpl20251122_143158]
还原排版好用
千问-Qwen最新模型体验-通义千问
千问是阿里通义千问大模型打造的AI对话助手,通义千问支持问答、写作、代码、翻译、录音、PPT创作、文档处理、音视频速读。
tpl20251122_143158606×682 22 KB
--【伍】--:
最简单的不折腾的方式,就是下载个豆包桌面端。
--【陆】--:
没有机密的吧,我可以帮你用wps翻译试试
--【柒】--: 文献全文翻译的网站哪个比较好用?
doc2x和 BabelDOC - 无损排版 海量额度 用自己接口就 PDFMathTranslate/PDFMathTranslate: [EMNLP 2025 Demo] PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/MCP/Docker/Zotero( pdf2zh.com)
你可以试试这个,不知道对你有没有帮助,doc2x也支持日文对照翻译
--【捌】--:
Wps 会员似乎有翻译功能?
图片里面的应该翻译不了
--【玖】--:
我之前用字节的anygen翻译的PDF,效果还不错,上传了几十个文件。但是你这个几百页不知道能不能行…
--【拾】--:
可以用zotero+zotero2zh插件,配个llm
--【拾壹】--:
我记得沉浸式翻译就浏览器插件,好像直接就可以翻译的,而且又是排版也会保留,我之前试过英文的,效果不错
--【拾贰】--:
有一个开源软件叫mineru,你可以试着把几百页的pdf转成markdown,然后用codex将markdown文档翻译一下
--【拾叁】--:
没啥问题的,你可以试试官网的web端,可以很好的把大部分内容提取出来,图片,复杂表格,排版也比较还原
--【拾肆】--:
百度飞桨orc api。开发者每天好像额度挺多的。用这个转成md。然后codex去翻译就行了
--【拾伍】--:
之前用过小绿鲸,但是长文件需要拆分才能免费。。
--【拾陆】--:
有解决方案了吗佬,我有时候也有需要,不容易啊
--【拾柒】--:
就是头疼这个格式,有时候虽然有对应可以翻译,但是它格式会变形
--【拾捌】--:
佬可以看看这个能不能, 不过我还没试过
RetainPDF:PDF 保留排版翻译工具RetainPDF:PDF 保留排版翻译工具 搞七捻三简单对比:
项目 扫描型 PDF 复杂行内公式 代码不误翻 表格控制 自定义翻译策略 排版保留 PDF 压缩优化 API 自动化 PDFMathTranslate 弱 弱 一般 一般 PolyglotPDF 弱 弱 一般 一般 Doc2X 中 弱 强 弱 不开放 RetainPDF 可开关 可按规则配置 强 持续优化
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构无关: 是 我的项目不存在QQ、TG等群组引流: 是 我的项目不存在非运营必要的网站引流: 是 我的项目不存在为他人推广、AFF: 是 我的项目无关联的商业项目: 是 我的站点存在登录,并已接…
--【拾玖】--:
用多模态的方式直接翻译生图,拼成pdf?
各位大佬,头疼了,今晚临时接到个明天需要干的工作,需要协助翻译有个几百页日语的pdf资料,将其翻译为中文,并且格式对应统一不变形,原pdf有文字和图片配文字等。
所以哪个工具或者ai可以做到呢?
--【壹】--: Carb:
格式对应统一不变形
这个有办法做到么?好像可以用带格式信息的原始json文件来做?
--【贰】--:
这个翻译出来到时候那格式会变么,因为它里面有一些图片也有日语的,但是他图片日语是不可复制的,因为他是嵌套在图片里面,应该都不知道能不能识别翻译。
--【叁】--:
这个思路也可以,谢谢老,谢谢谢谢谢谢谢谢谢
--【肆】--:
佬,可以参考下这个
大量PDF如何翻译 搞七捻三佬,看下通义阅读 [tpl20251122_142838] 可以还原排版: [tpl20251122_143113] 可以导出还原排版的PDF [tpl20251122_143158]
还原排版好用
千问-Qwen最新模型体验-通义千问
千问是阿里通义千问大模型打造的AI对话助手,通义千问支持问答、写作、代码、翻译、录音、PPT创作、文档处理、音视频速读。
tpl20251122_143158606×682 22 KB
--【伍】--:
最简单的不折腾的方式,就是下载个豆包桌面端。
--【陆】--:
没有机密的吧,我可以帮你用wps翻译试试
--【柒】--: 文献全文翻译的网站哪个比较好用?
doc2x和 BabelDOC - 无损排版 海量额度 用自己接口就 PDFMathTranslate/PDFMathTranslate: [EMNLP 2025 Demo] PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/MCP/Docker/Zotero( pdf2zh.com)
你可以试试这个,不知道对你有没有帮助,doc2x也支持日文对照翻译
--【捌】--:
Wps 会员似乎有翻译功能?
图片里面的应该翻译不了
--【玖】--:
我之前用字节的anygen翻译的PDF,效果还不错,上传了几十个文件。但是你这个几百页不知道能不能行…
--【拾】--:
可以用zotero+zotero2zh插件,配个llm
--【拾壹】--:
我记得沉浸式翻译就浏览器插件,好像直接就可以翻译的,而且又是排版也会保留,我之前试过英文的,效果不错
--【拾贰】--:
有一个开源软件叫mineru,你可以试着把几百页的pdf转成markdown,然后用codex将markdown文档翻译一下
--【拾叁】--:
没啥问题的,你可以试试官网的web端,可以很好的把大部分内容提取出来,图片,复杂表格,排版也比较还原
--【拾肆】--:
百度飞桨orc api。开发者每天好像额度挺多的。用这个转成md。然后codex去翻译就行了
--【拾伍】--:
之前用过小绿鲸,但是长文件需要拆分才能免费。。
--【拾陆】--:
有解决方案了吗佬,我有时候也有需要,不容易啊
--【拾柒】--:
就是头疼这个格式,有时候虽然有对应可以翻译,但是它格式会变形
--【拾捌】--:
佬可以看看这个能不能, 不过我还没试过
RetainPDF:PDF 保留排版翻译工具RetainPDF:PDF 保留排版翻译工具 搞七捻三简单对比:
项目 扫描型 PDF 复杂行内公式 代码不误翻 表格控制 自定义翻译策略 排版保留 PDF 压缩优化 API 自动化 PDFMathTranslate 弱 弱 一般 一般 PolyglotPDF 弱 弱 一般 一般 Doc2X 中 弱 强 弱 不开放 RetainPDF 可开关 可按规则配置 强 持续优化
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构无关: 是 我的项目不存在QQ、TG等群组引流: 是 我的项目不存在非运营必要的网站引流: 是 我的项目不存在为他人推广、AFF: 是 我的项目无关联的商业项目: 是 我的站点存在登录,并已接…
--【拾玖】--:
用多模态的方式直接翻译生图,拼成pdf?

