佬友们,求一个好用的pdf word转markdown的工具
- 内容介绍
- 文章标签
- 相关推荐
目前的方法是靠自己手动截图加上ai的ocr,比较低效。求一个好用的pdf word转markdown的工具 orz
网友解答:--【壹】--:
mistral api
路线其实落后,是视觉的
但是在某些需求上很强,比如整理课件
pdf里的图片也会按照文字去处理
送免费额度,并且由于是api,不用像mineru自己部署,速度很快
缺点是精度,以及如果你是希望把图片提取出来保存,那他不合适
--【贰】--:
很好用 甚至可以调用api 谢谢佬了
--【叁】--:
如果是VS Code、Trae、CodeBuddy,可以在插件市场搜索 “DocuGenius”,支持自动或手动将项目文件夹中的docx,xlsx,pdf和ppt一键转为markdown
Open VSX Registry
--【肆】--:
GitHub - opendatalab/MinerU: Transforms complex documents like PDFs into...
Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows.
--【伍】--:
怎么能做到固定格式导出呢,我想导出成自己想要的格式,显示导出是默认格式
--【陆】--:
我做了个 PDF转Markdown 的在线工具,不过目前只能处理一些纯文本的,OCR 格式的正在做,后面会加上。
--【柒】--:
是的,如果对提取的精度要求很高的话,这个pdf2md工具还是挺不错的,但是如果只是简单了解文档内容,写脚本提取文字就足够了,毕竟转成md需要花一些时间。
--【捌】--:
pandoc, 或者直接丢给豆包
目前的方法是靠自己手动截图加上ai的ocr,比较低效。求一个好用的pdf word转markdown的工具 orz
网友解答:--【壹】--:
mistral api
路线其实落后,是视觉的
但是在某些需求上很强,比如整理课件
pdf里的图片也会按照文字去处理
送免费额度,并且由于是api,不用像mineru自己部署,速度很快
缺点是精度,以及如果你是希望把图片提取出来保存,那他不合适
--【贰】--:
很好用 甚至可以调用api 谢谢佬了
--【叁】--:
如果是VS Code、Trae、CodeBuddy,可以在插件市场搜索 “DocuGenius”,支持自动或手动将项目文件夹中的docx,xlsx,pdf和ppt一键转为markdown
Open VSX Registry
--【肆】--:
GitHub - opendatalab/MinerU: Transforms complex documents like PDFs into...
Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows.
--【伍】--:
怎么能做到固定格式导出呢,我想导出成自己想要的格式,显示导出是默认格式
--【陆】--:
我做了个 PDF转Markdown 的在线工具,不过目前只能处理一些纯文本的,OCR 格式的正在做,后面会加上。
--【柒】--:
是的,如果对提取的精度要求很高的话,这个pdf2md工具还是挺不错的,但是如果只是简单了解文档内容,写脚本提取文字就足够了,毕竟转成md需要花一些时间。
--【捌】--:
pandoc, 或者直接丢给豆包

