【开源自荐】一个把NotebookLM等生成的PDF变成可编辑PPT的小工具!
- 内容介绍
- 文章标签
- 相关推荐
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
有这些问题?
- NotebookLM生成PDF不能编辑?
- PDF或图片想转成可编辑PPT?
- 手上明明有视觉模型,但是还得充大厂的工具会员?
这个工具可以帮助你将PDF转成可编辑的PPT,完全开源,你可以自己修改添加模型,可以选择自己喜欢的方式去转化PDF,甚至可以通过MCP让AI帮你转换,实现工作流。
结果展示
原图1920×1072 123 KB 生成PPT-文字可编辑1920×1076 119 KB
生成PPT-图片可编辑1920×1067 133 KB
项目地址
- GitHub: ZiChuanLan/PDF2PPT
- 文档站: PDF2PPT 文档
MCP支持
- GitHub: MCP 仓库
在线体验
| 项目 | 地址 / 信息 |
|---|---|
| 演示站点 | https://ppt.015201314.xyz/ |
| 访问密码 | 123456 |
[!WARNING]
请 不要 上传 工作文档,避免隐私泄露。
界面预览
| 跟踪页面 | 任务记录 |
|---|---|
| PDF2PPT 跟踪页面1280×667 127 KB | PDF2PPT 任务记录1280×395 33 KB |
| AIOCR 设置 | 云端 MinerU 设置 |
|---|---|
| PDF2PPT AIOCR 设置1280×1024 108 KB | PDF2PPT 云端 MinerU 设置1280×931 90.4 KB |
特别功能
- 实现本地切块识别后上传云端模型ocr
- 允许自定义提示词让AI(deepseek-ocr)直出bbox和文字
- 可以自动识别md文档格式(准确性存疑)
- 可以删除页脚,如NotebookLM
- 允许MCP进行API的调用连接,允许在VPS上部署项目,本地进行连接
- 支持图片放入背景和图片单独拆出来两种方式(AIOCR主要依靠PP-DocLayoutV3能力)
- 支持过程图、页面对比、指定页面转换,支持任务与结果保留。
本地部署 (Docker)
如果你想自己部署,最省事的是 Docker。
git clone [https://github.com/ZiChuanLan/PDF2PPT.git](https://github.com/ZiChuanLan/PDF2PPT.git)
cd PDF2PPT
cp .env.example .env
docker compose up -d --build
MCP调用:
本地 clone 方式:
{
"mcpServers": {
"ppt": {
"command": "uv",
"args": [
"--directory",
"/home/lan/workspace/ppt-mcp",
"run",
"ppt-mcp"
],
"env": {
"PPT_API_BASE_URL": "http://127.0.0.1:8000"
}
}
}
}
远程:
{
"ppt": {
"type": "stdio",
"command": "uvx",
"args": [
"--from",
"git+https://github.com/ZiChuanLan/ppt-mcp",
"ppt-mcp"
],
"env": {
"PPT_API_BASE_URL": "https://ppt.015201314.xyz",
"MINERU_API_TOKEN": "yourkey",
"SILICONFLOW_API_KEY": "sk-yourkey"
}
}
}
一些小贴士:
- 若未在env中开启OCR_PADDLE_LAYOUT_PREWARM=1,首次运行AIOCR本地切块识别可能会下载PP-DocLayoutV3以实现本地的切块,导致首次运行速度慢。
- 若在env中填写了API_BEARER_TOKEN,则MCP中需填写PPT_API_BEARER_TOKEN。
- 本地OCR中的Paddleocr未测验,可能有BUG。
- Mineru由于远程额度够用,故没在本地OCR中加入。
- 不支持批量
- https://mineru.net/apiManage/docs
- 百度AI-智能文档解析-文档结构化-智能文档信息提取-表格识别
写在最后:
感谢 L站大家的支持
感谢 某基流动 的免费deepseekocr和paddleocr。
感谢 我老师的支持
同时欢迎大家的修改建议,或者自行fork修改。
如果大家喜欢,可以点个免费的star
网友解答:--【壹】--:
试用了一下,感觉不错呀
--【贰】--:
佬回我了嘿嘿,那就顺便说一下,因为在想用 notebooklm 一键直出那种班会活动或者组会 PPT,对比了 L 站还有 GitHub 上面找的几个项目
之前感觉用了也还行的一个项目是站里面的OCRPDF-TO-PPT,配置比较麻烦,但是上学期确实帮我省了功夫,可惜使用的那个关联项目IOPaint已经归档不更新了,新版配置还是有点麻烦┭┮﹏┭┮
还有一个是借助了微软电脑管家实现的自动化转换PPT,在 GitHub 找的notebooklm2ppt,但是它需要接管电脑屏幕的操纵一段时间,加载的还比较慢
没有用佬提供的 MCP,这个演示站点开箱即用放在后台自己跑就行了,很舒适
只试用了一下,用的硅基流动的模型,如果能够提供自动识别字体之类更便捷的功能不用我自己手动再改的功能就更好了()
总之感谢佬的开源www
--【叁】--:
感谢大佬。
--【肆】--:
下一步大概考虑接入l站登录,分隔不同账户,方便佬友使用
--【伍】--:
感谢佬的项目!!
--【陆】--:
感谢佬友支持
--【柒】--:
感谢大佬,太强了
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
有这些问题?
- NotebookLM生成PDF不能编辑?
- PDF或图片想转成可编辑PPT?
- 手上明明有视觉模型,但是还得充大厂的工具会员?
这个工具可以帮助你将PDF转成可编辑的PPT,完全开源,你可以自己修改添加模型,可以选择自己喜欢的方式去转化PDF,甚至可以通过MCP让AI帮你转换,实现工作流。
结果展示
原图1920×1072 123 KB 生成PPT-文字可编辑1920×1076 119 KB
生成PPT-图片可编辑1920×1067 133 KB
项目地址
- GitHub: ZiChuanLan/PDF2PPT
- 文档站: PDF2PPT 文档
MCP支持
- GitHub: MCP 仓库
在线体验
| 项目 | 地址 / 信息 |
|---|---|
| 演示站点 | https://ppt.015201314.xyz/ |
| 访问密码 | 123456 |
[!WARNING]
请 不要 上传 工作文档,避免隐私泄露。
界面预览
| 跟踪页面 | 任务记录 |
|---|---|
| PDF2PPT 跟踪页面1280×667 127 KB | PDF2PPT 任务记录1280×395 33 KB |
| AIOCR 设置 | 云端 MinerU 设置 |
|---|---|
| PDF2PPT AIOCR 设置1280×1024 108 KB | PDF2PPT 云端 MinerU 设置1280×931 90.4 KB |
特别功能
- 实现本地切块识别后上传云端模型ocr
- 允许自定义提示词让AI(deepseek-ocr)直出bbox和文字
- 可以自动识别md文档格式(准确性存疑)
- 可以删除页脚,如NotebookLM
- 允许MCP进行API的调用连接,允许在VPS上部署项目,本地进行连接
- 支持图片放入背景和图片单独拆出来两种方式(AIOCR主要依靠PP-DocLayoutV3能力)
- 支持过程图、页面对比、指定页面转换,支持任务与结果保留。
本地部署 (Docker)
如果你想自己部署,最省事的是 Docker。
git clone [https://github.com/ZiChuanLan/PDF2PPT.git](https://github.com/ZiChuanLan/PDF2PPT.git)
cd PDF2PPT
cp .env.example .env
docker compose up -d --build
MCP调用:
本地 clone 方式:
{
"mcpServers": {
"ppt": {
"command": "uv",
"args": [
"--directory",
"/home/lan/workspace/ppt-mcp",
"run",
"ppt-mcp"
],
"env": {
"PPT_API_BASE_URL": "http://127.0.0.1:8000"
}
}
}
}
远程:
{
"ppt": {
"type": "stdio",
"command": "uvx",
"args": [
"--from",
"git+https://github.com/ZiChuanLan/ppt-mcp",
"ppt-mcp"
],
"env": {
"PPT_API_BASE_URL": "https://ppt.015201314.xyz",
"MINERU_API_TOKEN": "yourkey",
"SILICONFLOW_API_KEY": "sk-yourkey"
}
}
}
一些小贴士:
- 若未在env中开启OCR_PADDLE_LAYOUT_PREWARM=1,首次运行AIOCR本地切块识别可能会下载PP-DocLayoutV3以实现本地的切块,导致首次运行速度慢。
- 若在env中填写了API_BEARER_TOKEN,则MCP中需填写PPT_API_BEARER_TOKEN。
- 本地OCR中的Paddleocr未测验,可能有BUG。
- Mineru由于远程额度够用,故没在本地OCR中加入。
- 不支持批量
- https://mineru.net/apiManage/docs
- 百度AI-智能文档解析-文档结构化-智能文档信息提取-表格识别
写在最后:
感谢 L站大家的支持
感谢 某基流动 的免费deepseekocr和paddleocr。
感谢 我老师的支持
同时欢迎大家的修改建议,或者自行fork修改。
如果大家喜欢,可以点个免费的star
网友解答:--【壹】--:
试用了一下,感觉不错呀
--【贰】--:
佬回我了嘿嘿,那就顺便说一下,因为在想用 notebooklm 一键直出那种班会活动或者组会 PPT,对比了 L 站还有 GitHub 上面找的几个项目
之前感觉用了也还行的一个项目是站里面的OCRPDF-TO-PPT,配置比较麻烦,但是上学期确实帮我省了功夫,可惜使用的那个关联项目IOPaint已经归档不更新了,新版配置还是有点麻烦┭┮﹏┭┮
还有一个是借助了微软电脑管家实现的自动化转换PPT,在 GitHub 找的notebooklm2ppt,但是它需要接管电脑屏幕的操纵一段时间,加载的还比较慢
没有用佬提供的 MCP,这个演示站点开箱即用放在后台自己跑就行了,很舒适
只试用了一下,用的硅基流动的模型,如果能够提供自动识别字体之类更便捷的功能不用我自己手动再改的功能就更好了()
总之感谢佬的开源www
--【叁】--:
感谢大佬。
--【肆】--:
下一步大概考虑接入l站登录,分隔不同账户,方便佬友使用
--【伍】--:
感谢佬的项目!!
--【陆】--:
感谢佬友支持
--【柒】--:
感谢大佬,太强了

