【开源】画布式 AI 工作流创作平台,基于 NanoBananaPro 创作可编辑文字的 PPT,最新楼#45有更新
- 内容介绍
- 文章标签
- 相关推荐
前言
NanoBanana Pro出来之后,基于NanoBanana Pro的PPT制作是其中一股比较热门的方向。
前段时间尝试手动AI生成大纲——PPT图片模板——图片拼接,一系列流程下来。做了一些介绍文献的 PPT 感觉效果着实不错,于是着手将其实现为一个工作流平台,方便大家也是方便自己。
用过一些基于画布节点的创作平台,觉得交互起来十分灵活,做好的话能力会相较于一般的 AI PPT 制作软件更强大一些。
开始着手后,想到不能编辑图片,看大家讨论也是受限于此,并不是一个十分灵活 方便的生产力,于是搁置了几天,后来看到佬友的帖子,【开源】上班纯水,终于实现,banana pro生成ppt图片完美转换为可编辑的ppt了,那么你要试试吗?
觉得实现起来又有思路了,直接参考思路,将这一套逻辑内嵌到代码里面,加上这几天完善了一下(全靠Vibe Coding),终于发布了初版——NextCreator 诞生了!基于 Tauri 构建的应用,支持网页端与桌面端(推荐,因为图片占用存储空间大,本地性能更优)。
GitHub - MoonWeSif/NextCreator: 基于可视化节点的 AI 内容生成工作流工具,支持 文本/图片/视频/PPT 链式创作。
基于可视化节点的 AI 内容生成工作流工具,支持 文本/图片/视频/PPT 链式创作。
但是项目最后针对于可编辑 PPT 的实现还是有所局限的,经过测试,发现如果字体有样式与排版规则的话,那么借助佬友的实现思路实现下来,将文字重新嵌入到 PPT 中会有排版布局样式问题。
因此项目最终实现了将生成的 PPT 中的文字全部移除掉,仅保留背景部分(效果见下方图片),文字部分各位下载 PPT 后,自行文本框添加即可,这部分对人来说应该是比较简单的工作,对照着原 PPT 添加文本框即可,但想要借助程序实现下来的话,目前还没有实现思路。
同时编辑 PPT 时,个人来说大部分情景下也是文字部分有修改的需要,背景和排版部分保留,因此对于我来说目前项目是可用的程度了,有功能需求佬友们可以另提意见,有 bug 也可以提 issue,空闲时就修。
两个效果文件,转 PDF 了方便预览(图片有所压缩,原文件有点大):
母猪产后精细化护理技术与管理策略.pdf (344.1 KB)
母猪产后精细化护理技术与管理策略-仅背景.pdf (1.2 MB)
项目介绍
功能特性
- 节点编辑器 - 拖拽式工作流设计,支持撤销/重做、复制粘贴、自动布局
- 多画布管理 - 创建多个独立画布,数据自动持久化
- AI 图片生成 - 支持文生图、图生图,可配置分辨率和比例
- AI 视频生成 - 基于 Sora 模型的视频生成
- LLM 文本生成 - 支持多模态输入(文本/图片/PDF)
- PPT 工作流 - 自动生成大纲、页面图片,导出 PPTX
图片展示
主界面
PPT 工作流
PPT 页面生成
PPT 预览导出
纯图片模式 - 直接导出 PPT 图片
可编辑模式 - 去除文字仅保留背景,方便后期编辑
使用流程
- 配置供应商 - 点击右上角「供应商管理」,添加 API 供应商(使用 Gemini 原生格式请求)
- 分配供应商 - 在供应商管理中为不同节点类型指定供应商
- 创建工作流 - 从左侧节点面板拖拽节点到画布,连接节点构建工作流
- 运行生成 - 填写输入内容,点击节点的生成按钮即可
OCR + Inpaint 服务
如需使用 PPT 可编辑导出功能(去除文字仅保留背景),需要 OCR 和 Inpaint 服务。可以自行 Docker 部署(推荐),项目提供 Dokcer-compose 直接运行,也可以使用公益云服务。
项目提供公益服务,可直接在设置中配置使用:
| 服务 | 地址 | 用途 |
|---|---|---|
| EasyOCR | http://152.67.202.21:8866 |
文字检测识别 |
| IOPaint | http://152.67.202.21:8877 |
AI 背景修复 |
--【壹】--:
大佬牛逼,就等你们做出好看的东西,我来直接用,太强了
--【贰】--:
大佬太强了,先star了
--【叁】--:
生成PPT不支持自定义其他模型么,例如z-image-turbo
image876×652 40.1 KB
--【肆】--:
想法真的非常好,期待干翻lovert。
不过试了一下api节点第三方的很难用,名称匹配不上,未来可期,star了
--【伍】--:
太强了佬
--【陆】--:
大佬,强
--【柒】--:
感谢分享
--【捌】--:
太强了,大佬
--【玖】--:
这个没什么问题,待会支持生图的时候自定义模型名称
--【拾】--:
我用的flow2api,模型名是gemini-3.0-pro-image-landscape,好像用不了
--【拾壹】--:
其他模型效果达不到,对提示词理解能力与出图能力没有 NanoBananaPro 那样强,分辨率也不够,出的 PPT 看起来会比较模糊。(等我加一下这块的自定义模型名,也可以看看效果
--【拾贰】--:
太强了,大佬。今天要课堂作业答辩来着,昨晚、今早按照传统的“大纲+模板”紧急赶制了三十张,效率低了点,人工重复性工作多了,还是不够AI! 感谢大佬!看着会极大提高效率的。
--【拾叁】--:
名称匹配不上是指啥,模型名称吗,主要是考虑到官方一张2k图 1-2 元了,一个 PPT 要是官方 API 几十块出去了,划不来。
--【拾肆】--:
不错,前排点赞
--【拾伍】--:
插个眼白天研究研究
--【拾陆】--:
太强了佬 star双手奉上
--【拾柒】--:
相信我能学会
image477×456 30.4 KB
--【拾捌】--:
先 star 一下,学习学习
--【拾玖】--:
好东西 已star 感谢分享
image964×986 239 KB
前言
NanoBanana Pro出来之后,基于NanoBanana Pro的PPT制作是其中一股比较热门的方向。
前段时间尝试手动AI生成大纲——PPT图片模板——图片拼接,一系列流程下来。做了一些介绍文献的 PPT 感觉效果着实不错,于是着手将其实现为一个工作流平台,方便大家也是方便自己。
用过一些基于画布节点的创作平台,觉得交互起来十分灵活,做好的话能力会相较于一般的 AI PPT 制作软件更强大一些。
开始着手后,想到不能编辑图片,看大家讨论也是受限于此,并不是一个十分灵活 方便的生产力,于是搁置了几天,后来看到佬友的帖子,【开源】上班纯水,终于实现,banana pro生成ppt图片完美转换为可编辑的ppt了,那么你要试试吗?
觉得实现起来又有思路了,直接参考思路,将这一套逻辑内嵌到代码里面,加上这几天完善了一下(全靠Vibe Coding),终于发布了初版——NextCreator 诞生了!基于 Tauri 构建的应用,支持网页端与桌面端(推荐,因为图片占用存储空间大,本地性能更优)。
GitHub - MoonWeSif/NextCreator: 基于可视化节点的 AI 内容生成工作流工具,支持 文本/图片/视频/PPT 链式创作。
基于可视化节点的 AI 内容生成工作流工具,支持 文本/图片/视频/PPT 链式创作。
但是项目最后针对于可编辑 PPT 的实现还是有所局限的,经过测试,发现如果字体有样式与排版规则的话,那么借助佬友的实现思路实现下来,将文字重新嵌入到 PPT 中会有排版布局样式问题。
因此项目最终实现了将生成的 PPT 中的文字全部移除掉,仅保留背景部分(效果见下方图片),文字部分各位下载 PPT 后,自行文本框添加即可,这部分对人来说应该是比较简单的工作,对照着原 PPT 添加文本框即可,但想要借助程序实现下来的话,目前还没有实现思路。
同时编辑 PPT 时,个人来说大部分情景下也是文字部分有修改的需要,背景和排版部分保留,因此对于我来说目前项目是可用的程度了,有功能需求佬友们可以另提意见,有 bug 也可以提 issue,空闲时就修。
两个效果文件,转 PDF 了方便预览(图片有所压缩,原文件有点大):
母猪产后精细化护理技术与管理策略.pdf (344.1 KB)
母猪产后精细化护理技术与管理策略-仅背景.pdf (1.2 MB)
项目介绍
功能特性
- 节点编辑器 - 拖拽式工作流设计,支持撤销/重做、复制粘贴、自动布局
- 多画布管理 - 创建多个独立画布,数据自动持久化
- AI 图片生成 - 支持文生图、图生图,可配置分辨率和比例
- AI 视频生成 - 基于 Sora 模型的视频生成
- LLM 文本生成 - 支持多模态输入(文本/图片/PDF)
- PPT 工作流 - 自动生成大纲、页面图片,导出 PPTX
图片展示
主界面
PPT 工作流
PPT 页面生成
PPT 预览导出
纯图片模式 - 直接导出 PPT 图片
可编辑模式 - 去除文字仅保留背景,方便后期编辑
使用流程
- 配置供应商 - 点击右上角「供应商管理」,添加 API 供应商(使用 Gemini 原生格式请求)
- 分配供应商 - 在供应商管理中为不同节点类型指定供应商
- 创建工作流 - 从左侧节点面板拖拽节点到画布,连接节点构建工作流
- 运行生成 - 填写输入内容,点击节点的生成按钮即可
OCR + Inpaint 服务
如需使用 PPT 可编辑导出功能(去除文字仅保留背景),需要 OCR 和 Inpaint 服务。可以自行 Docker 部署(推荐),项目提供 Dokcer-compose 直接运行,也可以使用公益云服务。
项目提供公益服务,可直接在设置中配置使用:
| 服务 | 地址 | 用途 |
|---|---|---|
| EasyOCR | http://152.67.202.21:8866 |
文字检测识别 |
| IOPaint | http://152.67.202.21:8877 |
AI 背景修复 |
--【壹】--:
大佬牛逼,就等你们做出好看的东西,我来直接用,太强了
--【贰】--:
大佬太强了,先star了
--【叁】--:
生成PPT不支持自定义其他模型么,例如z-image-turbo
image876×652 40.1 KB
--【肆】--:
想法真的非常好,期待干翻lovert。
不过试了一下api节点第三方的很难用,名称匹配不上,未来可期,star了
--【伍】--:
太强了佬
--【陆】--:
大佬,强
--【柒】--:
感谢分享
--【捌】--:
太强了,大佬
--【玖】--:
这个没什么问题,待会支持生图的时候自定义模型名称
--【拾】--:
我用的flow2api,模型名是gemini-3.0-pro-image-landscape,好像用不了
--【拾壹】--:
其他模型效果达不到,对提示词理解能力与出图能力没有 NanoBananaPro 那样强,分辨率也不够,出的 PPT 看起来会比较模糊。(等我加一下这块的自定义模型名,也可以看看效果
--【拾贰】--:
太强了,大佬。今天要课堂作业答辩来着,昨晚、今早按照传统的“大纲+模板”紧急赶制了三十张,效率低了点,人工重复性工作多了,还是不够AI! 感谢大佬!看着会极大提高效率的。
--【拾叁】--:
名称匹配不上是指啥,模型名称吗,主要是考虑到官方一张2k图 1-2 元了,一个 PPT 要是官方 API 几十块出去了,划不来。
--【拾肆】--:
不错,前排点赞
--【拾伍】--:
插个眼白天研究研究
--【拾陆】--:
太强了佬 star双手奉上
--【拾柒】--:
相信我能学会
image477×456 30.4 KB
--【拾捌】--:
先 star 一下,学习学习
--【拾玖】--:
好东西 已star 感谢分享
image964×986 239 KB

