【开源】画布式 AI 工作流创作平台,基于 NanoBananaPro 创作可编辑文字的 PPT,最新楼#45有更新

2026-04-11 11:421阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

前言

NanoBanana Pro出来之后,基于NanoBanana Pro的PPT制作是其中一股比较热门的方向。
前段时间尝试手动AI生成大纲——PPT图片模板——图片拼接,一系列流程下来。做了一些介绍文献的 PPT 感觉效果着实不错,于是着手将其实现为一个工作流平台,方便大家也是方便自己。

用过一些基于画布节点的创作平台,觉得交互起来十分灵活,做好的话能力会相较于一般的 AI PPT 制作软件更强大一些。

开始着手后,想到不能编辑图片,看大家讨论也是受限于此,并不是一个十分灵活 方便的生产力,于是搁置了几天,后来看到佬友的帖子,【开源】上班纯水,终于实现,banana pro生成ppt图片完美转换为可编辑的ppt了,那么你要试试吗?

觉得实现起来又有思路了,直接参考思路,将这一套逻辑内嵌到代码里面,加上这几天完善了一下(全靠Vibe Coding),终于发布了初版——NextCreator 诞生了!基于 Tauri 构建的应用,支持网页端与桌面端(推荐,因为图片占用存储空间大,本地性能更优)。

github.com

GitHub - MoonWeSif/NextCreator: 基于可视化节点的 AI 内容生成工作流工具,支持 文本/图片/视频/PPT 链式创作。

基于可视化节点的 AI 内容生成工作流工具,支持 文本/图片/视频/PPT 链式创作。

但是项目最后针对于可编辑 PPT 的实现还是有所局限的,经过测试,发现如果字体有样式与排版规则的话,那么借助佬友的实现思路实现下来,将文字重新嵌入到 PPT 中会有排版布局样式问题。

因此项目最终实现了将生成的 PPT 中的文字全部移除掉,仅保留背景部分(效果见下方图片),文字部分各位下载 PPT 后,自行文本框添加即可,这部分对人来说应该是比较简单的工作,对照着原 PPT 添加文本框即可,但想要借助程序实现下来的话,目前还没有实现思路。

同时编辑 PPT 时,个人来说大部分情景下也是文字部分有修改的需要,背景和排版部分保留,因此对于我来说目前项目是可用的程度了,有功能需求佬友们可以另提意见,有 bug 也可以提 issue,空闲时就修。

两个效果文件,转 PDF 了方便预览(图片有所压缩,原文件有点大):
母猪产后精细化护理技术与管理策略.pdf (344.1 KB)
母猪产后精细化护理技术与管理策略-仅背景.pdf (1.2 MB)

项目介绍

功能特性

  • 节点编辑器 - 拖拽式工作流设计,支持撤销/重做、复制粘贴、自动布局
  • 多画布管理 - 创建多个独立画布,数据自动持久化
  • AI 图片生成 - 支持文生图、图生图,可配置分辨率和比例
  • AI 视频生成 - 基于 Sora 模型的视频生成
  • LLM 文本生成 - 支持多模态输入(文本/图片/PDF)
  • PPT 工作流 - 自动生成大纲、页面图片,导出 PPTX

图片展示

主界面

PPT 工作流

PPT 页面生成

PPT 预览导出

纯图片模式 - 直接导出 PPT 图片

可编辑模式 - 去除文字仅保留背景,方便后期编辑

使用流程

  1. 配置供应商 - 点击右上角「供应商管理」,添加 API 供应商(使用 Gemini 原生格式请求)
  2. 分配供应商 - 在供应商管理中为不同节点类型指定供应商
  3. 创建工作流 - 从左侧节点面板拖拽节点到画布,连接节点构建工作流
  4. 运行生成 - 填写输入内容,点击节点的生成按钮即可

OCR + Inpaint 服务

如需使用 PPT 可编辑导出功能(去除文字仅保留背景),需要 OCR 和 Inpaint 服务。可以自行 Docker 部署(推荐),项目提供 Dokcer-compose 直接运行,也可以使用公益云服务。

项目提供公益服务,可直接在设置中配置使用:

服务 地址 用途
EasyOCR http://152.67.202.21:8866 文字检测识别
IOPaint http://152.67.202.21:8877 AI 背景修复
网友解答:
--【壹】--:

大佬牛逼,就等你们做出好看的东西,我来直接用,太强了


--【贰】--:

大佬太强了,先star了


--【叁】--:

生成PPT不支持自定义其他模型么,例如z-image-turbo
image876×652 40.1 KB


--【肆】--:

想法真的非常好,期待干翻lovert。
不过试了一下api节点第三方的很难用,名称匹配不上,未来可期,star了


--【伍】--:

太强了佬


--【陆】--:

大佬,强


--【柒】--:

感谢分享


--【捌】--:

太强了,大佬


--【玖】--:

这个没什么问题,待会支持生图的时候自定义模型名称


--【拾】--:

我用的flow2api,模型名是gemini-3.0-pro-image-landscape,好像用不了


--【拾壹】--:

其他模型效果达不到,对提示词理解能力与出图能力没有 NanoBananaPro 那样强,分辨率也不够,出的 PPT 看起来会比较模糊。(等我加一下这块的自定义模型名,也可以看看效果


--【拾贰】--:

太强了,大佬。今天要课堂作业答辩来着,昨晚、今早按照传统的“大纲+模板”紧急赶制了三十张,效率低了点,人工重复性工作多了,还是不够AI! 感谢大佬!看着会极大提高效率的。


--【拾叁】--:

名称匹配不上是指啥,模型名称吗,主要是考虑到官方一张2k图 1-2 元了,一个 PPT 要是官方 API 几十块出去了,划不来。


--【拾肆】--:

不错,前排点赞


--【拾伍】--:

插个眼白天研究研究


--【拾陆】--:

太强了佬 star双手奉上


--【拾柒】--:

相信我能学会

image477×456 30.4 KB


--【拾捌】--:

先 star 一下,学习学习


--【拾玖】--:

好东西 已star 感谢分享
image964×986 239 KB