【开源】一份超高质量+个性化定制的PPT生成skill,两天破300stars(依赖gpt image2,4.28更新编辑效果修复)

2026-04-29 08:112阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

4.28号日志:有些人有怎么局部编辑的疑惑,可以看我下面流程的第7点,更新了一下内容,个人认为还是比较指哪打哪且不动其他地方的,还有就是之前的skill版本有bug,更新了下,已经推送GitHub)

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

话不多说,直接上图(专门选取了几个不同方向的应用来展示个性化):

image1500×757 255 KB
image1494×762 323 KB
image1508×785 190 KB
image1504×759 229 KB

想直接试效果的佬友可以直接下载试试了: NyxTides/ppt-image-first: PPT image-first skill for Codex CLI

下面是介绍和阶段
特点:无模板、个性化设计、全流程把控、全程可介入可编辑。

1.项目分析阶段
agent会结合项目和你的需求来进行一些判断和分析,写一份content_report.md,这个阶段没什么好说的,一分钟完事,主要是需求对齐。

2.生成预览
skill会根据你要写的东西和你的选择,分成8个维度去帮你选择最适合的几种风格,生成几套风格合适的PPT预览图,不满意可以提出自己的需求,比如:基于C风格再演化出几版,就会再来一次,直到你满意。
image1759×915 271 KB

3.风格反演
用户选择喜欢的模板后,skill会根据该风格反演出其中的风格、样式等(因为生图总会带来一些偏差,用户可能喜欢的是生图模型的某些即兴发挥),反演完就会确认用户需求。
image1485×927 50.1 KB

4.风格确立
这阶段会形成设计风格、风格锁和PPT分页摘要的三份文件,防止风格漂移,并等待用户确认,确认后就进入正式生图。

5.正式生图
可选择每页PPT生成几份候选图。(其实一般一份已经足够强大了,我展示的前两份PPT都是一次抽卡的结果)

6.挑选喜欢序列点击复制(如果上一步生成1份这一步会自动跳过)
选择自己喜欢的点击复制。
image1803×914 230 KB

7.最终审稿
这一步可以直接在界面上进行注释和写画,然后点击复制当前页结果或复制按钮粘贴给agent,可以避免PPT的写者锁,并且可以精细化修改,如图,除了我想要的都没动。(老版本的有bug,精细化修改会出问题,需要更新下skill)
image1746×890 307 KB
image1743×881 275 KB

8.最终成稿
于是就得到一份高质量定制化的PPT。
image1498×780 193 KB
ppt-image-first.pdf (2.2 MB)

核心出装就是gpt image2(当然其他生图模型也行,就是效果应该一般),只要你不嫌弃他是图片型PPT就行,毕竟也以图编辑的方式实现了图片型PPT的可编辑性,可以框选、注释,模型收到后走image2的图编辑接口就可以定点改、局部改(生图和编辑具体方法没在skill中要求,skill中的陈述就是生图和编辑,所以你用其他的生图模型也可以,我的生图实现方法是在本地实现了另一个skill,可以直接并发调用生图和编辑功能,一次性所有图片一起生成,这样生成会很快)

只有free号的佬友也可以通过社区开源的gpt网页生图额度反代项目试试。

NyxTides/ppt-image-first: PPT image-first skill for Codex CLI

网友解答:
--【壹】--:

看着不错,给star了,其实图片生成ppt效果我感觉一直都不错,notebooklm去年底证明了这种方式肯定比直接去做ppt效果好很多,就是图片很多元素没法细调,notebooklm去年就说会出会出直接可以修改的ppt,但是直到今年都没出,看来这个过程中间难度确实很大


--【贰】--:

这个厉害 刚好下周课题组里的文献汇报轮到我了,拿来试试做文献汇报的PPT


--【叁】--:

太厉害了,试用一下,以后ppt自由了,太爽了


--【肆】--:

感谢,确实好用。顺便推荐一下我写的newapi的codex渠道的gpt-image-2补丁

github.com

GitHub - jaredshuai/new-api: A unified AI model hub for aggregation &...

A unified AI model hub for aggregation & distribution. It supports cross-converting various LLMs into OpenAI-compatible, Claude-compatible, or Gemini-compatible formats. A centralized gateway for personal and enterprise model management. 🍥


--【伍】--:

看佬友贴的效果图,太惊艳了吧,感觉ai味没那么浓了,真优秀!


--【陆】--:

很好的工具,借助image2的强大生图能力的ppt制作skills。其中image2的api接口这一块是如何配置的呢?


--【柒】--:

已STAR。很好的技能。但是有个问题,我经常会需要把已经有的图片插入到这个ppt中,比如你提到的毕业答辩这类,有些时候需要把自己的图片整合到ppt中。像这种的怎么弄呢


--【捌】--:

这个是真可以,已经star了,内部汇报做ppt的时候总感觉头疼,即使用豆包生成也还是需要花大量时间去调整,下次组内分享的时候试试


--【玖】--:

感觉可以在第一步需求对齐的时候就告诉他有几张图,让他读一下,规划好这几张图放在哪些slide,然后在生成PPT的时候在合适页预留空白框,后续你自己把图片拖进去就行
我刚才试了下,没有在前面就说明,但是在最后一步微调告诉他了,感觉是可以的
image1779×894 264 KB


--【拾】--:

学不完了,完全学不完了,以前还有个 ppt-skill 还是啥 这类工具越来越多了!


--【拾壹】--:

这个得收藏一下,最近做ppt,可能还得多次来请教一下了


--【拾贰】--:

不用配置在这个skill里,只要codex有生图能力就行,openai给plus号的codex下放了生图模型,可以直接让codex生成,内置了一个imagegen skill,只有free号的话就你自己用网页版反代,自己另写一个skill,里面写api和怎么调用就行,就是你不需要给我这个skill单独配置图像生成能力,你让codex有图像生成能力就行,这个skill会自己找到并调用的


--【拾叁】--:

还有html,只能说办公三件套现在还是无法翻过的大山


--【拾肆】--:

是这样的,就是页面元素不好修改,不过image2提供了生图和编辑图两个接口,走编辑的话局部改效果个人感觉还是不错的


--【拾伍】--:

看起来效果很好,谢谢佬开源,又得到一个不错的SKILL


--【拾陆】--:

做的效果真好,非常不错,可以拿来试试。感谢大佬


--【拾柒】--:

现在做PPT明显变成两个方向了,一个是纯图,一个是SVG


--【拾捌】--:

支持佬,看着挺不错的,已点star,这就试试怎么样


--【拾玖】--:

支持一下给个star , 期末作业有盼头了