给中转Api的 Codex和Claude 调用 gpt-image2的 Skill !支持图片生成改图
- 内容介绍
- 文章标签
- 相关推荐
我在 Claude Code 调用gpt-image2,封装整理成了一个可复用的 skill,名字叫 gen-images。
它的目标很简单:
- 在 Claude Code 里直接用自然语言生成图片
- 支持文生图和改图
- 支持自动触发,也支持手动用
/gen-images ... - 自动读取当前用户 Claude Code 配置里的 API Base URL 和 Token
- 自动把生成结果保存到本地目录
如果你也在用 CLIProxyAPI 反代Codex到 Claude Code,这套 skill 可以直接复用。
Codex中转的同学可以下载Skill,让Codex帮你安装即可
一、这个 skill 能做什么
1. 文生图
可以直接这样用:
/gen-images 生成一张透明背景的猫咪头像,1024x1024,png
或者自然语言触发:
使用 gpt-image-2 生成一张透明背景的猫咪头像
2. 改图 / 编辑图片
例如:
/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp
支持的图片来源:
- 本地文件路径
- 图片 URL
- data URL
3. 自动补字段
这个 skill 会自动从自然语言里提取常见参数,比如:
- 尺寸 size
- 质量 quality
- 背景 background
- 输出格式 output_format
- 生成张数 n
如果缺少关键字段:
- 文生图缺提示词,会追问 prompt
- 改图缺图片来源,会提示你提供:
- 本地路径
- 图片 URL / data URL
二、使用前提
在安装和使用这个 skill 之前,请先确认以下条件满足:
1. CLIProxyAPI 版本要求
CLIProxyAPI 版本必须 ≥ v6.9.34
这是前提条件。低版本不保证支持当前这套图片接口能力和参数。
2. Python 环境
本 skill 通过 Python 脚本真正发起图片接口请求,因此本机需要可用的 Python 环境。
建议确认至少满足:
py --version
如果这条命令能正常输出版本号,就说明基本满足运行条件。
3. Claude Code 配置中已设置 API 信息
本 skill 会自动从 Claude Code 当前用户配置中读取:
env.ANTHROPIC_BASE_URLenv.ANTHROPIC_AUTH_TOKEN
读取位置:
~/.claude/settings.json
也就是说,你需要先让 Claude Code 当前环境本身已经配置好 Base URL 和 Token。
4. 后端已支持图片接口
你的反代链路需要支持以下接口:
POST /v1/images/generationsPOST /v1/images/edits
三、支持的 size 规则
目前这版 gen-images 中,size 规则整理成了下面这些:
1024x1024(1:1)1024x1536(3:4)1536x1024(4:3)2048x2048(1:1)3840x2160(16:9)2160x3840(9:16)auto
也就是说,下面这些写法都能识别:
1:1
3:4
4:3
16:9
9:16
1024x1024
1024x1536
1536x1024
2048x2048
3840x2160
2160x3840
auto
其中:
2160x38403840x2160
在我当前这套 CLIProxyAPI + gpt-image-2 链路里已经做过实测,可以成功生成,但是提示词不能过于复杂,否则会报错:stream disconnected before completion
需要注意的是,这两个值不等同于 OpenAI 官方公开文档中列出的标准 size 枚举,它们更准确地说是:
- 当前链路下实测可用的兼容尺寸
所以如果你换了不同的代理版本、不同后端或者不同模型,建议自己再做一次最小对照测试。
四、安装方法
把 gen-images 整个目录复制到你的 Claude Code 用户级 skills 目录:
~/.claude/skills/
最终结构应为:
~/.claude/skills/gen-images/SKILL.md
~/.claude/skills/gen-images/scripts/gen_images.py
~/.claude/skills/gen-images/references/fields.md
Windows 下通常对应:
C:\Users\你的用户名\.claude\skills\gen-images\
复制完成后:
- 重启 Claude Code
- 或执行插件 / skill 重载
- 然后直接测试
/gen-images
五、使用示例
示例 1:文生图
/gen-images 生成一张透明背景的猫咪头像,1024x1024,png
示例 2:竖版高分辨率图
/gen-images 生成一张赛博朋克风格的机甲少女全身像,9:16,png,高清
示例 3:改图
/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp
示例 4:信息图 / 图鉴类
/gen-images 根据{明代女子图鉴}自动生成一张博物馆图鉴式中文拆解信息图,9:16,png,高清
六、输出行为
默认情况下,生成结果会保存到当前工作目录下:
./gen-images/
成功后,Claude 会返回类似这样的结果:
图片已生成, 图片路径: C:\Users\xxx\gen-images\20260424-003204-01.png
实际使用的关键参数: model=gpt-image-2, size=2160x3840, quality=high, output_format=png, n=1
失败时则会返回简短错误原因,例如:
生成失败: 缺少 prompt
七、这个 skill 的特点
我自己比较看重的点有这些:
1. 不需要手动拼接口请求
不用自己写 curl、也不用每次都手写 JSON。
2. 支持自然语言参数提取
比如:
高清→quality=high透明背景→background=transparent9:16→size=2160x3840png/webp/jpg→output_format
3. 同时支持自动触发和 slash 调用
既可以直接说:
使用 gpt-image-2 生成图片
也可以手动输入:
/gen-images ...
4. 自动读取当前 Claude Code 配置
不需要在 skill 里额外写死 API Base URL 和 Token。
八、适合哪些人用
这套 skill 比较适合:
- 已经在用 Claude Code
- 已经通过 CLIProxyAPI 接好了图片模型
- 想把"生图 / 改图"变成日常工作流的一部分
- 不想每次手动拼图片接口请求
九、注意事项
- 本 skill 依赖 Python 环境
- 本 skill 默认从
~/.claude/settings.json读取 API 配置 - 你的 CLIProxyAPI 版本必须 ≥
v6.9.34 2160x3840/3840x2160是当前链路实测可用,不代表所有后端都一致支持- 如果复杂长提示词在超大尺寸下偶发失败,优先做最小提示词对照测试,判断是尺寸问题还是后端稳定性问题
十、如果你也想装同款 skill
你只需要:
- 把
gen-images文件夹复制到~/.claude/skills/ - 确认
CLIProxyAPI >= v6.9.34 - 确认本机可运行
py --version - 确认
~/.claude/settings.json里已经配置好:env.ANTHROPIC_BASE_URLenv.ANTHROPIC_AUTH_TOKEN
然后就可以直接开始用。
如果你后面还想扩展,我觉得还可以继续往下做:
- 加更多自然语言参数映射
- 加白名单校验
- 加更完整的错误提示
- 加 README / 仓库打包 / 发布版说明
十一、结语
如果你本身就在用 Claude Code + CLIProxyAPI,这个 gen-images skill 其实很适合拿来当一个可复用的图片工作流入口。
它不是单纯的脚本,而是把:
- 参数识别
- 交互补全
- 接口调用
- 文件落地
- 结果回传
整合成了 Claude Code 里可直接使用的一套体验。
如果论坛里有人需要,我也建议你们在自己环境里先跑一次最小提示词测试,确认当前代理链路对高分辨率尺寸的支持情况,再正式投入日常使用。
附带
gen-images.zip (18.3 KB)
网友解答:--【壹】--:
应该可以设置jpg吧…背景确实不能透明,会报错
--【贰】--:
感谢佬!昨天哈机密刚下,正愁怎么办呢,这一下舒服了
--【叁】--:
已更新Skill:支持中转Codex调用gpt-image2 图像生成/改图
--【肆】--:
官方说明里面提到是api不支持透明背景。
--【伍】--:
我也刚做了个小龙虾和Hermes的。
https://linux.do/t/topic/2042184
不过佬的应该比我专业。
话说图片格式,Hermes和我说没法设置jpg(还是调用其他工具?)另外背景似乎也不能透明。其他功能马马虎虎也都折腾出来了。
--【陆】--:
正好在研究如何图生图方面的东西. 看到了佬的分享. 下载下来学习, 十分感谢
--【柒】--:
大佬免费号能用吗?还是说必须付费号才行。
--【捌】--:
image1629×1359 184 KB
image1623×1323 395 KB
免费的是可以的,你可以找个官网gpt2api的项目部署一下,然后自己让codex帮你创建个skill,或者用楼主的skill,我的是自己创建的skill
我在 Claude Code 调用gpt-image2,封装整理成了一个可复用的 skill,名字叫 gen-images。
它的目标很简单:
- 在 Claude Code 里直接用自然语言生成图片
- 支持文生图和改图
- 支持自动触发,也支持手动用
/gen-images ... - 自动读取当前用户 Claude Code 配置里的 API Base URL 和 Token
- 自动把生成结果保存到本地目录
如果你也在用 CLIProxyAPI 反代Codex到 Claude Code,这套 skill 可以直接复用。
Codex中转的同学可以下载Skill,让Codex帮你安装即可
一、这个 skill 能做什么
1. 文生图
可以直接这样用:
/gen-images 生成一张透明背景的猫咪头像,1024x1024,png
或者自然语言触发:
使用 gpt-image-2 生成一张透明背景的猫咪头像
2. 改图 / 编辑图片
例如:
/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp
支持的图片来源:
- 本地文件路径
- 图片 URL
- data URL
3. 自动补字段
这个 skill 会自动从自然语言里提取常见参数,比如:
- 尺寸 size
- 质量 quality
- 背景 background
- 输出格式 output_format
- 生成张数 n
如果缺少关键字段:
- 文生图缺提示词,会追问 prompt
- 改图缺图片来源,会提示你提供:
- 本地路径
- 图片 URL / data URL
二、使用前提
在安装和使用这个 skill 之前,请先确认以下条件满足:
1. CLIProxyAPI 版本要求
CLIProxyAPI 版本必须 ≥ v6.9.34
这是前提条件。低版本不保证支持当前这套图片接口能力和参数。
2. Python 环境
本 skill 通过 Python 脚本真正发起图片接口请求,因此本机需要可用的 Python 环境。
建议确认至少满足:
py --version
如果这条命令能正常输出版本号,就说明基本满足运行条件。
3. Claude Code 配置中已设置 API 信息
本 skill 会自动从 Claude Code 当前用户配置中读取:
env.ANTHROPIC_BASE_URLenv.ANTHROPIC_AUTH_TOKEN
读取位置:
~/.claude/settings.json
也就是说,你需要先让 Claude Code 当前环境本身已经配置好 Base URL 和 Token。
4. 后端已支持图片接口
你的反代链路需要支持以下接口:
POST /v1/images/generationsPOST /v1/images/edits
三、支持的 size 规则
目前这版 gen-images 中,size 规则整理成了下面这些:
1024x1024(1:1)1024x1536(3:4)1536x1024(4:3)2048x2048(1:1)3840x2160(16:9)2160x3840(9:16)auto
也就是说,下面这些写法都能识别:
1:1
3:4
4:3
16:9
9:16
1024x1024
1024x1536
1536x1024
2048x2048
3840x2160
2160x3840
auto
其中:
2160x38403840x2160
在我当前这套 CLIProxyAPI + gpt-image-2 链路里已经做过实测,可以成功生成,但是提示词不能过于复杂,否则会报错:stream disconnected before completion
需要注意的是,这两个值不等同于 OpenAI 官方公开文档中列出的标准 size 枚举,它们更准确地说是:
- 当前链路下实测可用的兼容尺寸
所以如果你换了不同的代理版本、不同后端或者不同模型,建议自己再做一次最小对照测试。
四、安装方法
把 gen-images 整个目录复制到你的 Claude Code 用户级 skills 目录:
~/.claude/skills/
最终结构应为:
~/.claude/skills/gen-images/SKILL.md
~/.claude/skills/gen-images/scripts/gen_images.py
~/.claude/skills/gen-images/references/fields.md
Windows 下通常对应:
C:\Users\你的用户名\.claude\skills\gen-images\
复制完成后:
- 重启 Claude Code
- 或执行插件 / skill 重载
- 然后直接测试
/gen-images
五、使用示例
示例 1:文生图
/gen-images 生成一张透明背景的猫咪头像,1024x1024,png
示例 2:竖版高分辨率图
/gen-images 生成一张赛博朋克风格的机甲少女全身像,9:16,png,高清
示例 3:改图
/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp
示例 4:信息图 / 图鉴类
/gen-images 根据{明代女子图鉴}自动生成一张博物馆图鉴式中文拆解信息图,9:16,png,高清
六、输出行为
默认情况下,生成结果会保存到当前工作目录下:
./gen-images/
成功后,Claude 会返回类似这样的结果:
图片已生成, 图片路径: C:\Users\xxx\gen-images\20260424-003204-01.png
实际使用的关键参数: model=gpt-image-2, size=2160x3840, quality=high, output_format=png, n=1
失败时则会返回简短错误原因,例如:
生成失败: 缺少 prompt
七、这个 skill 的特点
我自己比较看重的点有这些:
1. 不需要手动拼接口请求
不用自己写 curl、也不用每次都手写 JSON。
2. 支持自然语言参数提取
比如:
高清→quality=high透明背景→background=transparent9:16→size=2160x3840png/webp/jpg→output_format
3. 同时支持自动触发和 slash 调用
既可以直接说:
使用 gpt-image-2 生成图片
也可以手动输入:
/gen-images ...
4. 自动读取当前 Claude Code 配置
不需要在 skill 里额外写死 API Base URL 和 Token。
八、适合哪些人用
这套 skill 比较适合:
- 已经在用 Claude Code
- 已经通过 CLIProxyAPI 接好了图片模型
- 想把"生图 / 改图"变成日常工作流的一部分
- 不想每次手动拼图片接口请求
九、注意事项
- 本 skill 依赖 Python 环境
- 本 skill 默认从
~/.claude/settings.json读取 API 配置 - 你的 CLIProxyAPI 版本必须 ≥
v6.9.34 2160x3840/3840x2160是当前链路实测可用,不代表所有后端都一致支持- 如果复杂长提示词在超大尺寸下偶发失败,优先做最小提示词对照测试,判断是尺寸问题还是后端稳定性问题
十、如果你也想装同款 skill
你只需要:
- 把
gen-images文件夹复制到~/.claude/skills/ - 确认
CLIProxyAPI >= v6.9.34 - 确认本机可运行
py --version - 确认
~/.claude/settings.json里已经配置好:env.ANTHROPIC_BASE_URLenv.ANTHROPIC_AUTH_TOKEN
然后就可以直接开始用。
如果你后面还想扩展,我觉得还可以继续往下做:
- 加更多自然语言参数映射
- 加白名单校验
- 加更完整的错误提示
- 加 README / 仓库打包 / 发布版说明
十一、结语
如果你本身就在用 Claude Code + CLIProxyAPI,这个 gen-images skill 其实很适合拿来当一个可复用的图片工作流入口。
它不是单纯的脚本,而是把:
- 参数识别
- 交互补全
- 接口调用
- 文件落地
- 结果回传
整合成了 Claude Code 里可直接使用的一套体验。
如果论坛里有人需要,我也建议你们在自己环境里先跑一次最小提示词测试,确认当前代理链路对高分辨率尺寸的支持情况,再正式投入日常使用。
附带
gen-images.zip (18.3 KB)
网友解答:--【壹】--:
应该可以设置jpg吧…背景确实不能透明,会报错
--【贰】--:
感谢佬!昨天哈机密刚下,正愁怎么办呢,这一下舒服了
--【叁】--:
已更新Skill:支持中转Codex调用gpt-image2 图像生成/改图
--【肆】--:
官方说明里面提到是api不支持透明背景。
--【伍】--:
我也刚做了个小龙虾和Hermes的。
https://linux.do/t/topic/2042184
不过佬的应该比我专业。
话说图片格式,Hermes和我说没法设置jpg(还是调用其他工具?)另外背景似乎也不能透明。其他功能马马虎虎也都折腾出来了。
--【陆】--:
正好在研究如何图生图方面的东西. 看到了佬的分享. 下载下来学习, 十分感谢
--【柒】--:
大佬免费号能用吗?还是说必须付费号才行。
--【捌】--:
image1629×1359 184 KB
image1623×1323 395 KB
免费的是可以的,你可以找个官网gpt2api的项目部署一下,然后自己让codex帮你创建个skill,或者用楼主的skill,我的是自己创建的skill

