给中转Api的 Codex和Claude 调用 gpt-image2的 Skill ！支持图片生成改图

2026-04-29 09:372阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

我在 Claude Code 调用gpt-image2，封装整理成了一个可复用的 skill，名字叫 gen-images。

它的目标很简单：

在 Claude Code 里直接用自然语言生成图片
支持文生图和改图
支持自动触发，也支持手动用 /gen-images ...
自动读取当前用户 Claude Code 配置里的 API Base URL 和 Token
自动把生成结果保存到本地目录

如果你也在用 CLIProxyAPI 反代Codex到 Claude Code，这套 skill 可以直接复用。

Codex中转的同学可以下载Skill，让Codex帮你安装即可

一、这个 skill 能做什么

1. 文生图

可以直接这样用：

/gen-images 生成一张透明背景的猫咪头像，1024x1024，png

或者自然语言触发：

使用 gpt-image-2 生成一张透明背景的猫咪头像

2. 改图 / 编辑图片

例如：

/gen-images 把 ./input.png 改成水彩风，保留主体，输出 webp

支持的图片来源：

本地文件路径
图片 URL
data URL

3. 自动补字段

这个 skill 会自动从自然语言里提取常见参数，比如：

尺寸 size
质量 quality
背景 background
输出格式 output_format
生成张数 n

如果缺少关键字段：

文生图缺提示词，会追问 prompt
改图缺图片来源，会提示你提供：
1. 本地路径
2. 图片 URL / data URL

二、使用前提

在安装和使用这个 skill 之前，请先确认以下条件满足：

1. CLIProxyAPI 版本要求

CLIProxyAPI 版本必须 ≥ v6.9.34

这是前提条件。低版本不保证支持当前这套图片接口能力和参数。

2. Python 环境

本 skill 通过 Python 脚本真正发起图片接口请求，因此本机需要可用的 Python 环境。

建议确认至少满足：

py --version

如果这条命令能正常输出版本号，就说明基本满足运行条件。

3. Claude Code 配置中已设置 API 信息

本 skill 会自动从 Claude Code 当前用户配置中读取：

env.ANTHROPIC_BASE_URL
env.ANTHROPIC_AUTH_TOKEN

读取位置：

~/.claude/settings.json

也就是说，你需要先让 Claude Code 当前环境本身已经配置好 Base URL 和 Token。

4. 后端已支持图片接口

你的反代链路需要支持以下接口：

POST /v1/images/generations
POST /v1/images/edits

三、支持的 size 规则

目前这版 gen-images 中，size 规则整理成了下面这些：

1024x1024（1:1）
1024x1536（3:4）
1536x1024（4:3）
2048x2048（1:1）
3840x2160（16:9）
2160x3840（9:16）
auto

也就是说，下面这些写法都能识别：

1:1 3:4 4:3 16:9 9:16 1024x1024 1024x1536 1536x1024 2048x2048 3840x2160 2160x3840 auto

其中：

2160x3840
3840x2160

在我当前这套 CLIProxyAPI + gpt-image-2 链路里已经做过实测，可以成功生成，但是提示词不能过于复杂，否则会报错：stream disconnected before completion

需要注意的是，这两个值不等同于 OpenAI 官方公开文档中列出的标准 size 枚举，它们更准确地说是：

当前链路下实测可用的兼容尺寸

所以如果你换了不同的代理版本、不同后端或者不同模型，建议自己再做一次最小对照测试。

四、安装方法

把 gen-images 整个目录复制到你的 Claude Code 用户级 skills 目录：

~/.claude/skills/

最终结构应为：

~/.claude/skills/gen-images/SKILL.md ~/.claude/skills/gen-images/scripts/gen_images.py ~/.claude/skills/gen-images/references/fields.md

Windows 下通常对应：

C:\Users\你的用户名\.claude\skills\gen-images\

复制完成后：

重启 Claude Code
或执行插件 / skill 重载
然后直接测试 /gen-images

五、使用示例

示例 1：文生图

/gen-images 生成一张透明背景的猫咪头像，1024x1024，png

示例 2：竖版高分辨率图

/gen-images 生成一张赛博朋克风格的机甲少女全身像，9:16，png，高清

示例 3：改图

/gen-images 把 ./input.png 改成水彩风，保留主体，输出 webp

示例 4：信息图 / 图鉴类

/gen-images 根据{明代女子图鉴}自动生成一张博物馆图鉴式中文拆解信息图，9:16，png，高清

六、输出行为

默认情况下，生成结果会保存到当前工作目录下：

./gen-images/

成功后，Claude 会返回类似这样的结果：

图片已生成, 图片路径: C:\Users\xxx\gen-images\20260424-003204-01.png 实际使用的关键参数: model=gpt-image-2, size=2160x3840, quality=high, output_format=png, n=1

失败时则会返回简短错误原因，例如：

生成失败: 缺少 prompt

七、这个 skill 的特点

我自己比较看重的点有这些：

1. 不需要手动拼接口请求

不用自己写 curl、也不用每次都手写 JSON。

2. 支持自然语言参数提取

比如：

高清 → quality=high
透明背景 → background=transparent
9:16 → size=2160x3840
png/webp/jpg → output_format

3. 同时支持自动触发和 slash 调用

既可以直接说：

使用 gpt-image-2 生成图片

也可以手动输入：

/gen-images ...

4. 自动读取当前 Claude Code 配置

不需要在 skill 里额外写死 API Base URL 和 Token。

八、适合哪些人用

这套 skill 比较适合：

已经在用 Claude Code
已经通过 CLIProxyAPI 接好了图片模型
想把"生图 / 改图"变成日常工作流的一部分
不想每次手动拼图片接口请求

九、注意事项

本 skill 依赖 Python 环境
本 skill 默认从 ~/.claude/settings.json 读取 API 配置
你的 CLIProxyAPI 版本必须 ≥ v6.9.34
2160x3840 / 3840x2160 是当前链路实测可用，不代表所有后端都一致支持
如果复杂长提示词在超大尺寸下偶发失败，优先做最小提示词对照测试，判断是尺寸问题还是后端稳定性问题

十、如果你也想装同款 skill

你只需要：

把 gen-images 文件夹复制到 ~/.claude/skills/
确认 CLIProxyAPI >= v6.9.34
确认本机可运行 py --version
确认 ~/.claude/settings.json 里已经配置好：
- env.ANTHROPIC_BASE_URL
- env.ANTHROPIC_AUTH_TOKEN

然后就可以直接开始用。

如果你后面还想扩展，我觉得还可以继续往下做：

加更多自然语言参数映射
加白名单校验
加更完整的错误提示
加 README / 仓库打包 / 发布版说明

十一、结语

如果你本身就在用 Claude Code + CLIProxyAPI，这个 gen-images skill 其实很适合拿来当一个可复用的图片工作流入口。

它不是单纯的脚本，而是把：

参数识别
交互补全
接口调用
文件落地
结果回传

整合成了 Claude Code 里可直接使用的一套体验。

如果论坛里有人需要，我也建议你们在自己环境里先跑一次最小提示词测试，确认当前代理链路对高分辨率尺寸的支持情况，再正式投入日常使用。

附带

gen-images.zip (18.3 KB)

网友解答：

--【壹】--：

应该可以设置jpg吧…背景确实不能透明，会报错

--【贰】--：

感谢佬！昨天哈机密刚下，正愁怎么办呢，这一下舒服了

--【叁】--：

已更新Skill:支持中转Codex调用gpt-image2 图像生成/改图

--【肆】--：

官方说明里面提到是api不支持透明背景。

--【伍】--：

我也刚做了个小龙虾和Hermes的。

https://linux.do/t/topic/2042184

不过佬的应该比我专业。

话说图片格式，Hermes和我说没法设置jpg（还是调用其他工具？）另外背景似乎也不能透明。其他功能马马虎虎也都折腾出来了。

--【陆】--：

正好在研究如何图生图方面的东西. 看到了佬的分享. 下载下来学习, 十分感谢

--【柒】--：

大佬免费号能用吗？还是说必须付费号才行。

--【捌】--：

image1629×1359 184 KB
image1623×1323 395 KB

免费的是可以的，你可以找个官网gpt2api的项目部署一下，然后自己让codex帮你创建个skill，或者用楼主的skill，我的是自己创建的skill

标签：ChatGpt OpenAI 软件开发 ClaudeCode Skills

问题描述：

我在 Claude Code 调用gpt-image2，封装整理成了一个可复用的 skill，名字叫 gen-images。

它的目标很简单：

在 Claude Code 里直接用自然语言生成图片
支持文生图和改图
支持自动触发，也支持手动用 /gen-images ...
自动读取当前用户 Claude Code 配置里的 API Base URL 和 Token
自动把生成结果保存到本地目录

如果你也在用 CLIProxyAPI 反代Codex到 Claude Code，这套 skill 可以直接复用。

Codex中转的同学可以下载Skill，让Codex帮你安装即可

一、这个 skill 能做什么

1. 文生图

可以直接这样用：

/gen-images 生成一张透明背景的猫咪头像，1024x1024，png

或者自然语言触发：

使用 gpt-image-2 生成一张透明背景的猫咪头像

2. 改图 / 编辑图片

例如：

/gen-images 把 ./input.png 改成水彩风，保留主体，输出 webp

支持的图片来源：

本地文件路径
图片 URL
data URL

3. 自动补字段

这个 skill 会自动从自然语言里提取常见参数，比如：

尺寸 size
质量 quality
背景 background
输出格式 output_format
生成张数 n

如果缺少关键字段：

文生图缺提示词，会追问 prompt
改图缺图片来源，会提示你提供：
1. 本地路径
2. 图片 URL / data URL

二、使用前提

在安装和使用这个 skill 之前，请先确认以下条件满足：

1. CLIProxyAPI 版本要求

CLIProxyAPI 版本必须 ≥ v6.9.34

这是前提条件。低版本不保证支持当前这套图片接口能力和参数。

2. Python 环境

本 skill 通过 Python 脚本真正发起图片接口请求，因此本机需要可用的 Python 环境。

建议确认至少满足：

py --version

如果这条命令能正常输出版本号，就说明基本满足运行条件。

3. Claude Code 配置中已设置 API 信息

本 skill 会自动从 Claude Code 当前用户配置中读取：

env.ANTHROPIC_BASE_URL
env.ANTHROPIC_AUTH_TOKEN

读取位置：

~/.claude/settings.json

也就是说，你需要先让 Claude Code 当前环境本身已经配置好 Base URL 和 Token。

4. 后端已支持图片接口

你的反代链路需要支持以下接口：

POST /v1/images/generations
POST /v1/images/edits

三、支持的 size 规则

目前这版 gen-images 中，size 规则整理成了下面这些：

1024x1024（1:1）
1024x1536（3:4）
1536x1024（4:3）
2048x2048（1:1）
3840x2160（16:9）
2160x3840（9:16）
auto

也就是说，下面这些写法都能识别：

1:1 3:4 4:3 16:9 9:16 1024x1024 1024x1536 1536x1024 2048x2048 3840x2160 2160x3840 auto

其中：

2160x3840
3840x2160

在我当前这套 CLIProxyAPI + gpt-image-2 链路里已经做过实测，可以成功生成，但是提示词不能过于复杂，否则会报错：stream disconnected before completion

需要注意的是，这两个值不等同于 OpenAI 官方公开文档中列出的标准 size 枚举，它们更准确地说是：

当前链路下实测可用的兼容尺寸

所以如果你换了不同的代理版本、不同后端或者不同模型，建议自己再做一次最小对照测试。

四、安装方法

把 gen-images 整个目录复制到你的 Claude Code 用户级 skills 目录：

~/.claude/skills/

最终结构应为：

~/.claude/skills/gen-images/SKILL.md ~/.claude/skills/gen-images/scripts/gen_images.py ~/.claude/skills/gen-images/references/fields.md

Windows 下通常对应：

C:\Users\你的用户名\.claude\skills\gen-images\

复制完成后：

重启 Claude Code
或执行插件 / skill 重载
然后直接测试 /gen-images

五、使用示例

示例 1：文生图

/gen-images 生成一张透明背景的猫咪头像，1024x1024，png

示例 2：竖版高分辨率图

/gen-images 生成一张赛博朋克风格的机甲少女全身像，9:16，png，高清

示例 3：改图

/gen-images 把 ./input.png 改成水彩风，保留主体，输出 webp

示例 4：信息图 / 图鉴类

/gen-images 根据{明代女子图鉴}自动生成一张博物馆图鉴式中文拆解信息图，9:16，png，高清

六、输出行为

默认情况下，生成结果会保存到当前工作目录下：

./gen-images/

成功后，Claude 会返回类似这样的结果：

图片已生成, 图片路径: C:\Users\xxx\gen-images\20260424-003204-01.png 实际使用的关键参数: model=gpt-image-2, size=2160x3840, quality=high, output_format=png, n=1

失败时则会返回简短错误原因，例如：

生成失败: 缺少 prompt

七、这个 skill 的特点

我自己比较看重的点有这些：

1. 不需要手动拼接口请求

不用自己写 curl、也不用每次都手写 JSON。

2. 支持自然语言参数提取

比如：

高清 → quality=high
透明背景 → background=transparent
9:16 → size=2160x3840
png/webp/jpg → output_format

3. 同时支持自动触发和 slash 调用

既可以直接说：

使用 gpt-image-2 生成图片

也可以手动输入：

/gen-images ...

4. 自动读取当前 Claude Code 配置

不需要在 skill 里额外写死 API Base URL 和 Token。

八、适合哪些人用

这套 skill 比较适合：

已经在用 Claude Code
已经通过 CLIProxyAPI 接好了图片模型
想把"生图 / 改图"变成日常工作流的一部分
不想每次手动拼图片接口请求

九、注意事项

本 skill 依赖 Python 环境
本 skill 默认从 ~/.claude/settings.json 读取 API 配置
你的 CLIProxyAPI 版本必须 ≥ v6.9.34
2160x3840 / 3840x2160 是当前链路实测可用，不代表所有后端都一致支持
如果复杂长提示词在超大尺寸下偶发失败，优先做最小提示词对照测试，判断是尺寸问题还是后端稳定性问题

十、如果你也想装同款 skill

你只需要：

把 gen-images 文件夹复制到 ~/.claude/skills/
确认 CLIProxyAPI >= v6.9.34
确认本机可运行 py --version
确认 ~/.claude/settings.json 里已经配置好：
- env.ANTHROPIC_BASE_URL
- env.ANTHROPIC_AUTH_TOKEN

然后就可以直接开始用。

如果你后面还想扩展，我觉得还可以继续往下做：

加更多自然语言参数映射
加白名单校验
加更完整的错误提示
加 README / 仓库打包 / 发布版说明

十一、结语

如果你本身就在用 Claude Code + CLIProxyAPI，这个 gen-images skill 其实很适合拿来当一个可复用的图片工作流入口。

它不是单纯的脚本，而是把：

参数识别
交互补全
接口调用
文件落地
结果回传

整合成了 Claude Code 里可直接使用的一套体验。

如果论坛里有人需要，我也建议你们在自己环境里先跑一次最小提示词测试，确认当前代理链路对高分辨率尺寸的支持情况，再正式投入日常使用。

附带

gen-images.zip (18.3 KB)

网友解答：

--【壹】--：

应该可以设置jpg吧…背景确实不能透明，会报错

--【贰】--：

感谢佬！昨天哈机密刚下，正愁怎么办呢，这一下舒服了

--【叁】--：

已更新Skill:支持中转Codex调用gpt-image2 图像生成/改图

--【肆】--：

官方说明里面提到是api不支持透明背景。

--【伍】--：

我也刚做了个小龙虾和Hermes的。

https://linux.do/t/topic/2042184

不过佬的应该比我专业。

话说图片格式，Hermes和我说没法设置jpg（还是调用其他工具？）另外背景似乎也不能透明。其他功能马马虎虎也都折腾出来了。

--【陆】--：

正好在研究如何图生图方面的东西. 看到了佬的分享. 下载下来学习, 十分感谢

--【柒】--：

大佬免费号能用吗？还是说必须付费号才行。

--【捌】--：

image1629×1359 184 KB
image1623×1323 395 KB

免费的是可以的，你可以找个官网gpt2api的项目部署一下，然后自己让codex帮你创建个skill，或者用楼主的skill，我的是自己创建的skill

标签：ChatGpt OpenAI 软件开发 ClaudeCode Skills

一、这个 skill 能做什么

1. 文生图

2. 改图 / 编辑图片

3. 自动补字段

二、使用前提

1. CLIProxyAPI 版本要求

2. Python 环境

3. Claude Code 配置中已设置 API 信息

4. 后端已支持图片接口

三、支持的 size 规则

四、安装方法

五、使用示例

示例 1：文生图

示例 2：竖版高分辨率图

示例 3：改图

示例 4：信息图 / 图鉴类

六、输出行为

七、这个 skill 的特点

1. 不需要手动拼接口请求

2. 支持自然语言参数提取

3. 同时支持自动触发和 slash 调用

4. 自动读取当前 Claude Code 配置

八、适合哪些人用

九、注意事项

十、如果你也想装同款 skill

十一、结语

附带

相关推荐

一、这个 skill 能做什么

1. 文生图

2. 改图 / 编辑图片

3. 自动补字段

二、使用前提

1. CLIProxyAPI 版本要求

2. Python 环境

3. Claude Code 配置中已设置 API 信息

4. 后端已支持图片接口

三、支持的 size 规则

四、安装方法

五、使用示例

示例 1：文生图

示例 2：竖版高分辨率图

示例 3：改图

示例 4：信息图 / 图鉴类

六、输出行为

七、这个 skill 的特点

1. 不需要手动拼接口请求

2. 支持自然语言参数提取

3. 同时支持自动触发和 slash 调用

4. 自动读取当前 Claude Code 配置

八、适合哪些人用

九、注意事项

十、如果你也想装同款 skill

十一、结语

附带

相关推荐