给中转Api的 Codex和Claude 调用 gpt-image2的 Skill !支持图片生成改图

2026-04-29 09:372阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

我在 Claude Code 调用gpt-image2,封装整理成了一个可复用的 skill,名字叫 gen-images

它的目标很简单:

  • 在 Claude Code 里直接用自然语言生成图片
  • 支持文生图和改图
  • 支持自动触发,也支持手动用 /gen-images ...
  • 自动读取当前用户 Claude Code 配置里的 API Base URL 和 Token
  • 自动把生成结果保存到本地目录

如果你也在用 CLIProxyAPI 反代Codex到 Claude Code,这套 skill 可以直接复用。

Codex中转的同学可以下载Skill,让Codex帮你安装即可


一、这个 skill 能做什么

1. 文生图

可以直接这样用:

/gen-images 生成一张透明背景的猫咪头像,1024x1024,png

或者自然语言触发:

使用 gpt-image-2 生成一张透明背景的猫咪头像

2. 改图 / 编辑图片

例如:

/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp

支持的图片来源:

  • 本地文件路径
  • 图片 URL
  • data URL

3. 自动补字段

这个 skill 会自动从自然语言里提取常见参数,比如:

  • 尺寸 size
  • 质量 quality
  • 背景 background
  • 输出格式 output_format
  • 生成张数 n

如果缺少关键字段:

  • 文生图缺提示词,会追问 prompt
  • 改图缺图片来源,会提示你提供:
    1. 本地路径
    2. 图片 URL / data URL

二、使用前提

在安装和使用这个 skill 之前,请先确认以下条件满足:

1. CLIProxyAPI 版本要求

CLIProxyAPI 版本必须 ≥ v6.9.34

这是前提条件。低版本不保证支持当前这套图片接口能力和参数。

2. Python 环境

本 skill 通过 Python 脚本真正发起图片接口请求,因此本机需要可用的 Python 环境。

建议确认至少满足:

py --version

如果这条命令能正常输出版本号,就说明基本满足运行条件。

3. Claude Code 配置中已设置 API 信息

本 skill 会自动从 Claude Code 当前用户配置中读取:

  • env.ANTHROPIC_BASE_URL
  • env.ANTHROPIC_AUTH_TOKEN

读取位置:

~/.claude/settings.json

也就是说,你需要先让 Claude Code 当前环境本身已经配置好 Base URL 和 Token。

4. 后端已支持图片接口

你的反代链路需要支持以下接口:

  • POST /v1/images/generations
  • POST /v1/images/edits

三、支持的 size 规则

目前这版 gen-images 中,size 规则整理成了下面这些:

  • 1024x10241:1
  • 1024x15363:4
  • 1536x10244:3
  • 2048x20481:1
  • 3840x216016:9
  • 2160x38409:16
  • auto

也就是说,下面这些写法都能识别:

1:1 3:4 4:3 16:9 9:16 1024x1024 1024x1536 1536x1024 2048x2048 3840x2160 2160x3840 auto

其中:

  • 2160x3840
  • 3840x2160

在我当前这套 CLIProxyAPI + gpt-image-2 链路里已经做过实测,可以成功生成,但是提示词不能过于复杂,否则会报错:stream disconnected before completion

需要注意的是,这两个值不等同于 OpenAI 官方公开文档中列出的标准 size 枚举,它们更准确地说是:

  • 当前链路下实测可用的兼容尺寸

所以如果你换了不同的代理版本、不同后端或者不同模型,建议自己再做一次最小对照测试。


四、安装方法

gen-images 整个目录复制到你的 Claude Code 用户级 skills 目录:

~/.claude/skills/

最终结构应为:

~/.claude/skills/gen-images/SKILL.md ~/.claude/skills/gen-images/scripts/gen_images.py ~/.claude/skills/gen-images/references/fields.md

Windows 下通常对应:

C:\Users\你的用户名\.claude\skills\gen-images\

复制完成后:

  1. 重启 Claude Code
  2. 或执行插件 / skill 重载
  3. 然后直接测试 /gen-images

五、使用示例

示例 1:文生图

/gen-images 生成一张透明背景的猫咪头像,1024x1024,png

示例 2:竖版高分辨率图

/gen-images 生成一张赛博朋克风格的机甲少女全身像,9:16,png,高清

示例 3:改图

/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp

示例 4:信息图 / 图鉴类

/gen-images 根据{明代女子图鉴}自动生成一张博物馆图鉴式中文拆解信息图,9:16,png,高清


六、输出行为

默认情况下,生成结果会保存到当前工作目录下:

./gen-images/

成功后,Claude 会返回类似这样的结果:

图片已生成, 图片路径: C:\Users\xxx\gen-images\20260424-003204-01.png 实际使用的关键参数: model=gpt-image-2, size=2160x3840, quality=high, output_format=png, n=1

失败时则会返回简短错误原因,例如:

生成失败: 缺少 prompt


七、这个 skill 的特点

我自己比较看重的点有这些:

1. 不需要手动拼接口请求

不用自己写 curl、也不用每次都手写 JSON。

2. 支持自然语言参数提取

比如:

  • 高清quality=high
  • 透明背景background=transparent
  • 9:16size=2160x3840
  • png/webp/jpgoutput_format

3. 同时支持自动触发和 slash 调用

既可以直接说:

使用 gpt-image-2 生成图片

也可以手动输入:

/gen-images ...

4. 自动读取当前 Claude Code 配置

不需要在 skill 里额外写死 API Base URL 和 Token。


八、适合哪些人用

这套 skill 比较适合:

  • 已经在用 Claude Code
  • 已经通过 CLIProxyAPI 接好了图片模型
  • 想把"生图 / 改图"变成日常工作流的一部分
  • 不想每次手动拼图片接口请求

九、注意事项

  1. 本 skill 依赖 Python 环境
  2. 本 skill 默认从 ~/.claude/settings.json 读取 API 配置
  3. 你的 CLIProxyAPI 版本必须 ≥ v6.9.34
  4. 2160x3840 / 3840x2160 是当前链路实测可用,不代表所有后端都一致支持
  5. 如果复杂长提示词在超大尺寸下偶发失败,优先做最小提示词对照测试,判断是尺寸问题还是后端稳定性问题

十、如果你也想装同款 skill

你只需要:

  1. gen-images 文件夹复制到 ~/.claude/skills/
  2. 确认 CLIProxyAPI >= v6.9.34
  3. 确认本机可运行 py --version
  4. 确认 ~/.claude/settings.json 里已经配置好:
    • env.ANTHROPIC_BASE_URL
    • env.ANTHROPIC_AUTH_TOKEN

然后就可以直接开始用。

如果你后面还想扩展,我觉得还可以继续往下做:

  • 加更多自然语言参数映射
  • 加白名单校验
  • 加更完整的错误提示
  • 加 README / 仓库打包 / 发布版说明

十一、结语

如果你本身就在用 Claude Code + CLIProxyAPI,这个 gen-images skill 其实很适合拿来当一个可复用的图片工作流入口。

它不是单纯的脚本,而是把:

  • 参数识别
  • 交互补全
  • 接口调用
  • 文件落地
  • 结果回传

整合成了 Claude Code 里可直接使用的一套体验。

如果论坛里有人需要,我也建议你们在自己环境里先跑一次最小提示词测试,确认当前代理链路对高分辨率尺寸的支持情况,再正式投入日常使用。

附带

gen-images.zip (18.3 KB)

网友解答:
--【壹】--:

应该可以设置jpg吧…背景确实不能透明,会报错


--【贰】--:

感谢佬!昨天哈机密刚下,正愁怎么办呢,这一下舒服了


--【叁】--:

已更新Skill:支持中转Codex调用gpt-image2 图像生成/改图


--【肆】--:

官方说明里面提到是api不支持透明背景。


--【伍】--:

我也刚做了个小龙虾和Hermes的。

https://linux.do/t/topic/2042184

不过佬的应该比我专业。

话说图片格式,Hermes和我说没法设置jpg(还是调用其他工具?)另外背景似乎也不能透明。其他功能马马虎虎也都折腾出来了。


--【陆】--:

正好在研究如何图生图方面的东西. 看到了佬的分享. 下载下来学习, 十分感谢


--【柒】--:

大佬免费号能用吗?还是说必须付费号才行。


--【捌】--:

image1629×1359 184 KB
image1623×1323 395 KB

免费的是可以的,你可以找个官网gpt2api的项目部署一下,然后自己让codex帮你创建个skill,或者用楼主的skill,我的是自己创建的skill

问题描述:

我在 Claude Code 调用gpt-image2,封装整理成了一个可复用的 skill,名字叫 gen-images

它的目标很简单:

  • 在 Claude Code 里直接用自然语言生成图片
  • 支持文生图和改图
  • 支持自动触发,也支持手动用 /gen-images ...
  • 自动读取当前用户 Claude Code 配置里的 API Base URL 和 Token
  • 自动把生成结果保存到本地目录

如果你也在用 CLIProxyAPI 反代Codex到 Claude Code,这套 skill 可以直接复用。

Codex中转的同学可以下载Skill,让Codex帮你安装即可


一、这个 skill 能做什么

1. 文生图

可以直接这样用:

/gen-images 生成一张透明背景的猫咪头像,1024x1024,png

或者自然语言触发:

使用 gpt-image-2 生成一张透明背景的猫咪头像

2. 改图 / 编辑图片

例如:

/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp

支持的图片来源:

  • 本地文件路径
  • 图片 URL
  • data URL

3. 自动补字段

这个 skill 会自动从自然语言里提取常见参数,比如:

  • 尺寸 size
  • 质量 quality
  • 背景 background
  • 输出格式 output_format
  • 生成张数 n

如果缺少关键字段:

  • 文生图缺提示词,会追问 prompt
  • 改图缺图片来源,会提示你提供:
    1. 本地路径
    2. 图片 URL / data URL

二、使用前提

在安装和使用这个 skill 之前,请先确认以下条件满足:

1. CLIProxyAPI 版本要求

CLIProxyAPI 版本必须 ≥ v6.9.34

这是前提条件。低版本不保证支持当前这套图片接口能力和参数。

2. Python 环境

本 skill 通过 Python 脚本真正发起图片接口请求,因此本机需要可用的 Python 环境。

建议确认至少满足:

py --version

如果这条命令能正常输出版本号,就说明基本满足运行条件。

3. Claude Code 配置中已设置 API 信息

本 skill 会自动从 Claude Code 当前用户配置中读取:

  • env.ANTHROPIC_BASE_URL
  • env.ANTHROPIC_AUTH_TOKEN

读取位置:

~/.claude/settings.json

也就是说,你需要先让 Claude Code 当前环境本身已经配置好 Base URL 和 Token。

4. 后端已支持图片接口

你的反代链路需要支持以下接口:

  • POST /v1/images/generations
  • POST /v1/images/edits

三、支持的 size 规则

目前这版 gen-images 中,size 规则整理成了下面这些:

  • 1024x10241:1
  • 1024x15363:4
  • 1536x10244:3
  • 2048x20481:1
  • 3840x216016:9
  • 2160x38409:16
  • auto

也就是说,下面这些写法都能识别:

1:1 3:4 4:3 16:9 9:16 1024x1024 1024x1536 1536x1024 2048x2048 3840x2160 2160x3840 auto

其中:

  • 2160x3840
  • 3840x2160

在我当前这套 CLIProxyAPI + gpt-image-2 链路里已经做过实测,可以成功生成,但是提示词不能过于复杂,否则会报错:stream disconnected before completion

需要注意的是,这两个值不等同于 OpenAI 官方公开文档中列出的标准 size 枚举,它们更准确地说是:

  • 当前链路下实测可用的兼容尺寸

所以如果你换了不同的代理版本、不同后端或者不同模型,建议自己再做一次最小对照测试。


四、安装方法

gen-images 整个目录复制到你的 Claude Code 用户级 skills 目录:

~/.claude/skills/

最终结构应为:

~/.claude/skills/gen-images/SKILL.md ~/.claude/skills/gen-images/scripts/gen_images.py ~/.claude/skills/gen-images/references/fields.md

Windows 下通常对应:

C:\Users\你的用户名\.claude\skills\gen-images\

复制完成后:

  1. 重启 Claude Code
  2. 或执行插件 / skill 重载
  3. 然后直接测试 /gen-images

五、使用示例

示例 1:文生图

/gen-images 生成一张透明背景的猫咪头像,1024x1024,png

示例 2:竖版高分辨率图

/gen-images 生成一张赛博朋克风格的机甲少女全身像,9:16,png,高清

示例 3:改图

/gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp

示例 4:信息图 / 图鉴类

/gen-images 根据{明代女子图鉴}自动生成一张博物馆图鉴式中文拆解信息图,9:16,png,高清


六、输出行为

默认情况下,生成结果会保存到当前工作目录下:

./gen-images/

成功后,Claude 会返回类似这样的结果:

图片已生成, 图片路径: C:\Users\xxx\gen-images\20260424-003204-01.png 实际使用的关键参数: model=gpt-image-2, size=2160x3840, quality=high, output_format=png, n=1

失败时则会返回简短错误原因,例如:

生成失败: 缺少 prompt


七、这个 skill 的特点

我自己比较看重的点有这些:

1. 不需要手动拼接口请求

不用自己写 curl、也不用每次都手写 JSON。

2. 支持自然语言参数提取

比如:

  • 高清quality=high
  • 透明背景background=transparent
  • 9:16size=2160x3840
  • png/webp/jpgoutput_format

3. 同时支持自动触发和 slash 调用

既可以直接说:

使用 gpt-image-2 生成图片

也可以手动输入:

/gen-images ...

4. 自动读取当前 Claude Code 配置

不需要在 skill 里额外写死 API Base URL 和 Token。


八、适合哪些人用

这套 skill 比较适合:

  • 已经在用 Claude Code
  • 已经通过 CLIProxyAPI 接好了图片模型
  • 想把"生图 / 改图"变成日常工作流的一部分
  • 不想每次手动拼图片接口请求

九、注意事项

  1. 本 skill 依赖 Python 环境
  2. 本 skill 默认从 ~/.claude/settings.json 读取 API 配置
  3. 你的 CLIProxyAPI 版本必须 ≥ v6.9.34
  4. 2160x3840 / 3840x2160 是当前链路实测可用,不代表所有后端都一致支持
  5. 如果复杂长提示词在超大尺寸下偶发失败,优先做最小提示词对照测试,判断是尺寸问题还是后端稳定性问题

十、如果你也想装同款 skill

你只需要:

  1. gen-images 文件夹复制到 ~/.claude/skills/
  2. 确认 CLIProxyAPI >= v6.9.34
  3. 确认本机可运行 py --version
  4. 确认 ~/.claude/settings.json 里已经配置好:
    • env.ANTHROPIC_BASE_URL
    • env.ANTHROPIC_AUTH_TOKEN

然后就可以直接开始用。

如果你后面还想扩展,我觉得还可以继续往下做:

  • 加更多自然语言参数映射
  • 加白名单校验
  • 加更完整的错误提示
  • 加 README / 仓库打包 / 发布版说明

十一、结语

如果你本身就在用 Claude Code + CLIProxyAPI,这个 gen-images skill 其实很适合拿来当一个可复用的图片工作流入口。

它不是单纯的脚本,而是把:

  • 参数识别
  • 交互补全
  • 接口调用
  • 文件落地
  • 结果回传

整合成了 Claude Code 里可直接使用的一套体验。

如果论坛里有人需要,我也建议你们在自己环境里先跑一次最小提示词测试,确认当前代理链路对高分辨率尺寸的支持情况,再正式投入日常使用。

附带

gen-images.zip (18.3 KB)

网友解答:
--【壹】--:

应该可以设置jpg吧…背景确实不能透明,会报错


--【贰】--:

感谢佬!昨天哈机密刚下,正愁怎么办呢,这一下舒服了


--【叁】--:

已更新Skill:支持中转Codex调用gpt-image2 图像生成/改图


--【肆】--:

官方说明里面提到是api不支持透明背景。


--【伍】--:

我也刚做了个小龙虾和Hermes的。

https://linux.do/t/topic/2042184

不过佬的应该比我专业。

话说图片格式,Hermes和我说没法设置jpg(还是调用其他工具?)另外背景似乎也不能透明。其他功能马马虎虎也都折腾出来了。


--【陆】--:

正好在研究如何图生图方面的东西. 看到了佬的分享. 下载下来学习, 十分感谢


--【柒】--:

大佬免费号能用吗?还是说必须付费号才行。


--【捌】--:

image1629×1359 184 KB
image1623×1323 395 KB

免费的是可以的,你可以找个官网gpt2api的项目部署一下,然后自己让codex帮你创建个skill,或者用楼主的skill,我的是自己创建的skill