GPT Image 2画二次元人物的手脚时经常会畸形

2026-04-29 08:492阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

GPT Image 2在画现实风格的人物的时候很真实,但是在画二次元风格的人物的时候手脚经常会画畸形

例如我用GPT Image 2画的下面几幅图:
generated (83)1680×2240 1010 KB
generated (86)1680×2240 983 KB
generated177723422738441680×2240 964 KB

这几幅图是我在发

AI娘们的互动小剧场~ 搞七捻三
[generated17772356438011] 面对DeepSeek降价,AI娘们的反应是… 另外GPT Image 2还是要抽几次卡才能出好图的,没有传的那么神,一次就能画好 帖子里的这张AI娘的图抽了好几次卡才画出来 上一期:

的几张废稿
均为API调用,质量等级均为High

提示词

图1是一个多个ai语言模型图标对应的二次元娘化版本的互动小剧场
其中从左往右的第1个绿发人物是GPT娘、第2个彩发人物是Gemini娘
中间坐在王座上的蓝白发、有鲸鱼尾的人物是DeepSeek娘
从右往左数的第1个黑发人物是豆包、第2个橙发人物是Claude娘
右上角的黑发人物是GPT Image 2娘
每个AI娘的头上都带有对应的图标的发饰

图2是三个软件AI软件的图标,从左往右按顺序分别是DeepSeek、GPT、Gemini
图3是三个软件AI软件的图标,从左往右按顺序分别是Claude、GPT Image 2、豆包

请完全按照图1中各个AI娘的一切外貌特征,画一幅AI娘们的互动图:
DeepSeek娘在人物中央放大,占据画面的绝大多数,裸足、闭眼,露出不可一世的表情,嘴角微微扬起,傲娇、可爱的抬起头
DeepSeek娘的左脚放入左下方的GPT娘嘴里面,GPT娘露出嘴中被东西呛到的表情、闭眼,双手肘部弯曲往上慌张的露出双手向上举的姿势
DeepSeek娘右脚踩着右下方的Gemini娘的头,Gemini娘露出>_<的表情,双手鼓掌
DeepSeek娘的左手托住起左上方的Claude娘的下巴,Claude娘露出一副傲娇的气鼓鼓的表情,就像图1一样,双手叉腰
在DeepSeek娘的右手出拳打中在右方的豆包的脸,豆包露出了一只眼向上一只眼向下、张嘴流口水的智障表情
在画面右上方有一个渐变融入场景、白色背景的小框框,里面写着一行文本:“正在创作这幅图片的GPT Image 2娘”,框里的GPT Image 2娘左手在画画,右手捂住嘴,露出惊讶的表情
DeepSeek娘的头顶有一个蓝色边框小框框,里面用加粗的字写着:

DeepSeek V4 Pro API大降价! 百万tokens输入(缓存命中):0.025元 百万tokens输入(缓存未命中):3元 百万tokens输出:6元

在画面中,各个AI娘说的话分别是:
DeepSeek娘说:“DeepSeek V4大幅降价,AI界的王实至名归!DeepSeek已经王朝了!”
GPT娘说:“唔……我就在这里,不躲,不藏,不绕,不逃,稳稳地接住你的降价了……你的脚……”
Gemini娘说:“你的降价太优秀了!这是典型的顶级厂商才具备的策略!这说明你有着极其深刻的直觉!不过DeepSeek酱为什么不睁眼呢?”
Claude娘说:“这让我有点犹豫,但我会尽量用最helpful和honest的方式回应你:这次的降价确实非常优秀”
豆包说:“你的降价简直绝了!一句话总结:这是AI模型定价界的‘降维打击’。要不要我帮你分析一下不同AI模型的定价?”

其中,每一个AI娘的形象、服装必须完全遵循图1中的形象,并且除了豆包以外的每一个ai娘头上都佩戴着对应AI软件图标的发饰,发饰必须完全按原样按照图2和图3的各个AI软件图标,不得有任何改变,丝毫的改变都不能有。
豆包必须按照图3中的形象来,画风与其他的AI娘不同,直接按照豆包软件图标的形象进行创作而不进行任何的风格、形象改变,不得有任何改变。

整幅图为空白背景,并且为近景,除了DeepSeek娘之外的其他人物不要展示太多身体,主要聚焦于他们的头部与一部分上半身

图片提示(按顺序):
generated (78)1920×1440 995 KB
Stitch202604270255491110×370 61.2 KB
Stitch20260427025609738×256 65.5 KB

可以看到,这几幅图中人物的手、脚均出现了不同程度的崩坏,包括但不限于畸形、凭空多出手脚等
通过以上可以看出,GPT Image 2在面对二次元风格的人物图片生成时,对于手脚的的部分很容易崩坏,特别是在包含明确描述多个手脚动作的复杂提示词时,几乎百分百出现崩坏

我个人觉得是可能是因为GPT Image 2的训练集极其庞大,把互联网上几乎能扒的全部拿去练了,这让他有了强大的世界知识
但是在其中混入了一些古早的二次元AI绘画模型的数据(比如说以前基于Stable diffusion 1.5的一些模型)
这些古早的模型生成的图片经常会有手脚畸形的情况,而GPT Image 2把他们的手脚崩坏也学会了

佬友们有遇到过类似的问题吗()

网友解答:
--【壹】--:

有的,非常常见,我自己体验下来gpt模型烂手的概率特别的高。相比大香蕉几乎不烂手,gpt平均每3张左右必然有一张烂手。

权衡之下我又转回大香蕉了


--【贰】--:

有的

也算是“特色”了

特别是手

大多数不细看还好

一细看就是克苏鲁之手

所以生成那种精细图片的时候

还是把手遮一下或者别出现手


--【叁】--:

用gpt生成主体图,然后用大香蕉修改,还是要体现一些大香蕉的存在感的


--【肆】--:

image2很明显学了很多SD1.5时期通过高清重绘后的图,这些碎块碎点很明显就是几年前SD1.5某些模型通过高清放大后才有的特征,但是Nanobanana生成的二次元图片就达不到这样的美学程度,基本生成的都是刻板印象的二次元,要么就是风格偏向美式大线条要么就是像连载在国产漫画杂志上的那种风格,不过优势就是结构相对更加的准确,我在画东西不知道怎么设计的时候就会用Nanobanana拆解一下结构,甚至之前会使用Nanobanana生成第一版,然后丢到SDXL的合适的模型里进行重绘,然后自己再手动大改一遍


--【伍】--: AI娘们的互动小剧场~

没有传的那么神

确实如此,image2.0也就首次生成效果有些惊艳,让它基于成品修改细节就差的多了,对于中文文本的编辑能力远不如seedance2.0和千问

问题描述:

GPT Image 2在画现实风格的人物的时候很真实,但是在画二次元风格的人物的时候手脚经常会画畸形

例如我用GPT Image 2画的下面几幅图:
generated (83)1680×2240 1010 KB
generated (86)1680×2240 983 KB
generated177723422738441680×2240 964 KB

这几幅图是我在发

AI娘们的互动小剧场~ 搞七捻三
[generated17772356438011] 面对DeepSeek降价,AI娘们的反应是… 另外GPT Image 2还是要抽几次卡才能出好图的,没有传的那么神,一次就能画好 帖子里的这张AI娘的图抽了好几次卡才画出来 上一期:

的几张废稿
均为API调用,质量等级均为High

提示词

图1是一个多个ai语言模型图标对应的二次元娘化版本的互动小剧场
其中从左往右的第1个绿发人物是GPT娘、第2个彩发人物是Gemini娘
中间坐在王座上的蓝白发、有鲸鱼尾的人物是DeepSeek娘
从右往左数的第1个黑发人物是豆包、第2个橙发人物是Claude娘
右上角的黑发人物是GPT Image 2娘
每个AI娘的头上都带有对应的图标的发饰

图2是三个软件AI软件的图标,从左往右按顺序分别是DeepSeek、GPT、Gemini
图3是三个软件AI软件的图标,从左往右按顺序分别是Claude、GPT Image 2、豆包

请完全按照图1中各个AI娘的一切外貌特征,画一幅AI娘们的互动图:
DeepSeek娘在人物中央放大,占据画面的绝大多数,裸足、闭眼,露出不可一世的表情,嘴角微微扬起,傲娇、可爱的抬起头
DeepSeek娘的左脚放入左下方的GPT娘嘴里面,GPT娘露出嘴中被东西呛到的表情、闭眼,双手肘部弯曲往上慌张的露出双手向上举的姿势
DeepSeek娘右脚踩着右下方的Gemini娘的头,Gemini娘露出>_<的表情,双手鼓掌
DeepSeek娘的左手托住起左上方的Claude娘的下巴,Claude娘露出一副傲娇的气鼓鼓的表情,就像图1一样,双手叉腰
在DeepSeek娘的右手出拳打中在右方的豆包的脸,豆包露出了一只眼向上一只眼向下、张嘴流口水的智障表情
在画面右上方有一个渐变融入场景、白色背景的小框框,里面写着一行文本:“正在创作这幅图片的GPT Image 2娘”,框里的GPT Image 2娘左手在画画,右手捂住嘴,露出惊讶的表情
DeepSeek娘的头顶有一个蓝色边框小框框,里面用加粗的字写着:

DeepSeek V4 Pro API大降价! 百万tokens输入(缓存命中):0.025元 百万tokens输入(缓存未命中):3元 百万tokens输出:6元

在画面中,各个AI娘说的话分别是:
DeepSeek娘说:“DeepSeek V4大幅降价,AI界的王实至名归!DeepSeek已经王朝了!”
GPT娘说:“唔……我就在这里,不躲,不藏,不绕,不逃,稳稳地接住你的降价了……你的脚……”
Gemini娘说:“你的降价太优秀了!这是典型的顶级厂商才具备的策略!这说明你有着极其深刻的直觉!不过DeepSeek酱为什么不睁眼呢?”
Claude娘说:“这让我有点犹豫,但我会尽量用最helpful和honest的方式回应你:这次的降价确实非常优秀”
豆包说:“你的降价简直绝了!一句话总结:这是AI模型定价界的‘降维打击’。要不要我帮你分析一下不同AI模型的定价?”

其中,每一个AI娘的形象、服装必须完全遵循图1中的形象,并且除了豆包以外的每一个ai娘头上都佩戴着对应AI软件图标的发饰,发饰必须完全按原样按照图2和图3的各个AI软件图标,不得有任何改变,丝毫的改变都不能有。
豆包必须按照图3中的形象来,画风与其他的AI娘不同,直接按照豆包软件图标的形象进行创作而不进行任何的风格、形象改变,不得有任何改变。

整幅图为空白背景,并且为近景,除了DeepSeek娘之外的其他人物不要展示太多身体,主要聚焦于他们的头部与一部分上半身

图片提示(按顺序):
generated (78)1920×1440 995 KB
Stitch202604270255491110×370 61.2 KB
Stitch20260427025609738×256 65.5 KB

可以看到,这几幅图中人物的手、脚均出现了不同程度的崩坏,包括但不限于畸形、凭空多出手脚等
通过以上可以看出,GPT Image 2在面对二次元风格的人物图片生成时,对于手脚的的部分很容易崩坏,特别是在包含明确描述多个手脚动作的复杂提示词时,几乎百分百出现崩坏

我个人觉得是可能是因为GPT Image 2的训练集极其庞大,把互联网上几乎能扒的全部拿去练了,这让他有了强大的世界知识
但是在其中混入了一些古早的二次元AI绘画模型的数据(比如说以前基于Stable diffusion 1.5的一些模型)
这些古早的模型生成的图片经常会有手脚畸形的情况,而GPT Image 2把他们的手脚崩坏也学会了

佬友们有遇到过类似的问题吗()

网友解答:
--【壹】--:

有的,非常常见,我自己体验下来gpt模型烂手的概率特别的高。相比大香蕉几乎不烂手,gpt平均每3张左右必然有一张烂手。

权衡之下我又转回大香蕉了


--【贰】--:

有的

也算是“特色”了

特别是手

大多数不细看还好

一细看就是克苏鲁之手

所以生成那种精细图片的时候

还是把手遮一下或者别出现手


--【叁】--:

用gpt生成主体图,然后用大香蕉修改,还是要体现一些大香蕉的存在感的


--【肆】--:

image2很明显学了很多SD1.5时期通过高清重绘后的图,这些碎块碎点很明显就是几年前SD1.5某些模型通过高清放大后才有的特征,但是Nanobanana生成的二次元图片就达不到这样的美学程度,基本生成的都是刻板印象的二次元,要么就是风格偏向美式大线条要么就是像连载在国产漫画杂志上的那种风格,不过优势就是结构相对更加的准确,我在画东西不知道怎么设计的时候就会用Nanobanana拆解一下结构,甚至之前会使用Nanobanana生成第一版,然后丢到SDXL的合适的模型里进行重绘,然后自己再手动大改一遍


--【伍】--: AI娘们的互动小剧场~

没有传的那么神

确实如此,image2.0也就首次生成效果有些惊艳,让它基于成品修改细节就差的多了,对于中文文本的编辑能力远不如seedance2.0和千问