最近火遍创作圈的 GPT Image2 是夯是拉?我给你们盘点了常用的使用场景,确实很夯!
- 内容介绍
- 文章标签
- 相关推荐
今天咱不聊具体的技术原理,咱就聊聊这玩意儿有多么好玩儿,我们应该怎么用。
GPT image2 刚出的那几天,我基本上是玩得不亦乐乎,如果你是做自媒体的,无论是写教程、博客、科普文章还是做视频的,都可以立刻的把 image2 应用到自己的生产中。
很多人可能会很好奇,这一次的这个模型,它主要的提升点,或者说我们能用它来做的点在哪于哪里?我总结为如下:整活图文、商业海报、插图生成、UI 原型设计、图纸设计、图标设计、个人电子名片、封面设计。
我分别拿我从我自己的社区里看到的几个例子,让你们直观感受一下这玩意儿到底能干啥。点击知乎这个目录,你就可以快速的跳转到你感兴趣的板块。
很多朋友问我为什么换头像了?因为我发现GPT image2的能力已经足够承载我的想象力了,所以我立刻用它来根据我的一年前准备好的一个设计稿,做出了现在的头像,我个人很满意。
每次有人邀请去演讲的时候,总会因为版权问题拒绝使用我的怪盗基德作为海报上我的头像。我想这下就应该没有版权问题了。
应用1. 整活图文
就是把各种互联网上的迷音元素通过你的想象力整合在一块,让AI直接生成。
这里就完全靠你的想象力了。你想要让任何你想要出现的整活元素出现在一个成熟的海报里,也就直接将这个海报扔到gpt image2里面。
1086×1448 122 KB
应用 2. 商业海报
最典型的例子就是各种各样的联动周边,你都可以直接用已有的模板和你的想象力创建出这样的一个商业海报。
1027×1531 115 KB
为了测试这个海报是否真的足够逼真,我把他丢给了我的一个芙莉莲厨朋友
900×808 18.3 KB
然后过段时间告诉她这是 AI 生成的看反应
892×980 10.9 KB
下面给大家一段你们可以拿去直接用的提示词,用来尝试玩一玩这种商业海报的生成:
生成一张 明日方舟 阿米娅 联动奶茶品牌 喜茶的活动宣传海报。
海报为竖屏比例。海报的右侧三分之二为人物立绘,人物手持着对应的饮品。人物衣服替换成更适合风格的衣服
左侧的上部分为对应的品牌logo,中部有大艺术字体展示联动饮品名
“摩登青提”,中下部有对应的宣传语。下部有对应的价格和饮品所包含的用料成分信息。
整体风格现代摩登,温馨为主。
应用 3. 插图生成
这个超级利好我们这些写科技博文和科普文的博主们,以往向大家解释一个科技概念,我们往往需要通过花费很多的时间画一个这样的示意图来表示。而且我们还要保证这个示意图里面能体现出我们自己的IP元素,并且整体的颜色风格和造型风格要保持一致。总之就是很烦啊,但是现在有了GPT image2之后,我们只要将一个固定的颜色格式的参考图交给AI,然后再将我们想要画什么样一个图和AI说一说,迭代个两三轮就可以得到一个非常好的插图结果了。
比如说我最近在更新的《锦恢的 AI Agent 小白教程系列》中的插图,就是拿GPT Image2生成的
1440×960 53 KB
1440×622 50.2 KB
下面是 prompt(prompt 是语音输入的,所以比较杂乱,将就着看吧,你不能要求一个同时在写7个项目的人,连prompt都认真的一字一句的教条主义般地写上去。)
1440×1223 81.3 KB
在以前想要制作一个这种颜色风格,完全统一,而且还具有动漫人物提升插图趣味性的这样的一个图文,一般需要团队作战,或者是借助专业的外包画师才能做到。但现在的话,有的GPT Image2之后,只要你有想法和一个自己的物料库,就可以单枪匹马,瞬间完成文章中所有的图文绘制的。而且每张图的耗时,比之前你自己用流程图软件绘制的还要短。
原文在知乎上也发布了,感兴趣的各位可以看一看:锦恢的 AI Agent 小白教程(二)关于大模型,小白必须知道的一些通识知识
应用 4. UI 原型设计
如果你是一个独立开发者,或者是临危受命来制作demo的一个算法工程师。当你不知道怎么样才能更好的让你的软件更好看,更好的像一个专业的UI和前端工程师一样做出一个好看的页面时,GBT Image2可以给你一些灵感。
比如我最近在帮团队朋友重构软件中的一个板块,原本的UI设计非常非常难看,完全没有考虑到移动端的用户体验和整体的样式适配性。
比如下面这个UI是我让codex来根据我的需求进行调整之后的UI,它仍然非常难看。
740×1606 31.4 KB
现在我想要知道大概可以怎么去排布这些数据元素,能够让整体的视觉效果更加的紧凑。我只是需要一个参考,我并不需要有个代码。那么这个时候你就可以把你的需求和你的1个UI截图扔给GPT image2,让它帮你生成一个可行的结果。这个结果你可以用来进行参考,从而更好的发掘你目前设计中的不足,或者是一些改进的可能性,下面就是我让GPT Image2画出的结果
1440×1199 45.8 KB
864×1821 40.5 KB
我只对今日安排这个板块的UI重构感兴趣。所以我可以通过它生成的结果来判断这种新的设计能否用于我的1个UI上的数据排布优化。很显然,这个设计比我之前的设计要更加的紧凑美观一点。至于其他部分,你可以完全按照你的交互与UI设计经验来对它进行接收和拒绝。
至少figma基本上我是可以卸载了。你告诉我figma能导出设计稿代码。那我问你,我为什么不直接拿codex生成前端代码呢?我要figma,不就是因为我要快速的预览一些视觉效果吗?既然现在GPT Image2这已经能够帮我做到这一点了,那为什么我还需要保留figma呢?
应用 5. 图纸设计
得益于GPT Image2在文本高精度生成上的优化,现在可以非常稳定的生成数字、汉字、英文等等一系列字符,而不需要担心像以前那样在生成的过程中会被扭曲破坏。
比如说你现在作为一个工程师,上面要求你交付一份图纸。那么你就可以将你们公司里可以相对外公开的这些物料作为输入,在附加以文档说明,让GPT Image2直接生成对应的一个图纸。
下面这张图就是群友贡献的。通过GPT Image2生成的。他是一位专业的设计师。
1440×960 137 KB
应用 6. 图标生成
对于独立开发者和OPC而言,最难的事情莫过于想名字和画图标了。硅藏老师之前在一篇微信公众号的文章里面向大家介绍了它的一个skill用来进行图标生成。但是那个东西的使用门槛仍然有一点点高。但现在有了GPT image2之后,附加以归藏老师的skill,我们就低成本设计出符合我们要求的图标,毕竟对于大部分的独立开发者而言,他们的产品图标并没有那些奇奇怪怪的美学上的要求,能用就行,有区分度就行,所以不要在评论区扣我杠,因为这完全没有任何意义。
1440×1427 54.7 KB
经过几轮迭代之后得到的结果:
1440×1137 29.2 KB
然后就可以完美的应用到我自己的产品里了。
1440×923 29.4 KB
归藏老师的 SKILL:https://github.com/op7418/logo-generator-skill/blob/main/SKILL.md
应用 7. 个人电子名片
相信对于各位做自媒体和传媒的朋友来说,拥有一张个人电子名片,用来快速的传播自己的IP和联系方式是一件非常重要的事情。在过去,我们通常会依赖于一些现有的H5网站来帮我们辅助设计,并且花钱来购买这些昂贵的设计版式。但现在这些设计版式往往没有足够的想象力来彰显你的个性。通过GPT Image2,你可以将自己原本的一个已经设计好的,但是非常一般的一个名片作为输入。然后加上你要的一个要求,就可以让GPT生成一个新的个人名片了。
这是我之前的个人名片
1440×756 23.7 KB
我直接把它输入到了GPT Image2里面,并且输入了一些额外的要求,然后生成了下面这张
1440×762 42.6 KB
你可能会好奇,为什么我要把名片设计成这个样式,因为我的个人网站就是这个风格。事实上,我让AI修改个人名片的prompt,就是我个人网站的颜色定义源代码。
1440×1440 60.7 KB
我一直在探索如何更好的将新中式的设计风格和我家乡的印象融入到现代的UI设计里面,这是我的个人网站:汇尘轩 - 锦恢的博客
1440×755 49.2 KB
应用 8. 封面设计
对于做视频和写文章的人来说,怎么选封面一直是个很头疼的问题。因为既要能够有一定的个性,还能够展示当前你做的这一个内容,大概是什么系列。它是一个同时兼具文本表达和IP传播的一个场景。
我比较懒,一般都是拿我比较喜欢的动漫人物的精美图作为封面的。
一年前的技术大概效果是这样,这是我和AI交互,并且自己还用软件做了后期,花费了两个小时才做出来的一张封面。而且你能看到这个封面里它并没有文字,你很难看清这个封面的文章它到底在讲什么,不是我没加,而是加了之后的效果非常差。
1280×944 79.2 KB
一两年前的图像生成模型基本上输入一些说明文字,一输入就爆炸。甚至你能看到画面上的这个咖啡和饼干,这都是我调了好久才调出来的,一开始生成的都是乱的。
如今我一句话就能生成一个这样的封面,甚至可以一次性生成16比9和正常手机上海报的两种比例。
1440×810 82.2 KB
1024×1536 112 KB
prompt 如下:(语音输入的,别纠结词法)
1440×1396 60.3 KB
1440×1289 67.8 KB
然后我根据我的需求,再对转换成16比9的图片里面的一些信息进行了额外的要求和修改,总共花费了大概10分钟的时间。
不足:你是否想知道它有什么缺点?
没有什么是银弹,大模型也是一样的。事实上,虽然GPT Image2能力很强,但仍然有一些不足的地方。下面我将我在我的实践劳动中遇到的不足展现给你们。
首先就是对于高精度图像修改这个场景,GPT仍然不能胜任。比如说你的画面中有一些细杂的纹理。然后你需要对其他的部放进行处理,就比较困难。当然了,这里可以通过canvas或者是局部重会这些ChatGPT 网页版提供的服务来解决。我单纯只是在说 GPT Image2 这个模型本身。
1440×1530 26.7 KB
比如对于这个场景来说,你就能看到我要求GPT帮我完成一个简单的图标抠图行为。但是改完之后,这个图标的轮廓和它的颜色都发生了变化。而且我重复了10次,没有一次是成功的。
然后对于一些细节的理解还不到位。比如说下面这个任务是需要将指定的人物扔到一个时尚周刊里面。
1440×1375 72.9 KB
1086×1448 98.1 KB
我要求迁移之后,杂志中的这个女角色她要穿上西装,但是你能看到生成的图片中,这个西装和她原本的服饰发生了重叠。在纹理和要素极多的画面中,生成经常会发生这种问题。
再比如对于UI设计稿中,我可能需要对其中的部分交互组件进行位置的调整。一个简单的例子就是我需要将下图设计里面的进入训练和联系教练的两个按钮发生一个调整。
1440×1119 30.4 KB
但是AI最终生成的结果却让我非常不满意:
1440×1041 31 KB
新的威胁:聊天记录伪造
由于GPT Image2对于文本的生成能力实在太强了,导致我们现在可以以超低的成本立刻生成一张真假男方的微信、推特QQ等社交媒体的聊天记录。从而让某些不法分子达到自己的目的。
比如最近一件特别搞笑的事情,就是有人通过GPT生成了一张anthropic官方宣布解除对中国供应封禁的消息,结果一堆人信以为真之后,解除了自己的魔法去使用Claude Code,造成了大面积封号。
我可以立刻伪造特朗普来颐和园倒拔垂杨柳的假新文。
1376×768 187 KB
也可以伪造那些根本不存在的聊天记录。
1440×1440 105 KB
你可会说这些聊天记录有破绽,但是ChatGPT提供了局部重绘技术,可以通过局部重会来修复这些破绽。
还有就是有人通过GPT伪造的公司倒闭的证明材料,从而达到了某些不法目的。这些都给我国的法庭审理提出了新的挑战。
我将这些事情询问了我做法官的朋友,而他最终语重心长的和我说了一句。
970×298 9.09 KB
总结
GPT因为这是一个强大异常的模型,他为我们带来了新的机遇和挑战。相信通过我举的例子,大家应该也能充分的体验到了它的强大之处。
如果你有更多的有关GPT Image2使用案例的部分,欢迎在评论区和大家分享,或者是直接向我提供素材。
网友解答:--【壹】--:
法官肯定不会用一张截图下结论的,没有ai的时候也不会的。除非他蠢。
--【贰】--:
是的, 其实现在机器人实现各种拟人逼真的动作, 都不是真的具备空间理解能力.
记录人类运动轨迹, 让机器人去还原动作, 这里面涉及的是约束优化问题和强化学习.
--【叁】--:
svg用claude web端就挺好的,可以先用gpt-image-2生成想要的图片,然后在claude web端生成svg
--【肆】--:
ChatGPT Image 2026年4月25日 1920091672×941 674 KB
这是根据L佬发的提示词,做的厦门旅游宣传图。
--【伍】--:
已使用过了,绝对好用,感觉比以前进步大多了
--【陆】--:
刚刚在喵的公益站上面试了一下,生成的效果真的很好
--【柒】--:
为啥是claude web端?和desktop端有啥区别吗
--【捌】--:
可以 但是能力仍然很差,svg本质是坐标的集合,而大模型目前的空间理解能力还很差,这种差也反映在目前的具身智能大脑上
--【玖】--:
之前一直没搞明白银弹是什么意思,直到我提需求给模型创建公众号,也给了个银弹的定义
--【拾】--:
在我的场景中,我觉得从视觉效果而言,它是比香蕉强很多了,香蕉的图还是很容易看出来是 AI 生成的,但是 GPT 生成的图确实有点真假难分了
--【拾壹】--:
银弹就是万金油的意思,没有银弹指的就是一个领域没有一种不用动脑子,只要点点鼠标就能解决的方案
--【拾贰】--:
还要提醒一点,尽量不要一次性把要做的东西输入给AI,尽量跟AI进行有效的沟通后再根据AI提供的提示词进行生成,不然很可能事倍功半!
其次就是如果有现成的参考图一定要喂给AI,然后再考虑细节部分的修改,只通过想象并以纯文字形式输入给AI,AI大概率会按照自己理解的来
--【拾叁】--:
这次image-2是有点强的。感觉不输大香蕉了。
--【拾肆】--:
你不让我细看 我甚至都看不出来这是 AI 生成的
--【拾伍】--:
是的,法理判案时一定有证据链,而单张截图无法构成证据链
--【拾陆】--:
有个疑问哈, 就是现阶段 AI 能不能生成那种 svg 矢量图? 或者生成的 PNG 去转成 SVG (我试过, 用像素拟合出来的效果不是太好有毛边, svg体积也很大), 现阶段有什么解决方案吗?
--【拾柒】--: rosemaryu:
就是现阶段 AI 能不能生成那种 svg 矢量图
可以,不过出不了特别复杂的图
AI SVG可以看看recraft家出的vector系列的模型
可以直接输出为svg格式,做做logo之类的还是可以的
无aff链接
Recraft | AI for designers, creatives, sellers, and teams
Recraft is a top-ranked text-to-image model and design platform for photorealism, vector generation, custom styles, mockups, and more
image834×753 117 KB
image260×191 5.26 KB
--【拾捌】--:
可以 但是能力仍然很差,svg本质是坐标的集合,而大模型目前的空间理解能力还很差,这种差也反映在目前的具身智能大脑上
--【拾玖】--:
目前看起来,生成海报、封面这种还是很惊艳的,其他方面还没试过
今天咱不聊具体的技术原理,咱就聊聊这玩意儿有多么好玩儿,我们应该怎么用。
GPT image2 刚出的那几天,我基本上是玩得不亦乐乎,如果你是做自媒体的,无论是写教程、博客、科普文章还是做视频的,都可以立刻的把 image2 应用到自己的生产中。
很多人可能会很好奇,这一次的这个模型,它主要的提升点,或者说我们能用它来做的点在哪于哪里?我总结为如下:整活图文、商业海报、插图生成、UI 原型设计、图纸设计、图标设计、个人电子名片、封面设计。
我分别拿我从我自己的社区里看到的几个例子,让你们直观感受一下这玩意儿到底能干啥。点击知乎这个目录,你就可以快速的跳转到你感兴趣的板块。
很多朋友问我为什么换头像了?因为我发现GPT image2的能力已经足够承载我的想象力了,所以我立刻用它来根据我的一年前准备好的一个设计稿,做出了现在的头像,我个人很满意。
每次有人邀请去演讲的时候,总会因为版权问题拒绝使用我的怪盗基德作为海报上我的头像。我想这下就应该没有版权问题了。
应用1. 整活图文
就是把各种互联网上的迷音元素通过你的想象力整合在一块,让AI直接生成。
这里就完全靠你的想象力了。你想要让任何你想要出现的整活元素出现在一个成熟的海报里,也就直接将这个海报扔到gpt image2里面。
1086×1448 122 KB
应用 2. 商业海报
最典型的例子就是各种各样的联动周边,你都可以直接用已有的模板和你的想象力创建出这样的一个商业海报。
1027×1531 115 KB
为了测试这个海报是否真的足够逼真,我把他丢给了我的一个芙莉莲厨朋友
900×808 18.3 KB
然后过段时间告诉她这是 AI 生成的看反应
892×980 10.9 KB
下面给大家一段你们可以拿去直接用的提示词,用来尝试玩一玩这种商业海报的生成:
生成一张 明日方舟 阿米娅 联动奶茶品牌 喜茶的活动宣传海报。
海报为竖屏比例。海报的右侧三分之二为人物立绘,人物手持着对应的饮品。人物衣服替换成更适合风格的衣服
左侧的上部分为对应的品牌logo,中部有大艺术字体展示联动饮品名
“摩登青提”,中下部有对应的宣传语。下部有对应的价格和饮品所包含的用料成分信息。
整体风格现代摩登,温馨为主。
应用 3. 插图生成
这个超级利好我们这些写科技博文和科普文的博主们,以往向大家解释一个科技概念,我们往往需要通过花费很多的时间画一个这样的示意图来表示。而且我们还要保证这个示意图里面能体现出我们自己的IP元素,并且整体的颜色风格和造型风格要保持一致。总之就是很烦啊,但是现在有了GPT image2之后,我们只要将一个固定的颜色格式的参考图交给AI,然后再将我们想要画什么样一个图和AI说一说,迭代个两三轮就可以得到一个非常好的插图结果了。
比如说我最近在更新的《锦恢的 AI Agent 小白教程系列》中的插图,就是拿GPT Image2生成的
1440×960 53 KB
1440×622 50.2 KB
下面是 prompt(prompt 是语音输入的,所以比较杂乱,将就着看吧,你不能要求一个同时在写7个项目的人,连prompt都认真的一字一句的教条主义般地写上去。)
1440×1223 81.3 KB
在以前想要制作一个这种颜色风格,完全统一,而且还具有动漫人物提升插图趣味性的这样的一个图文,一般需要团队作战,或者是借助专业的外包画师才能做到。但现在的话,有的GPT Image2之后,只要你有想法和一个自己的物料库,就可以单枪匹马,瞬间完成文章中所有的图文绘制的。而且每张图的耗时,比之前你自己用流程图软件绘制的还要短。
原文在知乎上也发布了,感兴趣的各位可以看一看:锦恢的 AI Agent 小白教程(二)关于大模型,小白必须知道的一些通识知识
应用 4. UI 原型设计
如果你是一个独立开发者,或者是临危受命来制作demo的一个算法工程师。当你不知道怎么样才能更好的让你的软件更好看,更好的像一个专业的UI和前端工程师一样做出一个好看的页面时,GBT Image2可以给你一些灵感。
比如我最近在帮团队朋友重构软件中的一个板块,原本的UI设计非常非常难看,完全没有考虑到移动端的用户体验和整体的样式适配性。
比如下面这个UI是我让codex来根据我的需求进行调整之后的UI,它仍然非常难看。
740×1606 31.4 KB
现在我想要知道大概可以怎么去排布这些数据元素,能够让整体的视觉效果更加的紧凑。我只是需要一个参考,我并不需要有个代码。那么这个时候你就可以把你的需求和你的1个UI截图扔给GPT image2,让它帮你生成一个可行的结果。这个结果你可以用来进行参考,从而更好的发掘你目前设计中的不足,或者是一些改进的可能性,下面就是我让GPT Image2画出的结果
1440×1199 45.8 KB
864×1821 40.5 KB
我只对今日安排这个板块的UI重构感兴趣。所以我可以通过它生成的结果来判断这种新的设计能否用于我的1个UI上的数据排布优化。很显然,这个设计比我之前的设计要更加的紧凑美观一点。至于其他部分,你可以完全按照你的交互与UI设计经验来对它进行接收和拒绝。
至少figma基本上我是可以卸载了。你告诉我figma能导出设计稿代码。那我问你,我为什么不直接拿codex生成前端代码呢?我要figma,不就是因为我要快速的预览一些视觉效果吗?既然现在GPT Image2这已经能够帮我做到这一点了,那为什么我还需要保留figma呢?
应用 5. 图纸设计
得益于GPT Image2在文本高精度生成上的优化,现在可以非常稳定的生成数字、汉字、英文等等一系列字符,而不需要担心像以前那样在生成的过程中会被扭曲破坏。
比如说你现在作为一个工程师,上面要求你交付一份图纸。那么你就可以将你们公司里可以相对外公开的这些物料作为输入,在附加以文档说明,让GPT Image2直接生成对应的一个图纸。
下面这张图就是群友贡献的。通过GPT Image2生成的。他是一位专业的设计师。
1440×960 137 KB
应用 6. 图标生成
对于独立开发者和OPC而言,最难的事情莫过于想名字和画图标了。硅藏老师之前在一篇微信公众号的文章里面向大家介绍了它的一个skill用来进行图标生成。但是那个东西的使用门槛仍然有一点点高。但现在有了GPT image2之后,附加以归藏老师的skill,我们就低成本设计出符合我们要求的图标,毕竟对于大部分的独立开发者而言,他们的产品图标并没有那些奇奇怪怪的美学上的要求,能用就行,有区分度就行,所以不要在评论区扣我杠,因为这完全没有任何意义。
1440×1427 54.7 KB
经过几轮迭代之后得到的结果:
1440×1137 29.2 KB
然后就可以完美的应用到我自己的产品里了。
1440×923 29.4 KB
归藏老师的 SKILL:https://github.com/op7418/logo-generator-skill/blob/main/SKILL.md
应用 7. 个人电子名片
相信对于各位做自媒体和传媒的朋友来说,拥有一张个人电子名片,用来快速的传播自己的IP和联系方式是一件非常重要的事情。在过去,我们通常会依赖于一些现有的H5网站来帮我们辅助设计,并且花钱来购买这些昂贵的设计版式。但现在这些设计版式往往没有足够的想象力来彰显你的个性。通过GPT Image2,你可以将自己原本的一个已经设计好的,但是非常一般的一个名片作为输入。然后加上你要的一个要求,就可以让GPT生成一个新的个人名片了。
这是我之前的个人名片
1440×756 23.7 KB
我直接把它输入到了GPT Image2里面,并且输入了一些额外的要求,然后生成了下面这张
1440×762 42.6 KB
你可能会好奇,为什么我要把名片设计成这个样式,因为我的个人网站就是这个风格。事实上,我让AI修改个人名片的prompt,就是我个人网站的颜色定义源代码。
1440×1440 60.7 KB
我一直在探索如何更好的将新中式的设计风格和我家乡的印象融入到现代的UI设计里面,这是我的个人网站:汇尘轩 - 锦恢的博客
1440×755 49.2 KB
应用 8. 封面设计
对于做视频和写文章的人来说,怎么选封面一直是个很头疼的问题。因为既要能够有一定的个性,还能够展示当前你做的这一个内容,大概是什么系列。它是一个同时兼具文本表达和IP传播的一个场景。
我比较懒,一般都是拿我比较喜欢的动漫人物的精美图作为封面的。
一年前的技术大概效果是这样,这是我和AI交互,并且自己还用软件做了后期,花费了两个小时才做出来的一张封面。而且你能看到这个封面里它并没有文字,你很难看清这个封面的文章它到底在讲什么,不是我没加,而是加了之后的效果非常差。
1280×944 79.2 KB
一两年前的图像生成模型基本上输入一些说明文字,一输入就爆炸。甚至你能看到画面上的这个咖啡和饼干,这都是我调了好久才调出来的,一开始生成的都是乱的。
如今我一句话就能生成一个这样的封面,甚至可以一次性生成16比9和正常手机上海报的两种比例。
1440×810 82.2 KB
1024×1536 112 KB
prompt 如下:(语音输入的,别纠结词法)
1440×1396 60.3 KB
1440×1289 67.8 KB
然后我根据我的需求,再对转换成16比9的图片里面的一些信息进行了额外的要求和修改,总共花费了大概10分钟的时间。
不足:你是否想知道它有什么缺点?
没有什么是银弹,大模型也是一样的。事实上,虽然GPT Image2能力很强,但仍然有一些不足的地方。下面我将我在我的实践劳动中遇到的不足展现给你们。
首先就是对于高精度图像修改这个场景,GPT仍然不能胜任。比如说你的画面中有一些细杂的纹理。然后你需要对其他的部放进行处理,就比较困难。当然了,这里可以通过canvas或者是局部重会这些ChatGPT 网页版提供的服务来解决。我单纯只是在说 GPT Image2 这个模型本身。
1440×1530 26.7 KB
比如对于这个场景来说,你就能看到我要求GPT帮我完成一个简单的图标抠图行为。但是改完之后,这个图标的轮廓和它的颜色都发生了变化。而且我重复了10次,没有一次是成功的。
然后对于一些细节的理解还不到位。比如说下面这个任务是需要将指定的人物扔到一个时尚周刊里面。
1440×1375 72.9 KB
1086×1448 98.1 KB
我要求迁移之后,杂志中的这个女角色她要穿上西装,但是你能看到生成的图片中,这个西装和她原本的服饰发生了重叠。在纹理和要素极多的画面中,生成经常会发生这种问题。
再比如对于UI设计稿中,我可能需要对其中的部分交互组件进行位置的调整。一个简单的例子就是我需要将下图设计里面的进入训练和联系教练的两个按钮发生一个调整。
1440×1119 30.4 KB
但是AI最终生成的结果却让我非常不满意:
1440×1041 31 KB
新的威胁:聊天记录伪造
由于GPT Image2对于文本的生成能力实在太强了,导致我们现在可以以超低的成本立刻生成一张真假男方的微信、推特QQ等社交媒体的聊天记录。从而让某些不法分子达到自己的目的。
比如最近一件特别搞笑的事情,就是有人通过GPT生成了一张anthropic官方宣布解除对中国供应封禁的消息,结果一堆人信以为真之后,解除了自己的魔法去使用Claude Code,造成了大面积封号。
我可以立刻伪造特朗普来颐和园倒拔垂杨柳的假新文。
1376×768 187 KB
也可以伪造那些根本不存在的聊天记录。
1440×1440 105 KB
你可会说这些聊天记录有破绽,但是ChatGPT提供了局部重绘技术,可以通过局部重会来修复这些破绽。
还有就是有人通过GPT伪造的公司倒闭的证明材料,从而达到了某些不法目的。这些都给我国的法庭审理提出了新的挑战。
我将这些事情询问了我做法官的朋友,而他最终语重心长的和我说了一句。
970×298 9.09 KB
总结
GPT因为这是一个强大异常的模型,他为我们带来了新的机遇和挑战。相信通过我举的例子,大家应该也能充分的体验到了它的强大之处。
如果你有更多的有关GPT Image2使用案例的部分,欢迎在评论区和大家分享,或者是直接向我提供素材。
网友解答:--【壹】--:
法官肯定不会用一张截图下结论的,没有ai的时候也不会的。除非他蠢。
--【贰】--:
是的, 其实现在机器人实现各种拟人逼真的动作, 都不是真的具备空间理解能力.
记录人类运动轨迹, 让机器人去还原动作, 这里面涉及的是约束优化问题和强化学习.
--【叁】--:
svg用claude web端就挺好的,可以先用gpt-image-2生成想要的图片,然后在claude web端生成svg
--【肆】--:
ChatGPT Image 2026年4月25日 1920091672×941 674 KB
这是根据L佬发的提示词,做的厦门旅游宣传图。
--【伍】--:
已使用过了,绝对好用,感觉比以前进步大多了
--【陆】--:
刚刚在喵的公益站上面试了一下,生成的效果真的很好
--【柒】--:
为啥是claude web端?和desktop端有啥区别吗
--【捌】--:
可以 但是能力仍然很差,svg本质是坐标的集合,而大模型目前的空间理解能力还很差,这种差也反映在目前的具身智能大脑上
--【玖】--:
之前一直没搞明白银弹是什么意思,直到我提需求给模型创建公众号,也给了个银弹的定义
--【拾】--:
在我的场景中,我觉得从视觉效果而言,它是比香蕉强很多了,香蕉的图还是很容易看出来是 AI 生成的,但是 GPT 生成的图确实有点真假难分了
--【拾壹】--:
银弹就是万金油的意思,没有银弹指的就是一个领域没有一种不用动脑子,只要点点鼠标就能解决的方案
--【拾贰】--:
还要提醒一点,尽量不要一次性把要做的东西输入给AI,尽量跟AI进行有效的沟通后再根据AI提供的提示词进行生成,不然很可能事倍功半!
其次就是如果有现成的参考图一定要喂给AI,然后再考虑细节部分的修改,只通过想象并以纯文字形式输入给AI,AI大概率会按照自己理解的来
--【拾叁】--:
这次image-2是有点强的。感觉不输大香蕉了。
--【拾肆】--:
你不让我细看 我甚至都看不出来这是 AI 生成的
--【拾伍】--:
是的,法理判案时一定有证据链,而单张截图无法构成证据链
--【拾陆】--:
有个疑问哈, 就是现阶段 AI 能不能生成那种 svg 矢量图? 或者生成的 PNG 去转成 SVG (我试过, 用像素拟合出来的效果不是太好有毛边, svg体积也很大), 现阶段有什么解决方案吗?
--【拾柒】--: rosemaryu:
就是现阶段 AI 能不能生成那种 svg 矢量图
可以,不过出不了特别复杂的图
AI SVG可以看看recraft家出的vector系列的模型
可以直接输出为svg格式,做做logo之类的还是可以的
无aff链接
Recraft | AI for designers, creatives, sellers, and teams
Recraft is a top-ranked text-to-image model and design platform for photorealism, vector generation, custom styles, mockups, and more
image834×753 117 KB
image260×191 5.26 KB
--【拾捌】--:
可以 但是能力仍然很差,svg本质是坐标的集合,而大模型目前的空间理解能力还很差,这种差也反映在目前的具身智能大脑上
--【拾玖】--:
目前看起来,生成海报、封面这种还是很惊艳的,其他方面还没试过

