发现了gpt-image-2配合nanobanana2的真谛
- 内容介绍
- 文章标签
- 相关推荐
gpt-image-2审美很好,非常听话,但是中文能力略差
nanobanana 2 审美很差,容易偷懒,但是中文能力强,
所以把这两个模型结合使用就得到了完美的图片,
先由gpt-image-2生成,再由nanobanana 2修复,
这样子能大幅修复中文字,且由于GPT目前只能生成1K图片,经过4K nanobanana 2还能把画质拉到4K(但被L站压缩了)
比较可惜的是香蕉的能力也不够强,做不到百分百修正,也可能会导致整体色调变粉,
不过用于这种总结图效果还是非常优秀的,
只能期待gpt-image-2 4K跟尚未面世的nanobanana 2 pro了
原图:
image1448×1086 403 KB
修复后:
image1920×1440 587 KB
--【壹】--:
认真的吗?现在image-2的中文能力明显远超大香蕉,让大香蕉修复只会把好的文字修复差
--【贰】--:
API也可以用香蕉,没找到欸,我也想试试
--【叁】--:
朴实无华的提示词
image1506×834 138 KB
--【肆】--:
Notebook LM 的生图和 PPT,啥时候能提升一下中文字的准确率呀
--【伍】--:
目前gpt只有1k生图,说不定之后开放2k或4k能生成的更好,
像banana的解析度就会对中文字有影响,越高中文写得越好
1K指的是图片生成的画质
--【陆】--:
修复的话用那个版本gemini 还是那个ai studio
--【柒】--:
很有建设性的实战经验,思路值得借鉴!我也去试试、
--【捌】--:
好像GPT IMAGE2灰度的时候,有2K版本吧,IMAGE1.5确实图片怎么都是1024x1536变来变去。但是IMAGE好像能到1600以上
--【玖】--:
想知道一下,这个图片是用什么提示词能生成啊?
--【拾】--:
我以为gpt处理中文已经够可以了,原来有些地方还是不太行,这个思路确实不错,学到了
--【拾壹】--:
感谢佬的思路很棒,学习到了感谢佬的分享森Q
--【拾贰】--:
好像不太行,我咋矫正一个,其他又歪了糊了
--【拾叁】--:
image文字糊是因为官网目前是2K吧,所以说借助nano banana 2的4K重绘来提高清晰度,进而改善文字准确度
不过现在image的api倒是有4K了,文字应该很可以了,但是不如nano banana 2的4K好白嫖,因为后者可以在ai studio上靠Google one会员来用不需要额外花钱
--【拾肆】--:
是的,我之前使用香蕉模型去改很糊的签字文件,他竟然可以无痕改里面的文件。。中文能力确实厉害,比gpt最新的要厉害(gpt刚出的还是会有个别糊的)
--【拾伍】--:
目前GPT暂时不清楚分辨率的规则,官方说明的分辨率保持跟前代1.5一样的(1024X1336或1536X1024,或1024X1024,一般不能裁剪,强制输出这个分辨率,即便是指出手机9:21的画幅),但是灰度的时候GPTimage2已经会裁剪生成一些特殊分辨率的,而且有人确实生成过2K的截图或者接近完整的1920X1080这种。而且官方似乎也留了一行小字说有其他分辨率可选。
--【拾陆】--:
佬 这种图片的提示词能发一下吗,为啥我用之前的总结文章的感觉 比gemini的效果差太多了
--【拾柒】--:
学到了感谢大佬,只不过gpt这边有可能要求模型输出2K 4K分辨率的图片吗?
--【拾捌】--:
又学习了一招,我用佬友给的提示词,在大香蕉里画的图风格也很好
--【拾玖】--:
那么要怎么修复呢,修复提示词是什么呢
gpt-image-2审美很好,非常听话,但是中文能力略差
nanobanana 2 审美很差,容易偷懒,但是中文能力强,
所以把这两个模型结合使用就得到了完美的图片,
先由gpt-image-2生成,再由nanobanana 2修复,
这样子能大幅修复中文字,且由于GPT目前只能生成1K图片,经过4K nanobanana 2还能把画质拉到4K(但被L站压缩了)
比较可惜的是香蕉的能力也不够强,做不到百分百修正,也可能会导致整体色调变粉,
不过用于这种总结图效果还是非常优秀的,
只能期待gpt-image-2 4K跟尚未面世的nanobanana 2 pro了
原图:
image1448×1086 403 KB
修复后:
image1920×1440 587 KB
--【壹】--:
认真的吗?现在image-2的中文能力明显远超大香蕉,让大香蕉修复只会把好的文字修复差
--【贰】--:
API也可以用香蕉,没找到欸,我也想试试
--【叁】--:
朴实无华的提示词
image1506×834 138 KB
--【肆】--:
Notebook LM 的生图和 PPT,啥时候能提升一下中文字的准确率呀
--【伍】--:
目前gpt只有1k生图,说不定之后开放2k或4k能生成的更好,
像banana的解析度就会对中文字有影响,越高中文写得越好
1K指的是图片生成的画质
--【陆】--:
修复的话用那个版本gemini 还是那个ai studio
--【柒】--:
很有建设性的实战经验,思路值得借鉴!我也去试试、
--【捌】--:
好像GPT IMAGE2灰度的时候,有2K版本吧,IMAGE1.5确实图片怎么都是1024x1536变来变去。但是IMAGE好像能到1600以上
--【玖】--:
想知道一下,这个图片是用什么提示词能生成啊?
--【拾】--:
我以为gpt处理中文已经够可以了,原来有些地方还是不太行,这个思路确实不错,学到了
--【拾壹】--:
感谢佬的思路很棒,学习到了感谢佬的分享森Q
--【拾贰】--:
好像不太行,我咋矫正一个,其他又歪了糊了
--【拾叁】--:
image文字糊是因为官网目前是2K吧,所以说借助nano banana 2的4K重绘来提高清晰度,进而改善文字准确度
不过现在image的api倒是有4K了,文字应该很可以了,但是不如nano banana 2的4K好白嫖,因为后者可以在ai studio上靠Google one会员来用不需要额外花钱
--【拾肆】--:
是的,我之前使用香蕉模型去改很糊的签字文件,他竟然可以无痕改里面的文件。。中文能力确实厉害,比gpt最新的要厉害(gpt刚出的还是会有个别糊的)
--【拾伍】--:
目前GPT暂时不清楚分辨率的规则,官方说明的分辨率保持跟前代1.5一样的(1024X1336或1536X1024,或1024X1024,一般不能裁剪,强制输出这个分辨率,即便是指出手机9:21的画幅),但是灰度的时候GPTimage2已经会裁剪生成一些特殊分辨率的,而且有人确实生成过2K的截图或者接近完整的1920X1080这种。而且官方似乎也留了一行小字说有其他分辨率可选。
--【拾陆】--:
佬 这种图片的提示词能发一下吗,为啥我用之前的总结文章的感觉 比gemini的效果差太多了
--【拾柒】--:
学到了感谢大佬,只不过gpt这边有可能要求模型输出2K 4K分辨率的图片吗?
--【拾捌】--:
又学习了一招,我用佬友给的提示词,在大香蕉里画的图风格也很好
--【拾玖】--:
那么要怎么修复呢,修复提示词是什么呢

