没人关注谷歌这份新工作吗?
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
vision-banana.github.io
--【壹】--:
--【贰】--:
--【叁】--:
Results - Vision Banana | Google DeepMind
Image Generators are Generalist Vision Learners | A generalist model achieving state-of-the-art on segmentation, depth, and surface normal tasks.
这个vision banana看起来评测很厉害,超过SAM3跟depth anything3了
网友解答:--【壹】--:
看了下,确实很牛啊,要是能开源用来标注就好了
--【贰】--:
但是gemini能识别到远山诶,这太强了
image1200×880 122 KB
--【叁】--:
截屏2026-04-24 上午10.59.081452×1504 202 KB
用同样的图片和提示词试了下,GPT-Image-2 看起来表现也不错
问题描述:
vision-banana.github.io
--【壹】--:
--【贰】--:
--【叁】--:
Results - Vision Banana | Google DeepMind
Image Generators are Generalist Vision Learners | A generalist model achieving state-of-the-art on segmentation, depth, and surface normal tasks.
这个vision banana看起来评测很厉害,超过SAM3跟depth anything3了
网友解答:--【壹】--:
看了下,确实很牛啊,要是能开源用来标注就好了
--【贰】--:
但是gemini能识别到远山诶,这太强了
image1200×880 122 KB
--【叁】--:
截屏2026-04-24 上午10.59.081452×1504 202 KB
用同样的图片和提示词试了下,GPT-Image-2 看起来表现也不错

