没人关注谷歌这份新工作吗?

2026-04-29 10:372阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:
vision-banana.github.io

Results - Vision Banana | Google DeepMind

Image Generators are Generalist Vision Learners | A generalist model achieving state-of-the-art on segmentation, depth, and surface normal tasks.

这个vision banana看起来评测很厉害,超过SAM3跟depth anything3了

网友解答:
--【壹】--:

看了下,确实很牛啊,要是能开源用来标注就好了


--【贰】--:

但是gemini能识别到远山诶,这太强了
image1200×880 122 KB


--【叁】--:

截屏2026-04-24 上午10.59.081452×1504 202 KB

用同样的图片和提示词试了下,GPT-Image-2 看起来表现也不错