谷歌云CEO深度对谈：解析自研TPU霸权、Anthropic博弈与Gemini 新模型即将发布

2026-04-29 09:293阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

谷歌云首席执行官托马斯·库里安Thomas Kurian在最新访谈中展示了谷歌作为全球唯一拥有全栈AI能力巨头的底气。他不仅揭秘了自研TPU如何通过11年的积淀反超行业通用方案，更首次深入探讨了与竞争对手Anthropic的复杂关系，以及面对Mythos的准备。

库里安透露，谷歌正在改变以往通用芯片的策略，将第八代TPU划分为针对性更强的家族成員：8T（训练）与8i（推理）。专为训练设计的 8T 系统可容纳 2PB（2000TB）的内存。通过超低延迟的 Optical Torus 网络，数据在芯片间的流动效率达到了前所未有的高度。针对日益增长的推理需求，8i 采用了非水冷（空冷）设计，使其能部署在更多传统数据中心。库里安指出，随着Nano Banana 等模型实现多模态输出（Media Out），推理成本的控制将决定AI能否真正普及。库里安澄清，此前的 Ironwood 芯片实际上是训练与推理的混合体，而现在的分工标志着AI工作负载已进入成熟期。

访谈中最具的部分在于谷歌与 Anthropic的关系。作为谷歌云的最大客户之一，Anthropic 既是谷歌的竞争对手，也是其基础设施的深度依赖者。库里安对此表示：谷歌是一家平台公司。虽然 Gemini 在模型层与 Claude 竞争，但我们同样自豪于能为 Anthropic 提供部署。。当被问及算力紧缺时，是否会优先留给自家 Gemini 而断供对手？库里安承认这涉及复杂的执行委员会决策，但他给出了一个句：

拥有自己的芯片并面临需求过剩，总比没有芯片要好得多。

他强调谷歌不只是转售英伟达或他人的 IP，而是通过自研 IP 获取了极高的毛利率，这种财务自由度让谷歌能支撑起 AGI极高的研发成本。

面对业内关于“预训练放缓”的传闻，库里安表示。表示谷歌确认很快将推出 Gemini 的新模型。库里安表示，在所有内部基准测试中，新模型的表现都令人极其兴奋。针对传闻中世界首個 10万亿参数级别的模型 Mythos，库里安表示谷歌早已部署了“解耦服务（Disaggregated Serving）”技术。这意味着无论模型规模多么庞大，谷歌的 TPU 架构都能实现高效的推理部署。

库里安认为，AI 的下一个战场是 Agent。为了让 Agent 能够像人一样操作電腦、处理复杂的企业级数据，谷歌在底层架构上进行了大修加入了Virgo 网络提供超低延迟的连接，确保成千上万颗芯片像一颗大脑一样协同工作。并且采用了Rapid Storage（快速存储）提供高达 15 TB/s 的推理存储速度。当 Agent 需要在几秒钟内查阅数千个企业文档时，这种速度是必不可少的。库里安指出，处理简单的文本文件很容易，但要让 AI 理解拥有 1000 个字段、充满下拉列表的 ERP 系统（如 SAP），需要极高的逻辑推理能力。谷歌正利用企业级数据在轨迹优化（Trajectory Optimization平台上训练 Gemini，使其在处理复杂逻辑上远超对手。

在谷歌内部，软件工程正在发生改变。库里安分享了名为 Jet Ski” 的内部开发环境。谷歌不再以代码行数衡量生产力。借助 AI，高级工程师正在编写更紧凑、功能更强的代码。谷歌正在开发三种特殊的 Agent：一种负责持续攻击系统（红队演练），一种负责对发现的漏洞进行优先级排序，第三种则负责自动修复代码。面对AI 生成代码、AI 审阅代码是否会导致人类丧失理解能力的风险，库里安表示，谷歌坚持 senior 工程师的同行评审，但会利用 Gemini 作为辅助工具来扫描安全漏洞。

在采访的最后，库里安表示，他最关注的是长期资本基础设施的规划(是否有足够的电力、数据中心和TPU来满足爆发式的需求)。

网友解答：

--【壹】--： Bunn:

库里安表示。表示谷歌确认很快将推出 Gemini 的新模型

新模型不会是迟迟不出来的 3.1-Flash 吧？

--【贰】--：

谷歌算力紧缺在哪里呢，全都送给A\了吗？…谷歌这个级别的infra怎么可能算力紧缺

--【叁】--：

什么时候瘫坐在椅子上，好像看到原子弹爆炸

--【肆】--： Bunn:

Rapid Storage（快速存储）提供高达 15 TB/s 的推理存储速度。

感觉ai时代infra的变化真的是巨大的。15tb/s的nfs/某种网络文件系统真的是之前想都不敢想。估计可能用于集群的kv cache这类场景吧

--【伍】--：

y1s1, 反重力现在还不能用的其实是被shadow ban了，和谷歌侧的可用性关系已经不大了。

--【陆】--：

因为你也知道是按号来软封禁的啊，你的账号活跃度高所以没被风控，如果你号多不能每个号活跃度都保持高的话风控率就很高（顺带一提，账号活跃是可以解除风控的，比如刷油管，短期内，高强度刷油管可以直接把软封禁解掉）

--【柒】--： Bunn:

表示谷歌确认很快将推出 Gemini 的全新迭代

Bunn:

库里安表示，在所有内部基准测试中，新模型的表现都令人极其兴奋

我要看Google的原子弹喵！狠狠期待一下Gemini 3.5

--【捌】--：

谷歌和anthropic合体能打得过OpenAI吗

--【玖】--：

如果算力够用它闲得搞这么多骚操作吗，先是 cliPVP429（这个时候还没有开始风控，只是单纯算力不够高峰期 PVP），后是 429 风控，拉取额度都是直接 429，然后 429 风控转成 403 风控同时期反重力开始 503

--【拾】--：

你真的有用过谷歌的 cli 和反重力吗？在反重力这次 503 软封号之前 cli 的 429 就很严重了

--【拾壹】--：

我的天哪，我用了两三个月Cli和反重力，没有碰到过任何retry问题。。。

那我真不知道什么原因了

--【拾贰】--：

别说cli 反重力，vertex最近两个月的可用性都极差

--【拾叁】--：

所以他们应对爆发式需求的方法是降低模型上下文效率？尽快赶走用户

--【拾肆】--：

他们是发布新模型之前一定要有个什么高管出来采访，然后不小心透露新模型快发布的消息吗()，这让我想起了 Greg 的 Spud

那看起来 Gemini 3.5 可能真的快了？

--【拾伍】--：

就是算力不够用才 ban 号的啊，不然 ban 啥啊，它算力一直紧缺的话基本是不用期待它的任何产品了

--【拾陆】--：

期待一手还是毕竟积累的实力底蕴在哪里完善的链条

--【拾柒】--：

快进到失去Gemini的访问权限就好像被截肢

--【拾捌】--：

别搞笑了，先把你那破反重力修一修吧。连个好用的东西都没有，和另外两家怎么比呀？
memeallthreemain1080×1084 143 KB

--【拾玖】--：

Gemini 3 Flash就是Gemini 3.1 Flash

标签：人工智能转载