科技巨头罕见联手:美AI三剑客阻击中国对手“模型蒸馏”
- 内容介绍
- 文章标签
- 相关推荐
177552446995882172511573328908332000×1333 221 KB
在全球人工智能竞争日趋白热化的背景下,曾经针锋相对的竞争对手——OpenAI、Anthropic PBC 以及 Alphabet Inc. 旗下的 谷歌 (Google) ——已开始建立统一战线。据知情人士透露,这三大科技巨头正联手打击中国竞争对手利用美国尖端AI模型提取结果(即“模型蒸馏”)的行为,以防止其在技术竞赛中获得不正当优势。
这些公司正通过“前沿模型论坛”(Frontier Model Forum)共享信息。该论坛是由上述三家公司与微软(Microsoft Corp.)于2023年共同创立的工业非营利组织。目前,该组织正致力于检测和阻止违反服务条款的“对抗性蒸馏”(adversarial distillation)企图。
- 成本削减与模仿: 中国用户及企业被指利用美国模型创建“模仿版”产品。
- 价格竞争: 模仿产品往往能以极低价格抢夺客户。
- 国家安全: 美方担心这些通过蒸馏获得的技术可能被移除安全护栏,从而产生安全隐患。
虽然公司内部通常会使用蒸馏技术来开发更高效的小型模型,但第三方(特别是被美方视为竞争对手的国家)未经授权的复制行为已引发巨大争议。
此次行动的导火索可追溯至2025年1月。当时,中国初创公司 DeepSeek(深度求索) 发布了 R1 推理模型,震惊全球AI界。
- 微软与 OpenAI 随后调查了 DeepSeek 是否不当提取了大量数据。
- 今年2月,OpenAI 在致美国众议院中国特设委员会的备忘录中明确指出,DeepSeek 正在利用蒸馏技术开发新版本模型,并指责其在 OpenAI 及其他美方实验室的成果上“搭便车”。
- 不仅限于一家: Anthropic 此前已封禁了受中国控制的企业使用其 Claude 模型,并将 DeepSeek、月之暗面(Moonshot)及 MiniMax 列为非法提取模型能力的实体。
据一名不愿透露姓名的知情人士称,美国官员估计,未经授权的蒸馏行为使硅谷实验室每年损失高达 数十亿美元 的利润。
- 中国实验室大多采用“权重开放”(open weight)模式,用户可免费下载运行。这对于投入数百亿美金建设数据中心的美国封闭源厂商构成了巨大的经济压力。
- 安全护栏缺失: 美方实验室警告,对抗性蒸馏可能被用于开发剥离了安全限制的模型,例如制造致命病原体的指南,从而构成重大安全风险。
针对这一威胁,特朗普政府已释放信号,鼓励AI公司之间进行信息共享。
- 特朗普去年公布的《人工智能行动计划》呼吁建立一个信息共享与分析中心(ISAC),其部分职责正是应对对抗性蒸馏。
- 目前,由于担忧触及反垄断指南,各公司间的信息共享仍相对有限。业内人士呼吁美国政府提供更明确的法律指引,以便更有效地应对来自中国的竞争。
https://www.bloomberg.com/news/articles/2026-04-06/openai-anthropic-google-unite-to-combat-model-copying-in-china
网友解答:--【壹】--:
得了吧,倒是解释下,“为什么美AI三剑客的模型学国内模型的口癖,学的那么快”
--【贰】--:
美已急哭
--【叁】--:
还在蒸馏还在蒸馏,应对不了开源冲击就只会当复读机
--【肆】--:
有没有方法可以只给国内开源或者技术共享啊,申请制开源。
老美这些厂商,用开源技术、蒸开源模型、套皮开源权重,只是因为模型开源了抓不到你而已,真的有点令人作呕了。
建议国内的大模型开源的时候标注一下,禁止美国AI厂商使用该技术提升自身模型能力用、禁止美国人蒸馏。
--【伍】--:
又哈气了,自己底裤干净吗
--【陆】--:
影响他们融资了,从这角度看就很能说得通了
--【柒】--:
斗争愈演愈烈
--【捌】--:
赶紧给他们上上强度了!
--【玖】--:
为什么他们要指责蒸馏呢,因为现在他们的服务不赚钱乃至贴钱呗,否则所谓的蒸馏不过是增加收入了。他们要靠融资才能续下去,且要画agi的饼,同时要他们掌握agi别人掌握不了才能赚回他们烧的钱。像国内现在这样亦步亦趋的样子他们根本不敢保证agi如果实现了(如果不是做不出来的话)是只有他们独有的
--【拾】--:
那怎么行,那不影响我大美赢学了吗
--【拾壹】--:
国内大模型厂商模型蒸馏美国AI模型, 蒸馏这个词让我想起了另一个古老的词, 就是山寨.
“蒸馏”在AI领域是一个严肃的科学术语(由杰弗里·辛顿等大佬提出)。它通过让“学生模型”学习“教师模型”输出的概率分布,从而达到性能对齐。
我觉得正派的蒸馏说法是没有问题的,但蒸馏的域,必须是同一个频道,就是学生和老师必须在同一个班啊, 比如 Gemini 蒸馏出 Gemma ,这都是谷歌内部完成的蒸馏, 都是知道技术路线,文档也是一清二楚的.
而山寨是什么呢, 简单来说,我大概了解目标的技术路线是什么, 我大概知道他产品有什么功能,然后通过一种不对称的复刻,通过一知半解的旁听,得到另一个产品.这就是山寨。
想当年山寨手机厂商是习惯了买现成的联发科方案套个壳"创新", 联发科这边搞出自己的5g芯片, 还有自己的MTK软件平台 ,各大寨厂就在这套平台上捣鼓自己的MTK手机,比如波导手机抄袭Iphone4外观. 还有抄袭诺基亚的,百花齐放.
使用联发科方案是有代价的,永远只能在性价比和性能这条水平线上跌宕起伏成不了大事.
联发科方案当年虽然养活了一众国产手机,但也让国产手机在很长一段时间里陷入了 低水平竞争 和 价格战。即使他们后来转型到安卓平台之后,依旧对苹果手机进行像素级复刻.
有人说,这样比喻是不合理的deepseek只是搞研究,但没人说他的母公司是做投资的,2025 年幻方量化靠DeepSeek大模型用于另类数据挖掘、因子生成、风险预测帮幻方多赚了约 50–80 亿元,没人敢拿出来说;
还有人说这种联发科模式和deepseek的比喻是一种思维的懒惰.但要说清楚一件事就是离不开比喻的.
还有人说,他公布AI卖钱,我调用它花钱训练自己的模型训练,这是理所当然.这是回避问题,试图掩盖那蒸馏已经沦为山寨的性质.
这些说法都在尝试对"山寨"这种行为进行一种辩护,并且把矛头指向针对deepseek,实际上我们一直围绕蒸馏和山寨的话题.
现在的国产大模型也是如此。因为大家都在“蒸馏”类似的老师,导致模型同质化极其严重。
既然大家“智商”差不多,最后比拼的就不是谁更聪明,而是谁的 API 更便宜、谁的服务器更稳。
deepSeek 的方案确实让国内 AI 避开了“由于算力禁运而彻底掉队”的风险,它像当年联发科一样给中国 AI 续了命,给了国内各大模型厂商一个基座。但这种 不求甚解、只求效果 的蒸馏,确实可能让我们失去对 AI 底层科学的探索欲。
当大家都满足于用更少的卡蒸馏出更高比例的 GPT-4 性能时,可能就没人愿意去实验室里蹲五年,去赌一个完全没人走过的技术路线了。这,或许就是“联发科模式”最昂贵的代价。
字节这家企业显然看清了这条路:短期靠蒸馏可以跑得快,但长期想真正立足,必须有自己的根技术。
不做山寨版大模型,不陷入同质化内卷,宁愿前期慢一点,也要把技术命脉握在自己手里。
这种拒绝捷径、死磕底层的路线,让豆包跳出了联发科式陷阱,也让字节跳动,真正具备了成长为 AI 时代华为的潜力。
--【拾贰】--:
拿ds举例并不恰当吧。它才是走实验室路线而不是商业路线的那个
--【拾叁】--:
不给美国开源国产大模型就可以了 (仅玩笑)
--【拾肆】--:
怎么又急眼哈气了啊。每次都说蒸馏倒是给出证据啊。
--【拾伍】--:
美石脚
--【拾陆】--: Bunn:
Bunn:并将 DeepSeek、月之暗面(Moonshot)及 MiniMax
中国实验室大多采用“权重开放”(open weight)模式,用户可免费下载运行。这对于投入数百亿美金建设数据中心的美国封闭源厂商构成了巨大的经济压力。
本质上是骂开源,你看qwen和glm就没被列进去,不就是因为这两个的最先进模型一般都是闭源吗?
我建议这三家公司可以环美国开源
--【拾柒】--:
咋不声明,自己永久不蒸馏开源模型呢?
--【拾捌】--:
又开始哈气了,众所周知,让阿美莉卡掌握先进技术才是最不安全的
--【拾玖】--:
急了
177552446995882172511573328908332000×1333 221 KB
在全球人工智能竞争日趋白热化的背景下,曾经针锋相对的竞争对手——OpenAI、Anthropic PBC 以及 Alphabet Inc. 旗下的 谷歌 (Google) ——已开始建立统一战线。据知情人士透露,这三大科技巨头正联手打击中国竞争对手利用美国尖端AI模型提取结果(即“模型蒸馏”)的行为,以防止其在技术竞赛中获得不正当优势。
这些公司正通过“前沿模型论坛”(Frontier Model Forum)共享信息。该论坛是由上述三家公司与微软(Microsoft Corp.)于2023年共同创立的工业非营利组织。目前,该组织正致力于检测和阻止违反服务条款的“对抗性蒸馏”(adversarial distillation)企图。
- 成本削减与模仿: 中国用户及企业被指利用美国模型创建“模仿版”产品。
- 价格竞争: 模仿产品往往能以极低价格抢夺客户。
- 国家安全: 美方担心这些通过蒸馏获得的技术可能被移除安全护栏,从而产生安全隐患。
虽然公司内部通常会使用蒸馏技术来开发更高效的小型模型,但第三方(特别是被美方视为竞争对手的国家)未经授权的复制行为已引发巨大争议。
此次行动的导火索可追溯至2025年1月。当时,中国初创公司 DeepSeek(深度求索) 发布了 R1 推理模型,震惊全球AI界。
- 微软与 OpenAI 随后调查了 DeepSeek 是否不当提取了大量数据。
- 今年2月,OpenAI 在致美国众议院中国特设委员会的备忘录中明确指出,DeepSeek 正在利用蒸馏技术开发新版本模型,并指责其在 OpenAI 及其他美方实验室的成果上“搭便车”。
- 不仅限于一家: Anthropic 此前已封禁了受中国控制的企业使用其 Claude 模型,并将 DeepSeek、月之暗面(Moonshot)及 MiniMax 列为非法提取模型能力的实体。
据一名不愿透露姓名的知情人士称,美国官员估计,未经授权的蒸馏行为使硅谷实验室每年损失高达 数十亿美元 的利润。
- 中国实验室大多采用“权重开放”(open weight)模式,用户可免费下载运行。这对于投入数百亿美金建设数据中心的美国封闭源厂商构成了巨大的经济压力。
- 安全护栏缺失: 美方实验室警告,对抗性蒸馏可能被用于开发剥离了安全限制的模型,例如制造致命病原体的指南,从而构成重大安全风险。
针对这一威胁,特朗普政府已释放信号,鼓励AI公司之间进行信息共享。
- 特朗普去年公布的《人工智能行动计划》呼吁建立一个信息共享与分析中心(ISAC),其部分职责正是应对对抗性蒸馏。
- 目前,由于担忧触及反垄断指南,各公司间的信息共享仍相对有限。业内人士呼吁美国政府提供更明确的法律指引,以便更有效地应对来自中国的竞争。
https://www.bloomberg.com/news/articles/2026-04-06/openai-anthropic-google-unite-to-combat-model-copying-in-china
网友解答:--【壹】--:
得了吧,倒是解释下,“为什么美AI三剑客的模型学国内模型的口癖,学的那么快”
--【贰】--:
美已急哭
--【叁】--:
还在蒸馏还在蒸馏,应对不了开源冲击就只会当复读机
--【肆】--:
有没有方法可以只给国内开源或者技术共享啊,申请制开源。
老美这些厂商,用开源技术、蒸开源模型、套皮开源权重,只是因为模型开源了抓不到你而已,真的有点令人作呕了。
建议国内的大模型开源的时候标注一下,禁止美国AI厂商使用该技术提升自身模型能力用、禁止美国人蒸馏。
--【伍】--:
又哈气了,自己底裤干净吗
--【陆】--:
影响他们融资了,从这角度看就很能说得通了
--【柒】--:
斗争愈演愈烈
--【捌】--:
赶紧给他们上上强度了!
--【玖】--:
为什么他们要指责蒸馏呢,因为现在他们的服务不赚钱乃至贴钱呗,否则所谓的蒸馏不过是增加收入了。他们要靠融资才能续下去,且要画agi的饼,同时要他们掌握agi别人掌握不了才能赚回他们烧的钱。像国内现在这样亦步亦趋的样子他们根本不敢保证agi如果实现了(如果不是做不出来的话)是只有他们独有的
--【拾】--:
那怎么行,那不影响我大美赢学了吗
--【拾壹】--:
国内大模型厂商模型蒸馏美国AI模型, 蒸馏这个词让我想起了另一个古老的词, 就是山寨.
“蒸馏”在AI领域是一个严肃的科学术语(由杰弗里·辛顿等大佬提出)。它通过让“学生模型”学习“教师模型”输出的概率分布,从而达到性能对齐。
我觉得正派的蒸馏说法是没有问题的,但蒸馏的域,必须是同一个频道,就是学生和老师必须在同一个班啊, 比如 Gemini 蒸馏出 Gemma ,这都是谷歌内部完成的蒸馏, 都是知道技术路线,文档也是一清二楚的.
而山寨是什么呢, 简单来说,我大概了解目标的技术路线是什么, 我大概知道他产品有什么功能,然后通过一种不对称的复刻,通过一知半解的旁听,得到另一个产品.这就是山寨。
想当年山寨手机厂商是习惯了买现成的联发科方案套个壳"创新", 联发科这边搞出自己的5g芯片, 还有自己的MTK软件平台 ,各大寨厂就在这套平台上捣鼓自己的MTK手机,比如波导手机抄袭Iphone4外观. 还有抄袭诺基亚的,百花齐放.
使用联发科方案是有代价的,永远只能在性价比和性能这条水平线上跌宕起伏成不了大事.
联发科方案当年虽然养活了一众国产手机,但也让国产手机在很长一段时间里陷入了 低水平竞争 和 价格战。即使他们后来转型到安卓平台之后,依旧对苹果手机进行像素级复刻.
有人说,这样比喻是不合理的deepseek只是搞研究,但没人说他的母公司是做投资的,2025 年幻方量化靠DeepSeek大模型用于另类数据挖掘、因子生成、风险预测帮幻方多赚了约 50–80 亿元,没人敢拿出来说;
还有人说这种联发科模式和deepseek的比喻是一种思维的懒惰.但要说清楚一件事就是离不开比喻的.
还有人说,他公布AI卖钱,我调用它花钱训练自己的模型训练,这是理所当然.这是回避问题,试图掩盖那蒸馏已经沦为山寨的性质.
这些说法都在尝试对"山寨"这种行为进行一种辩护,并且把矛头指向针对deepseek,实际上我们一直围绕蒸馏和山寨的话题.
现在的国产大模型也是如此。因为大家都在“蒸馏”类似的老师,导致模型同质化极其严重。
既然大家“智商”差不多,最后比拼的就不是谁更聪明,而是谁的 API 更便宜、谁的服务器更稳。
deepSeek 的方案确实让国内 AI 避开了“由于算力禁运而彻底掉队”的风险,它像当年联发科一样给中国 AI 续了命,给了国内各大模型厂商一个基座。但这种 不求甚解、只求效果 的蒸馏,确实可能让我们失去对 AI 底层科学的探索欲。
当大家都满足于用更少的卡蒸馏出更高比例的 GPT-4 性能时,可能就没人愿意去实验室里蹲五年,去赌一个完全没人走过的技术路线了。这,或许就是“联发科模式”最昂贵的代价。
字节这家企业显然看清了这条路:短期靠蒸馏可以跑得快,但长期想真正立足,必须有自己的根技术。
不做山寨版大模型,不陷入同质化内卷,宁愿前期慢一点,也要把技术命脉握在自己手里。
这种拒绝捷径、死磕底层的路线,让豆包跳出了联发科式陷阱,也让字节跳动,真正具备了成长为 AI 时代华为的潜力。
--【拾贰】--:
拿ds举例并不恰当吧。它才是走实验室路线而不是商业路线的那个
--【拾叁】--:
不给美国开源国产大模型就可以了 (仅玩笑)
--【拾肆】--:
怎么又急眼哈气了啊。每次都说蒸馏倒是给出证据啊。
--【拾伍】--:
美石脚
--【拾陆】--: Bunn:
Bunn:并将 DeepSeek、月之暗面(Moonshot)及 MiniMax
中国实验室大多采用“权重开放”(open weight)模式,用户可免费下载运行。这对于投入数百亿美金建设数据中心的美国封闭源厂商构成了巨大的经济压力。
本质上是骂开源,你看qwen和glm就没被列进去,不就是因为这两个的最先进模型一般都是闭源吗?
我建议这三家公司可以环美国开源
--【拾柒】--:
咋不声明,自己永久不蒸馏开源模型呢?
--【拾捌】--:
又开始哈气了,众所周知,让阿美莉卡掌握先进技术才是最不安全的
--【拾玖】--:
急了

