现在发布新模型都是捧新踩旧?

2026-04-11 15:311阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

如图一,GLM5.1发布,和opus差距较小,遥遥领先GLM5,接近1/3,然鹅,图二,GLM5发布的时候,和OPUS几乎持平,难道是opus4.6相对opus4.5进步非常大?没记错也就几个点的提升吧。
image911×372 62.7 KB
d213524e8c5870a1ee113d984a377fd51080×727 111 KB
一发布新模型,就和top模型齐肩,然后自身迭代的时候,又说大幅领先了上一代模型,把曾经的模型说得一文不值,当初发布时的威风呢。
很想知道GLM5.2发布的时候,会说GLM5.1和opus4.6差距多大呢
侵删

网友解答:
--【壹】--:

楼上说的怎么感觉有点像pdd?永远差一刀,都是一副嘴脸


--【贰】--:

刚出的时候为了宣传,肯定会说比上代增强很多呀。不然发布的意义是啥


--【叁】--:

这次你一定要追上


--【肆】--:

重点不是好坏吧,重点是好多少


--【伍】--:

不承认 用户会替他承认的


--【陆】--:

正常呀,经典的友商对比


--【柒】--:

能承认有差距就已经不错了


--【捌】--:

都不是同一个评分标准,跑分也就图一乐


--【玖】--:

claude也不知道自己的小更新进步了30%


--【拾】--:

你问到重点了,发布的意义是啥


--【拾壹】--:

要是连上一代都打不过不就更丢人了喵w
新模型就应该比旧模型好呢w


--【拾贰】--:

我觉得好笑的是,当时看也是和4.6差距不大,现在依然差距不大。中间这块距离可以无限缩放。和卖房的介绍附近的商圈一样,永远都是近在咫尺


--【拾叁】--: trigger1:

很想知道GLM5.2发布的时候,会说GLM5.1和opus4.6差距多大呢

很想知道GLM5.2发布的时候,会说GLM5.1和opus4.6差距多大呢

GLM 5.4遥遥领先OPUS4.6


--【拾肆】--:

一会就降智到不如上一代


--【拾伍】--:

Gemini 3 和 Gemini 3.1:


--【拾陆】--:

宣传时会故意挑选对自己有利的测评结果,对不利的结果避而不谈。


--【拾柒】--:

跟当初卖手机一样的套路,当前看到这种对比图一律不看


--【拾捌】--:

我当时也看愣了


--【拾玖】--:

吃惊了,HLE也能这么高分吗?这个数据集测模型智商,国模真能甩御三家这么一大截吗

标签:人工智能
问题描述:

如图一,GLM5.1发布,和opus差距较小,遥遥领先GLM5,接近1/3,然鹅,图二,GLM5发布的时候,和OPUS几乎持平,难道是opus4.6相对opus4.5进步非常大?没记错也就几个点的提升吧。
image911×372 62.7 KB
d213524e8c5870a1ee113d984a377fd51080×727 111 KB
一发布新模型,就和top模型齐肩,然后自身迭代的时候,又说大幅领先了上一代模型,把曾经的模型说得一文不值,当初发布时的威风呢。
很想知道GLM5.2发布的时候,会说GLM5.1和opus4.6差距多大呢
侵删

网友解答:
--【壹】--:

楼上说的怎么感觉有点像pdd?永远差一刀,都是一副嘴脸


--【贰】--:

刚出的时候为了宣传,肯定会说比上代增强很多呀。不然发布的意义是啥


--【叁】--:

这次你一定要追上


--【肆】--:

重点不是好坏吧,重点是好多少


--【伍】--:

不承认 用户会替他承认的


--【陆】--:

正常呀,经典的友商对比


--【柒】--:

能承认有差距就已经不错了


--【捌】--:

都不是同一个评分标准,跑分也就图一乐


--【玖】--:

claude也不知道自己的小更新进步了30%


--【拾】--:

你问到重点了,发布的意义是啥


--【拾壹】--:

要是连上一代都打不过不就更丢人了喵w
新模型就应该比旧模型好呢w


--【拾贰】--:

我觉得好笑的是,当时看也是和4.6差距不大,现在依然差距不大。中间这块距离可以无限缩放。和卖房的介绍附近的商圈一样,永远都是近在咫尺


--【拾叁】--: trigger1:

很想知道GLM5.2发布的时候,会说GLM5.1和opus4.6差距多大呢

很想知道GLM5.2发布的时候,会说GLM5.1和opus4.6差距多大呢

GLM 5.4遥遥领先OPUS4.6


--【拾肆】--:

一会就降智到不如上一代


--【拾伍】--:

Gemini 3 和 Gemini 3.1:


--【拾陆】--:

宣传时会故意挑选对自己有利的测评结果,对不利的结果避而不谈。


--【拾柒】--:

跟当初卖手机一样的套路,当前看到这种对比图一律不看


--【拾捌】--:

我当时也看愣了


--【拾玖】--:

吃惊了,HLE也能这么高分吗?这个数据集测模型智商,国模真能甩御三家这么一大截吗

标签:人工智能