Pro模型在Rebuttal的表现一般

2026-04-11 14:310阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

最近在进行Rebuttal,一直使用Gpt Pro来进行回答,横向对比了许多模型的回答,我的感觉是 Pro > Opus 4.6 > sonnet 4.6 >> gpt 5.4 thinking. 当然,对于Pro的回答我也是非常不满意的,例如审稿人问:

xxx引入严重的计算规模问题。与微小提升相比,这种巨大的计算开销并不合理。

Pro回答的思路: 1. 承认开销 2. 解释模块 3. 摆出数据

但其实这是这个流程并不完全对,这个问题的关键是要抓住这里的计算规模和提升的关系,也就是这本质是一个trade-off问题,但Pro完全没有表达出这个意思来,至于其他三个模型就都回答的大差不差了,基本看不了。任重道远

网友解答:
--【壹】--:

大家有什么好的prompt也可以丢出来


--【贰】--:

是的,在re icml

我觉得还是人回答思路,然后pro整理文字人工再优化。实在不行要让pro精读一遍论文然后再问,直接问效果不好,一般来说还是要你指出回答的方向来是最好的,gpt的模型是这样的


--【叁】--:

佬友,这确实是一个 trade-off 的问题,我觉得关键是「微小提升」和「巨大的计算开销」如何解释。


--【肆】--:

!还真是,我只解释了带来的好处,没有解释我们开销并非巨大,改一下去。莫非你就是我的美丽审稿人


--【伍】--:

有些问题回答的还可以,有些问题一般,终究不会懂人的心理,毕竟rebuttal不是打打杀杀而是人情世故


--【陆】--:

佬在re ICML嘛,我用的pro来re的,佬有什么好办法。


--【柒】--:

有专门针对rebuttal的skill,可以给他安装一下

问题描述:

最近在进行Rebuttal,一直使用Gpt Pro来进行回答,横向对比了许多模型的回答,我的感觉是 Pro > Opus 4.6 > sonnet 4.6 >> gpt 5.4 thinking. 当然,对于Pro的回答我也是非常不满意的,例如审稿人问:

xxx引入严重的计算规模问题。与微小提升相比,这种巨大的计算开销并不合理。

Pro回答的思路: 1. 承认开销 2. 解释模块 3. 摆出数据

但其实这是这个流程并不完全对,这个问题的关键是要抓住这里的计算规模和提升的关系,也就是这本质是一个trade-off问题,但Pro完全没有表达出这个意思来,至于其他三个模型就都回答的大差不差了,基本看不了。任重道远

网友解答:
--【壹】--:

大家有什么好的prompt也可以丢出来


--【贰】--:

是的,在re icml

我觉得还是人回答思路,然后pro整理文字人工再优化。实在不行要让pro精读一遍论文然后再问,直接问效果不好,一般来说还是要你指出回答的方向来是最好的,gpt的模型是这样的


--【叁】--:

佬友,这确实是一个 trade-off 的问题,我觉得关键是「微小提升」和「巨大的计算开销」如何解释。


--【肆】--:

!还真是,我只解释了带来的好处,没有解释我们开销并非巨大,改一下去。莫非你就是我的美丽审稿人


--【伍】--:

有些问题回答的还可以,有些问题一般,终究不会懂人的心理,毕竟rebuttal不是打打杀杀而是人情世故


--【陆】--:

佬在re ICML嘛,我用的pro来re的,佬有什么好办法。


--【柒】--:

有专门针对rebuttal的skill,可以给他安装一下