Pro模型在Rebuttal的表现一般
- 内容介绍
- 文章标签
- 相关推荐
最近在进行Rebuttal,一直使用Gpt Pro来进行回答,横向对比了许多模型的回答,我的感觉是 Pro > Opus 4.6 > sonnet 4.6 >> gpt 5.4 thinking. 当然,对于Pro的回答我也是非常不满意的,例如审稿人问:
xxx引入严重的计算规模问题。与微小提升相比,这种巨大的计算开销并不合理。
Pro回答的思路: 1. 承认开销 2. 解释模块 3. 摆出数据
但其实这是这个流程并不完全对,这个问题的关键是要抓住这里的计算规模和提升的关系,也就是这本质是一个trade-off问题,但Pro完全没有表达出这个意思来,至于其他三个模型就都回答的大差不差了,基本看不了。任重道远
网友解答:--【壹】--:
大家有什么好的prompt也可以丢出来
--【贰】--:
是的,在re icml
我觉得还是人回答思路,然后pro整理文字人工再优化。实在不行要让pro精读一遍论文然后再问,直接问效果不好,一般来说还是要你指出回答的方向来是最好的,gpt的模型是这样的
--【叁】--:
佬友,这确实是一个 trade-off 的问题,我觉得关键是「微小提升」和「巨大的计算开销」如何解释。
--【肆】--:
!还真是,我只解释了带来的好处,没有解释我们开销并非巨大,改一下去。莫非你就是我的美丽审稿人
--【伍】--:
有些问题回答的还可以,有些问题一般,终究不会懂人的心理,毕竟rebuttal不是打打杀杀而是人情世故
--【陆】--:
佬在re ICML嘛,我用的pro来re的,佬有什么好办法。
--【柒】--:
有专门针对rebuttal的skill,可以给他安装一下
最近在进行Rebuttal,一直使用Gpt Pro来进行回答,横向对比了许多模型的回答,我的感觉是 Pro > Opus 4.6 > sonnet 4.6 >> gpt 5.4 thinking. 当然,对于Pro的回答我也是非常不满意的,例如审稿人问:
xxx引入严重的计算规模问题。与微小提升相比,这种巨大的计算开销并不合理。
Pro回答的思路: 1. 承认开销 2. 解释模块 3. 摆出数据
但其实这是这个流程并不完全对,这个问题的关键是要抓住这里的计算规模和提升的关系,也就是这本质是一个trade-off问题,但Pro完全没有表达出这个意思来,至于其他三个模型就都回答的大差不差了,基本看不了。任重道远
网友解答:--【壹】--:
大家有什么好的prompt也可以丢出来
--【贰】--:
是的,在re icml
我觉得还是人回答思路,然后pro整理文字人工再优化。实在不行要让pro精读一遍论文然后再问,直接问效果不好,一般来说还是要你指出回答的方向来是最好的,gpt的模型是这样的
--【叁】--:
佬友,这确实是一个 trade-off 的问题,我觉得关键是「微小提升」和「巨大的计算开销」如何解释。
--【肆】--:
!还真是,我只解释了带来的好处,没有解释我们开销并非巨大,改一下去。莫非你就是我的美丽审稿人
--【伍】--:
有些问题回答的还可以,有些问题一般,终究不会懂人的心理,毕竟rebuttal不是打打杀杀而是人情世故
--【陆】--:
佬在re ICML嘛,我用的pro来re的,佬有什么好办法。
--【柒】--:
有专门针对rebuttal的skill,可以给他安装一下

