gpt还是吊打其他模型
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
有时候逛论坛看到各种模型发布了,就看各种测评网站,久而久之其实也不太信这些网站,因为很难说清楚这些网站有没有收钱,或者是模型有没有过拟合数据集。
今天刚好送老婆坐飞机出国,但是刚刚看飞机的位置发现在缅甸和云南的交界,和航旅纵横、飞常准的路线图不一样(预计的路线是走中国西北),心中有些害怕就查了一下历史路线图。发现有两条路线,可能会根据各种原因进行切换。
我就拿这个问题问了一下gpt、grok、gemini。
问题
aaa - bbb(机场代码),某某航空的飞机,我看飞行历史记录大概有两条飞行线路,请你看一下这两条线路是什么,具体经过哪里,那个国家?然后告诉我26年4月25号从aaa起飞的航班走的是哪条?
结果
我分别问了两次,只有gpt 5.5 thinking的其中一次回答,能够正确推断出路线并推断出当前航线走的是哪条。
问题描述:
有时候逛论坛看到各种模型发布了,就看各种测评网站,久而久之其实也不太信这些网站,因为很难说清楚这些网站有没有收钱,或者是模型有没有过拟合数据集。
今天刚好送老婆坐飞机出国,但是刚刚看飞机的位置发现在缅甸和云南的交界,和航旅纵横、飞常准的路线图不一样(预计的路线是走中国西北),心中有些害怕就查了一下历史路线图。发现有两条路线,可能会根据各种原因进行切换。
我就拿这个问题问了一下gpt、grok、gemini。
问题
aaa - bbb(机场代码),某某航空的飞机,我看飞行历史记录大概有两条飞行线路,请你看一下这两条线路是什么,具体经过哪里,那个国家?然后告诉我26年4月25号从aaa起飞的航班走的是哪条?
结果
我分别问了两次,只有gpt 5.5 thinking的其中一次回答,能够正确推断出路线并推断出当前航线走的是哪条。

