artificial analysis 测试 v4 flash max幻觉率排名倒数第一
- 内容介绍
- 文章标签
- 相关推荐
等一会看看Pro的成绩,不过我感觉应该不会很惊艳
PixPin2026-04-2415-52-26695×463 67.1 KB
网友解答:--【壹】--:
这榜单真的准吗,grok4.20我自己用起来就是幻觉率高的吓人
--【贰】--:
grok幻觉高吗,我反而觉得他是幻觉最小的了,,
--【叁】--:
pro的成绩也在上面 综合来看感觉不太行 幻觉率高但是总体来看正确率尚可
image1469×953 110 KB
image1453×785 104 KB
image1449×684 99.4 KB
--【肆】--:
标题捉虫
是无幻觉率倒数第一
幻觉率倒数第一那不就是第一了吗
--【伍】--:
这是什么榜啊,我怎么没看过这个Non的榜
--【陆】--:
图片上的是无幻觉率,贴主应该写错了
--【柒】--:
4.2是多Agent模式才能有效降低幻觉率吧,我一直用4Agent模式来核查信息,目前感觉幻觉率和信息准确性都还行
--【捌】--:
DeepSeek V4 Pro (Max) - Intelligence, Performance & Price Analysis
Analysis of DeepSeek's DeepSeek V4 Pro (Reasoning, Max Effort) and comparison to other AI models across key metrics including quality, price, performance
等一会看看Pro的成绩,不过我感觉应该不会很惊艳
PixPin2026-04-2415-52-26695×463 67.1 KB
网友解答:--【壹】--:
这榜单真的准吗,grok4.20我自己用起来就是幻觉率高的吓人
--【贰】--:
grok幻觉高吗,我反而觉得他是幻觉最小的了,,
--【叁】--:
pro的成绩也在上面 综合来看感觉不太行 幻觉率高但是总体来看正确率尚可
image1469×953 110 KB
image1453×785 104 KB
image1449×684 99.4 KB
--【肆】--:
标题捉虫
是无幻觉率倒数第一
幻觉率倒数第一那不就是第一了吗
--【伍】--:
这是什么榜啊,我怎么没看过这个Non的榜
--【陆】--:
图片上的是无幻觉率,贴主应该写错了
--【柒】--:
4.2是多Agent模式才能有效降低幻觉率吧,我一直用4Agent模式来核查信息,目前感觉幻觉率和信息准确性都还行
--【捌】--:
DeepSeek V4 Pro (Max) - Intelligence, Performance & Price Analysis
Analysis of DeepSeek's DeepSeek V4 Pro (Reasoning, Max Effort) and comparison to other AI models across key metrics including quality, price, performance

