其实冷静下来想想,V4比较突出的优点也只有注意力了

2026-04-29 09:521阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

其他的在当今的国模环境来说

都没啥突出的

而且没有多模态更是硬伤

也只有强大的注意力能说道做道了

网友解答:
--【壹】--:

ds是最不喜欢搞模型多版本的
网页专家和api pro 大概率就是同一个模型


--【贰】--:

我认为有注意力了,就基本保证了推理的准确性吧


--【叁】--:

所以说私有化部署一个v4,再做专项训练,突出的注意力的优势就会体现出来了?


--【肆】--:

闭源模型最危险的挑战者,开源模型最严厉的老师


--【伍】--:

不知道在酒馆里表现如何 ,编码目前看还是差点意思


--【陆】--:

image1884×1542 272 KB
其实Deepseek-V4-max当前在很多官方测试集和测试机构测试集上还是有一定领先幅度的第一的,只是网页版做的不太行,可能得用api。国内网页端做的最好的是Kimi。期待一下deepseek之后的后训练吧


--【柒】--:

没做专项训练 更像是上下文机制跑通了就端上来了 确实很deepseek 就没打算商业化


--【捌】--:

但推理强度估计不是Max,当前Pro的推理强度有[high, max]两个等级,而且网页版的工具调用也不如kimi,不过搜索还行。

阅读全文
问题描述:

其他的在当今的国模环境来说

都没啥突出的

而且没有多模态更是硬伤

也只有强大的注意力能说道做道了

网友解答:
--【壹】--:

ds是最不喜欢搞模型多版本的
网页专家和api pro 大概率就是同一个模型


--【贰】--:

我认为有注意力了,就基本保证了推理的准确性吧


--【叁】--:

所以说私有化部署一个v4,再做专项训练,突出的注意力的优势就会体现出来了?


--【肆】--:

闭源模型最危险的挑战者,开源模型最严厉的老师


--【伍】--:

不知道在酒馆里表现如何 ,编码目前看还是差点意思


--【陆】--:

image1884×1542 272 KB
其实Deepseek-V4-max当前在很多官方测试集和测试机构测试集上还是有一定领先幅度的第一的,只是网页版做的不太行,可能得用api。国内网页端做的最好的是Kimi。期待一下deepseek之后的后训练吧


--【柒】--:

没做专项训练 更像是上下文机制跑通了就端上来了 确实很deepseek 就没打算商业化


--【捌】--:

但推理强度估计不是Max,当前Pro的推理强度有[high, max]两个等级,而且网页版的工具调用也不如kimi,不过搜索还行。

阅读全文