智谱下一个模型还是换换架构吧
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
glm5 这一代的能力还行
但是上下文是个最大的硬伤
上下文小且不说,一超过就会出现混乱的情况
下一个还是换成qwen的那种线性混合架构吧
推理速度快,而且长上下文不会爆
网友解答:--【壹】--:
可能没办法了,换底层了GLM迭代速度跟不上,很快就成为时代的记忆了
问题描述:
--【壹】--:
glm5 这一代的能力还行
但是上下文是个最大的硬伤
上下文小且不说,一超过就会出现混乱的情况
下一个还是换成qwen的那种线性混合架构吧
推理速度快,而且长上下文不会爆
网友解答:--【壹】--:
可能没办法了,换底层了GLM迭代速度跟不上,很快就成为时代的记忆了

