有佬友用过国产的编码模型的吗?
- 内容介绍
- 文章标签
- 相关推荐
有佬友用过国产编码模型吗?可否分享一下感受。在此感谢
网友解答:--【壹】--:
kimi感觉不错,可以试试
--【贰】--:
国产agent软件不行,就算模型有这个能力cli都跟不上
--【叁】--:
感谢佬友分享
--【肆】--:
国内仅有GLM5系列、QWEN3.5 PLUS和MINIMAX M2.7勉强可用,但是都有长上下文注意力缺失严重的情况,M2.7存在循环对话、缺失记忆的问题,GLM5以及5.1目前还好,但是偶发长上下文注意力涣散的问题,注意目前能用的,QWEN3.5 PLUS需要配合QWEN CLI才能正常使用,上下文很长,但是同样的注意力涣散。
所以以上为国内大模型通病,召回率都很捉急,而且容易出现丢失、幻觉、循环的问题,建议拆成极小任务执行(购买大量套餐亲测)。
--【伍】--:
谢谢佬友
--【陆】--:
国产:glm、minimax第一梯队,其它的不要试了,会气死你
--【柒】--:
glm勉强还行,其他的感觉不怎么聪明
--【捌】--:
glm5.1有渠道吗,佬
--【玖】--:
最新 glm5.1 听说还不错,5用了感觉也还行
--【拾】--:
国产模型最强大的一个地方就是你是什么模型,能快速验证网络有没有问题
--【拾壹】--:
我一直用国产的做编程,不知道为什么你们会觉得国产的不行,我用glm5和kimi2.5,这两个模型到现在为止,帮我开发复杂的项目,我都没有手动修改过一行代码。
我主要使用的语言是rust 和c嵌入式和后端开发,python 模型训练,kotlin 应用开发。
qwen 就不太行,复杂任务干不了。
deepseek 在我这里80%吧
唯一一次使用gpt是想尝试公益的,只能说在我的使用场景没看出区别,不过对中文的理解上感觉要差一点。
当然上面的上下文长度都不行。当上下文超过上限后,幻觉就上来了,所以最好的方式是一个任务要在一个上下文极限里完成。
所以很期待deepseek的百万上下文
--【拾贰】--:
glm5.1还是挺不错的,智商在线,唯一的缺点就是慢
--【拾叁】--:
用过minimax2.7 和 kimi2.5,glm5,基本都路边
--【拾肆】--:
glm5.1/5 kimi2.5 minimax 就这三家好用一些
--【拾伍】--:
glm5.1还可以,就是不经用
有佬友用过国产编码模型吗?可否分享一下感受。在此感谢
网友解答:--【壹】--:
kimi感觉不错,可以试试
--【贰】--:
国产agent软件不行,就算模型有这个能力cli都跟不上
--【叁】--:
感谢佬友分享
--【肆】--:
国内仅有GLM5系列、QWEN3.5 PLUS和MINIMAX M2.7勉强可用,但是都有长上下文注意力缺失严重的情况,M2.7存在循环对话、缺失记忆的问题,GLM5以及5.1目前还好,但是偶发长上下文注意力涣散的问题,注意目前能用的,QWEN3.5 PLUS需要配合QWEN CLI才能正常使用,上下文很长,但是同样的注意力涣散。
所以以上为国内大模型通病,召回率都很捉急,而且容易出现丢失、幻觉、循环的问题,建议拆成极小任务执行(购买大量套餐亲测)。
--【伍】--:
谢谢佬友
--【陆】--:
国产:glm、minimax第一梯队,其它的不要试了,会气死你
--【柒】--:
glm勉强还行,其他的感觉不怎么聪明
--【捌】--:
glm5.1有渠道吗,佬
--【玖】--:
最新 glm5.1 听说还不错,5用了感觉也还行
--【拾】--:
国产模型最强大的一个地方就是你是什么模型,能快速验证网络有没有问题
--【拾壹】--:
我一直用国产的做编程,不知道为什么你们会觉得国产的不行,我用glm5和kimi2.5,这两个模型到现在为止,帮我开发复杂的项目,我都没有手动修改过一行代码。
我主要使用的语言是rust 和c嵌入式和后端开发,python 模型训练,kotlin 应用开发。
qwen 就不太行,复杂任务干不了。
deepseek 在我这里80%吧
唯一一次使用gpt是想尝试公益的,只能说在我的使用场景没看出区别,不过对中文的理解上感觉要差一点。
当然上面的上下文长度都不行。当上下文超过上限后,幻觉就上来了,所以最好的方式是一个任务要在一个上下文极限里完成。
所以很期待deepseek的百万上下文
--【拾贰】--:
glm5.1还是挺不错的,智商在线,唯一的缺点就是慢
--【拾叁】--:
用过minimax2.7 和 kimi2.5,glm5,基本都路边
--【拾肆】--:
glm5.1/5 kimi2.5 minimax 就这三家好用一些
--【拾伍】--:
glm5.1还可以,就是不经用

