从Claude Code泄漏的代码来看,是否可以认为Claude其实也对自家模型也没啥信心?

2026-04-11 12:170阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

Claude Code中复杂且巧妙的提示词工程可谓非常多。
那么可否认为头部企业对自家的顶级模型也没啥特别好的办法?
为了可靠性,也只能弄出非常繁杂的提示词工程?
现阶段的LLM果然就这水平了?

网友解答:
--【壹】--:

不是没有信心,而是LLM就这么个玩意儿,不管吹的多牛逼,这玩意儿的幻觉就是控制不住的


--【贰】--:

提示词工程是必要的,


--【叁】--:

提示词像是思想钢印的启动咒语


--【肆】--:

其实从最近的风向(从力大砖飞堆参数和算力,到强调系统工程),就能看出边际递减效应已经很明显了。


--【伍】--:

確實,高質量數據不夠,整天整出一些新概念,也只能整整一些新詞了


--【陆】--:

顶级模型也需要顶级的使用方法撒,提示词就相当于使用手册把。我是这么理解的。


--【柒】--:

有信心,但不完全有,巫术太多了。
况且还不止是提示词。


--【捌】--:

能,但是实现某一任务的提示词工程显然有些过于复杂了,而且某些玄妙的机制,在Claude Code泄漏前,我们对此一知半解,甚至一无所知,这就很糟糕了。
“so,我的提示词,真的发挥作用了吗?”
“嗯?我的提示词为什么工作了?是这个效果吗?”


--【玖】--:

大模型的泛化和传统机器学习模型没差,都是在什么上面训练,在什么上面预测效果就好。复杂的提示词不一定说明是纯后期的prompt调优,人家可是自家模型的harness,肯定是知道模型在什么数据分布和上下文构造上训练的。只能说claude的训练针对这种格式的agent工作流调优已经做得很充分了,再加上现在CC这么大量使用转起来的数据飞轮,用现有的这种提示词结构的效果只会更好。

阅读全文
问题描述:

Claude Code中复杂且巧妙的提示词工程可谓非常多。
那么可否认为头部企业对自家的顶级模型也没啥特别好的办法?
为了可靠性,也只能弄出非常繁杂的提示词工程?
现阶段的LLM果然就这水平了?

网友解答:
--【壹】--:

不是没有信心,而是LLM就这么个玩意儿,不管吹的多牛逼,这玩意儿的幻觉就是控制不住的


--【贰】--:

提示词工程是必要的,


--【叁】--:

提示词像是思想钢印的启动咒语


--【肆】--:

其实从最近的风向(从力大砖飞堆参数和算力,到强调系统工程),就能看出边际递减效应已经很明显了。


--【伍】--:

確實,高質量數據不夠,整天整出一些新概念,也只能整整一些新詞了


--【陆】--:

顶级模型也需要顶级的使用方法撒,提示词就相当于使用手册把。我是这么理解的。


--【柒】--:

有信心,但不完全有,巫术太多了。
况且还不止是提示词。


--【捌】--:

能,但是实现某一任务的提示词工程显然有些过于复杂了,而且某些玄妙的机制,在Claude Code泄漏前,我们对此一知半解,甚至一无所知,这就很糟糕了。
“so,我的提示词,真的发挥作用了吗?”
“嗯?我的提示词为什么工作了?是这个效果吗?”


--【玖】--:

大模型的泛化和传统机器学习模型没差,都是在什么上面训练,在什么上面预测效果就好。复杂的提示词不一定说明是纯后期的prompt调优,人家可是自家模型的harness,肯定是知道模型在什么数据分布和上下文构造上训练的。只能说claude的训练针对这种格式的agent工作流调优已经做得很充分了,再加上现在CC这么大量使用转起来的数据飞轮,用现有的这种提示词结构的效果只会更好。

阅读全文