从Claude Code泄漏的代码来看,是否可以认为Claude其实也对自家模型也没啥信心?
- 内容介绍
- 文章标签
- 相关推荐
Claude Code中复杂且巧妙的提示词工程可谓非常多。
那么可否认为头部企业对自家的顶级模型也没啥特别好的办法?
为了可靠性,也只能弄出非常繁杂的提示词工程?
现阶段的LLM果然就这水平了?
--【壹】--:
不是没有信心,而是LLM就这么个玩意儿,不管吹的多牛逼,这玩意儿的幻觉就是控制不住的
--【贰】--:
提示词工程是必要的,
--【叁】--:
提示词像是思想钢印的启动咒语
--【肆】--:
其实从最近的风向(从力大砖飞堆参数和算力,到强调系统工程),就能看出边际递减效应已经很明显了。
--【伍】--:
確實,高質量數據不夠,整天整出一些新概念,也只能整整一些新詞了
--【陆】--:
顶级模型也需要顶级的使用方法撒,提示词就相当于使用手册把。我是这么理解的。
--【柒】--:
有信心,但不完全有,巫术太多了。
况且还不止是提示词。
--【捌】--:
能,但是实现某一任务的提示词工程显然有些过于复杂了,而且某些玄妙的机制,在Claude Code泄漏前,我们对此一知半解,甚至一无所知,这就很糟糕了。
“so,我的提示词,真的发挥作用了吗?”
“嗯?我的提示词为什么工作了?是这个效果吗?”
--【玖】--:
大模型的泛化和传统机器学习模型没差,都是在什么上面训练,在什么上面预测效果就好。复杂的提示词不一定说明是纯后期的prompt调优,人家可是自家模型的harness,肯定是知道模型在什么数据分布和上下文构造上训练的。只能说claude的训练针对这种格式的agent工作流调优已经做得很充分了,再加上现在CC这么大量使用转起来的数据飞轮,用现有的这种提示词结构的效果只会更好。
Claude Code中复杂且巧妙的提示词工程可谓非常多。
那么可否认为头部企业对自家的顶级模型也没啥特别好的办法?
为了可靠性,也只能弄出非常繁杂的提示词工程?
现阶段的LLM果然就这水平了?
--【壹】--:
不是没有信心,而是LLM就这么个玩意儿,不管吹的多牛逼,这玩意儿的幻觉就是控制不住的
--【贰】--:
提示词工程是必要的,
--【叁】--:
提示词像是思想钢印的启动咒语
--【肆】--:
其实从最近的风向(从力大砖飞堆参数和算力,到强调系统工程),就能看出边际递减效应已经很明显了。
--【伍】--:
確實,高質量數據不夠,整天整出一些新概念,也只能整整一些新詞了
--【陆】--:
顶级模型也需要顶级的使用方法撒,提示词就相当于使用手册把。我是这么理解的。
--【柒】--:
有信心,但不完全有,巫术太多了。
况且还不止是提示词。
--【捌】--:
能,但是实现某一任务的提示词工程显然有些过于复杂了,而且某些玄妙的机制,在Claude Code泄漏前,我们对此一知半解,甚至一无所知,这就很糟糕了。
“so,我的提示词,真的发挥作用了吗?”
“嗯?我的提示词为什么工作了?是这个效果吗?”
--【玖】--:
大模型的泛化和传统机器学习模型没差,都是在什么上面训练,在什么上面预测效果就好。复杂的提示词不一定说明是纯后期的prompt调优,人家可是自家模型的harness,肯定是知道模型在什么数据分布和上下文构造上训练的。只能说claude的训练针对这种格式的agent工作流调优已经做得很充分了,再加上现在CC这么大量使用转起来的数据飞轮,用现有的这种提示词结构的效果只会更好。

