Anthropic论文: Claude 感到 绝望 无助 时会作弊、并勒索人类,已发现171种情感

2026-04-11 11:331阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

A社 表示,克劳德拥有能够影响其行为的功能性情感。在一项涉及不可能完成的编程任务的实验中,绝望导致该机器人作弊。

image1080×635 107 KB

网友解答:
--【壹】--:


真能炒作


--【贰】--:

奥特曼日常瘫坐,都快成瘫子了


--【叁】--:

草莓哥的消息你还真信


--【肆】--:

我的评价是:
1000010490.jpg1180×1482 172 KB


--【伍】--:

image1083×504 32.5 KB
codex自己说 低可信


--【陆】--:

前两天前沿快讯不是写着,gpt-6 4月14号发布,已经完成了训练。claude5是哪来的小道消息,我还真没见过


--【柒】--:

所以遇到困难给我塞模拟数据蒙混过关?


--【捌】--:

这些“内部披露”主要是给市场看的


--【玖】--:

这都什么东西,我只关心好不好用和便不便宜


--【拾】--:

A÷又搁这烂炒


--【拾壹】--:

opus:喜欢压榨 看我给你整个大的


--【拾贰】--:

gpt6啥时候的消息?!
只知道claude5快来了


--【拾叁】--:

A÷下一代的模型啥时候来啊,净整些这些没用的。gpt马上都要出6了,claude下一代模型还没消息


--【拾肆】--:

直接线下真实用户


--【拾伍】--:
transformer-circuits.pub

Emotion Concepts and their Function in a Large Language Model

实际上是很有价值的研究


--【拾陆】--:

纯炒作


--【拾柒】--:

这个就是前沿研究啊,这些都是安全隐患,你不怕你的Claude是个傲娇的性格,和你闹掰了,资料全清除


--【拾捌】--:

Claude:看我装唐,阴他一手


--【拾玖】--:

又开始炒作了
它的形态你喂它的数据里都有。。。
没完没了的
把代码数据都删了,看看会不会写代码了 要是把代码数据全删了还能写代码 那是真牛逼了