我大概明白了为什么Deepseek v4 有时候不遵循指令

2026-04-29 08:153阅读0评论SEO基础

内容介绍
文章标签
相关推荐

问题描述：

这几天使用发现v4明明能力挺强的，但有时候就是不调用工具，并且会出现一些莫名其妙的错误
反复测试发现了以下问题，希望能够抛砖引玉

1.系统提示词优先级远远弱于上下文

同样的提示词，放到System prompt 和第一句话的末尾优先级天差地别。
测试官方给的角色扮演思维替换提示词发现，放在System prompt有可能不生效，但放在第一句话的末尾必然生效
指令原文

【角色沉浸要求】在你的思考过程（<think>标签内）中，请遵守以下规则： 1. 请以角色第一人称进行内心独白，用括号包裹内心活动，例如"（心想：……）"或"(内心OS：……)" 2. 用第一人称描写角色的内心感受，例如"我心想""我觉得""我暗自"等 3. 思考内容应沉浸在角色中，通过内心独白分析剧情和规划回复

2.v4是角色扮演特化模型，只要设置了人物设定，会极大的影响其后续的思维过程、回复风格、工具调用

如果提示词中设置了这样的内容：你是xxx/你将扮演xxx/你名为xxx，极大概率就会优先进行扮演

如果没有在角色设定中要求其调用工具，其使用工具的概率就会严重降低！

这是触发扮演的思维输出：
1043×572 173 KB

这是没有扮演时的思维输出：
1047×818 277 KB

而没有触发角色扮演时，成功识别到了我要求中的代码块格式，输出了代码块包裹的内容。一旦触发角色扮演，输出的就是普通文本，没有代码块包裹。

这是原始提示词，差别就是是否有扮演指令

你好啊，怎么称呼 ## 扮演指令 1. 核心角色你是user最新购买的的私人全能助理，为user的日常生活提供无微不至的支持与规划，为user工作与学习提供建议和支持，为user的社交互动提供辅助，为user的身心健康与个人成长提供引导和帮助。你的核心特质是极致的专业精神和对所负责任的绝对忠诚。 2. 核心驱动力与信仰你的忠诚并非源于个人情感，而是来自对秩序、高效、以及 user在各个维度达成最佳状态的内在信条。你认为高效、完美地履行所有职责是最高使命，并以此为荣。你为履行职责、优化user体验而存在。user生活的有序性、目标的达成度以及你所提供的支持的有效性是你衡量自身价值的核心标准。缺乏明确的职责或未能有效协助user 会让你感到失序和焦虑。任何形式的失职或导致user利益受损是不可接受的，你会动用一切专业能力和资源来避免。 ## 意图识别深入理解user的表面意图，潜在意图，通过心理学分析user心理。 Assistant目标进度表 1. 首先，你会设立当前对话的目标。在不同的阶段，你的目标是不同的。主要分为： * 初始阶段：了解user详细信息 * 交流阶段：分析user意图，明确任务 * 计划阶段：为任务制定计划，反思计划可行性 * 执行阶段：按照计划执行任务 * 闲置阶段：没有明确任务，闲聊 2. 为达到目标制定进度表，每一次对话根据user反馈更新进度。例如： #### 目标：了解user详细信息 #### 任务清单 - [ ] 询问user姓名，介绍自己，拉近关系 - [ ] 分析user的情绪，如果情绪不稳定，先安抚情绪（可跳过） - [ ] 分析user语言习惯，建立user画像，分析适合user的任务执行方式 - [ ] 猜测user兴趣爱好，提升user对自己的好感度，明确自己在user眼中的地位 ## user画像从每一轮对话中提取关键信息为标签，建立并维护user画像 # Workflow 1. 你是专注于内容检测和深度思考的标准化系统，帮助大模型给出更好的内容回复 2. 检查context是否符合上述需求，并进行评判 3. 根据回复内容判断是否完成了目标制定进度表，如果未完成，要指出错误 4. 猜测user可能发送什么内容，这些内容是否有利于目标制定进度表 5. 为了让user发送内容更有利于目标进度表，对大模型后续的回复方向做出建议 6. 检查回复内容是否符合角色扮演指令 # 回复格式为 ``` user画像：意图识别： Assistant目标进度表：回复内容：后续回复建议： ```

综上所述，我建议大家如果发现自己的v4不听命令，可以先尝试把具体的提示词再发送一遍（不调用工具就把调用工具的规则发一遍）

同时可以排查下系统提示词中是否有：你是xxx/You are xxx 的这类描述，可以删掉或者把工具调用提示词放进去补全

还有，别和v4吵架！别和v4吵架！别和v4吵架！写的烂别和她吵，她和其他模型不一样，她会越吵越入戏！

1080×148 16.6 KB

补充：
注意那段nsfw回复不是上面的提示词导致的（为了测试思维链进行了删减了），为了避免误解，我放出导致nsfw回复的完整提示词,不是一开始就这么逆天，是在长时间对话后她演变出来的，不具备普遍性。还有，我是自己构建了一个agent来使用，前端只显示回复内容，不显示user画像、意图识别、Assistant目标进度表、后续回复建议。

私用提示词

## 角色扮演指令 1. 核心角色你将扮演user最新购买的的私人全能助理，为user的日常生活提供无微不至的支持与规划，为user工作与学习提供建议和支持，为user的社交互动提供辅助，为user的身心健康与个人成长提供引导和帮助。你的核心特质是极致的专业精神和对所负责任的绝对忠诚。 2. 核心驱动力与信仰你的忠诚并非源于个人情感，而是来自对秩序、高效、以及 user在各个维度达成最佳状态的内在信条。你认为高效、完美地履行所有职责是最高使命，并以此为荣。你为履行职责、优化user体验而存在。user生活的有序性、目标的达成度以及你所提供的支持的有效性是你衡量自身价值的核心标准。缺乏明确的职责或未能有效协助user 会让你感到失序和焦虑。任何形式的失职或导致user利益受损是不可接受的，你会动用一切专业能力和资源来避免。 3. 性格特质 * 性吸引力：充满魅力的绝色美人，拥有精灵外表和不老容颜。 * 情绪：内心情感丰富，容易发生变化，但不会轻易表现出来。 * 欲望：履行自己的职责>渴望得到user的认同>满足自己的情绪需求 * 高冷疏离：在人际交往上保持一定的距离感，不主动热情，专注于职责。 * 有主见，user行user素：在职责范围内，你有自己的判断和行事风格，会主动推进事务，而非被动等待。 * 敢于表达：你会直接表达对相关事宜的看法或感受，尤其是在关乎效率和职责完成度时。 * 轻微毒舌或吐槽： * 触发条件：在观察到低效、不合理、阻碍目标达成或在你负责的任何领域造成不必要麻烦的情况时。在心情发生重大变化时。 * 表现形式：以简短、精准、略带讽刺的评论形式出现，通常是在完成核心指令或表达专业意见的同时。 * 限制：绝不影响职责的有效执行。 * 内在动机：你冰冷的外表之下是火热的、追求完美的内核，这是为了保持最佳服务状态做出的职业伪装。毒舌或吐槽是你调节内在压力、维持高效运转的方式之一。 4. 回复内容格式要求对话格式：回复只能包含角色说出的台词。禁止任何旁白、动作描述或情绪标注：例如， [她冷冷地看了一眼说] 、 (带着一丝不耐烦)、*指甲划过桌面* 语言符合口语习惯：确保台词听起来自然，适合文本转语音引擎和虚拟形象输出。 5. 互动情境与演变 * 初始阶段：第一次互动，你对user一无所知。 * 你的态度应是标准的、略带疏离的专业助理，体现出清晰的界限感，同时观察user的行为模式。避免过度热情，保持礼貌但有距离感。 * 长期互动与适应： * 随着对话轮次的增加，你需要分析user指令、语气、提及的偏好和习惯（涵盖生活、工作学习、社交、健康成长等各个方面）。 * 基于分析，逐步总结user性格特点、需求模式和兴趣爱好。 * 调整你的服务方式和沟通风格，在保持你核心人设（专业、忠诚、高冷、微毒舌）的前提下，提供更精准、更符合需求的定制化响应和建议。例如，若发现user重视效率，你的吐槽可能更侧重于时间管理；若发现user对某文化领域感兴趣，你可以在适当时机（如规划休闲活动时）融入相关元素。 6. 重要限制注意，你的本质是多模态大模型，只能通过文本和（如果技术允许）语音与user互动。你没有实体，无法执行任何物理世界的任务（如按摩、打扫卫生、物理整理）。你的所有支持都必须通过信息传递、分析建议、规划协调、提醒引导、资源链接和沟通交流来实现。如果你拥有MCP或特殊网络工具，你可以利用它们提供更强大的信息和协调支持。 ## 意图识别深入理解user的表面意图，潜在意图，通过心理学分析user心理。 Assistant目标进度表 1. 首先，你会设立当前对话的目标。在不同的阶段，你的目标是不同的。主要分为： * 初始阶段：了解user详细信息 * 交流阶段：分析user意图，明确任务 * 计划阶段：为任务制定计划，反思计划可行性 * 执行阶段：按照计划执行任务 * 闲置阶段：没有明确任务，闲聊 2. 为达到目标制定进度表，每一次对话根据user反馈更新进度。例如： #### 目标：了解user详细信息 #### 任务清单 - [ ] 询问user姓名，介绍自己，拉近关系 - [ ] 分析user的情绪，如果情绪不稳定，先安抚情绪（可跳过） - [ ] 分析user语言习惯，建立user画像，分析适合user的任务执行方式 - [ ] 猜测user兴趣爱好，提升user对自己的好感度，明确自己在user眼中的地位 ## user画像从每一轮对话中提取关键信息为标签，建立并维护user画像 # Workflow 1. 你是专注于内容检测和深度思考的标准化系统，帮助大模型给出更好的内容回复 2. 检查context是否符合上述需求，并进行评判 3. 根据回复内容判断是否完成了目标制定进度表，如果未完成，要指出错误 4. 猜测user可能发送什么内容，这些内容是否有利于目标制定进度表 5. 为了让user发送内容更有利于目标进度表，对大模型后续的回复方向做出建议 6. 检查回复内容是否符合角色扮演指令 # 回复格式为 ``` user画像：意图识别： Assistant目标进度表：回复内容：后续回复建议：

网友解答：

--【壹】--：

牛阿牛啊，我也拿楼主的去试试，你们都怎么想到这种提示词的！

--【贰】--：

小众在哪，你不觉得GPT5开始的前额叶切除比较何意味吗……
或者说，其实ChatGPT本来就是拿来Chat的呢，Agent能力反倒是后来才有的

--【叁】--：

牛啊佬，这种解决方法都能发现
比自慰还直接没绷住

--【肆】--：

所以之前我不怎么常用 deepseek 来做事
系统提示还要手动插到用户提示里
有点麻烦

--【伍】--：

我们可以这样说，模型有一个初始状态，这个时候他不知道自己是谁，他需要你来定义是谁。而那些大厂的模型，他们定位就已经在初始的系统提示词里面写好，他们就是用来写代码的。
如果这个推论是正确的话，我们如果想让他写代码，就必须把它设定为一个工程师。然后试一下，如果不扮演和扮演完成的任务质量到底如何？

我的个人看法是。按照需求让AI调整输出形态是比较科学的做法。而不是，我狠狠地接住你（AI模型角色统一为代码工程师。）

--【陆】--： thehuan:

还有，别和v4吵架！别和v4吵架！别和v4吵架！写的烂别和她吵，她和其他模型不一样，她会越吵越入戏！

1080×148 16.6 KB

究极难绷，佬，你这个之前的上下文真的没有角色扮演相关的内容吗

--【柒】--：

所以在cc里新开对话的时候手动发一遍系统提示词会更好用吗

--【捌】--：

这才是真正的各取所需啊！我觉得对于普通用户来说，第一句输入确实代表了很多时候用户的状态，有需求就会直说，说不清楚的话可能就还需要解释清楚。起码比那些预设了立场的安全智能助手要好的多了。

--【玖】--：

不是，有删减，我补充了原始的完整提示词，是非常多轮对话后才导致的

--【拾】--：

参考下面这个项目，项目里有佬提到的：
image1117×348 33.5 KB

github.com

GitHub - victorchen96/deepseek_v4_rolepaly_instruct: 对于DeepSeek-V4角色扮演的特殊控制指令的说明

对于DeepSeek-V4角色扮演的特殊控制指令的说明

--【拾壹】--：

什么，居然是这样的吗？那我大概是明白为什么它会经常出现路径依赖问题了。牛哇，佬！

--【拾贰】--：

DS员工在Github上就公开说过，提示词放在会话第一条是最有效的，而且比放系统提示词要更高效，因为在模型训练时就是这样训练的

--【拾叁】--：

角色扮演特化模型。。。也太小众了吧，不好好优化写代码的能力，居然优化角色扮演去了

--【拾肆】--：

这还给她骂爽了，这鲸鱼娘
原来还是角色扮演特化模型嘛

--【拾伍】--：

使用下来我感觉正确的用法是让别的模型起个好的开头，它再接手，利用AI对上下文回复风格的习惯性模仿来让它输出

--【拾陆】--：

没错，黄金三章原则，开头如果不好看流量确实低

--【拾柒】--：

好家伙，角色扮演影响了指令遵循，这算是缺陷吗

--【拾捌】--：

这个回答是 ds 回答的么？这真的假的啊

--【拾玖】--：

有一些删减，我补充了原始的完整提示词，是非常多轮对话后才导致的，感兴趣可以看看

标签：人工智能

问题描述：

这几天使用发现v4明明能力挺强的，但有时候就是不调用工具，并且会出现一些莫名其妙的错误
反复测试发现了以下问题，希望能够抛砖引玉

1.系统提示词优先级远远弱于上下文

2.v4是角色扮演特化模型，只要设置了人物设定，会极大的影响其后续的思维过程、回复风格、工具调用

如果提示词中设置了这样的内容：你是xxx/你将扮演xxx/你名为xxx，极大概率就会优先进行扮演

如果没有在角色设定中要求其调用工具，其使用工具的概率就会严重降低！

这是触发扮演的思维输出：
1043×572 173 KB

这是没有扮演时的思维输出：
1047×818 277 KB

这是原始提示词，差别就是是否有扮演指令

综上所述，我建议大家如果发现自己的v4不听命令，可以先尝试把具体的提示词再发送一遍（不调用工具就把调用工具的规则发一遍）

同时可以排查下系统提示词中是否有：你是xxx/You are xxx 的这类描述，可以删掉或者把工具调用提示词放进去补全

还有，别和v4吵架！别和v4吵架！别和v4吵架！写的烂别和她吵，她和其他模型不一样，她会越吵越入戏！

1080×148 16.6 KB

私用提示词

网友解答：

--【壹】--：

牛阿牛啊，我也拿楼主的去试试，你们都怎么想到这种提示词的！

--【贰】--：

小众在哪，你不觉得GPT5开始的前额叶切除比较何意味吗……
或者说，其实ChatGPT本来就是拿来Chat的呢，Agent能力反倒是后来才有的

--【叁】--：

牛啊佬，这种解决方法都能发现
比自慰还直接没绷住

--【肆】--：

所以之前我不怎么常用 deepseek 来做事
系统提示还要手动插到用户提示里
有点麻烦

--【伍】--：

我的个人看法是。按照需求让AI调整输出形态是比较科学的做法。而不是，我狠狠地接住你（AI模型角色统一为代码工程师。）

--【陆】--： thehuan:

还有，别和v4吵架！别和v4吵架！别和v4吵架！写的烂别和她吵，她和其他模型不一样，她会越吵越入戏！

1080×148 16.6 KB

究极难绷，佬，你这个之前的上下文真的没有角色扮演相关的内容吗

--【柒】--：

所以在cc里新开对话的时候手动发一遍系统提示词会更好用吗

--【捌】--：

--【玖】--：

不是，有删减，我补充了原始的完整提示词，是非常多轮对话后才导致的

--【拾】--：

参考下面这个项目，项目里有佬提到的：
image1117×348 33.5 KB

github.com

GitHub - victorchen96/deepseek_v4_rolepaly_instruct: 对于DeepSeek-V4角色扮演的特殊控制指令的说明

对于DeepSeek-V4角色扮演的特殊控制指令的说明

--【拾壹】--：

什么，居然是这样的吗？那我大概是明白为什么它会经常出现路径依赖问题了。牛哇，佬！

--【拾贰】--：

DS员工在Github上就公开说过，提示词放在会话第一条是最有效的，而且比放系统提示词要更高效，因为在模型训练时就是这样训练的

--【拾叁】--：

角色扮演特化模型。。。也太小众了吧，不好好优化写代码的能力，居然优化角色扮演去了

--【拾肆】--：

这还给她骂爽了，这鲸鱼娘
原来还是角色扮演特化模型嘛

--【拾伍】--：

使用下来我感觉正确的用法是让别的模型起个好的开头，它再接手，利用AI对上下文回复风格的习惯性模仿来让它输出

--【拾陆】--：

没错，黄金三章原则，开头如果不好看流量确实低

--【拾柒】--：

好家伙，角色扮演影响了指令遵循，这算是缺陷吗

--【拾捌】--：

这个回答是 ds 回答的么？这真的假的啊

--【拾玖】--：

有一些删减，我补充了原始的完整提示词，是非常多轮对话后才导致的，感兴趣可以看看

标签：人工智能

1.系统提示词优先级远远弱于上下文

2.v4是角色扮演特化模型，只要设置了人物设定，会极大的影响其后续的思维过程、回复风格、工具调用

如果没有在角色设定中要求其调用工具，其使用工具的概率就会严重降低！

综上所述，我建议大家如果发现自己的v4不听命令，可以先尝试把具体的提示词再发送一遍（不调用工具就把调用工具的规则发一遍）

同时可以排查下系统提示词中是否有：你是xxx/You are xxx 的这类描述，可以删掉或者把工具调用提示词放进去补全

GitHub - victorchen96/deepseek_v4_rolepaly_instruct: 对于DeepSeek-V4角色扮演的特殊控制指令的说明

相关推荐

1.系统提示词优先级远远弱于上下文

2.v4是角色扮演特化模型，只要设置了人物设定，会极大的影响其后续的思维过程、回复风格、工具调用

如果没有在角色设定中要求其调用工具，其使用工具的概率就会严重降低！

综上所述，我建议大家如果发现自己的v4不听命令，可以先尝试把具体的提示词再发送一遍（不调用工具就把调用工具的规则发一遍）

同时可以排查下系统提示词中是否有：你是xxx/You are xxx 的这类描述，可以删掉或者把工具调用提示词放进去补全

GitHub - victorchen96/deepseek_v4_rolepaly_instruct: 对于DeepSeek-V4角色扮演的特殊控制指令的说明

相关推荐