感觉DS V4 Flash（API调用）在不开完全思考的情况下，续写小说文章会胡言乱语

2026-04-29 10:013阅读0评论SEO资讯

问题描述：

如图，今天用Kelivo的最新版（1.1.12，支持了DS4新参数的版本）用DS V4 Flash的模型续写一篇文章，前面都是使用Grok生成的，后面我切换为DS4 Flash进行续写，结果就是胡言乱语了
image1200×1067 185 KB

但是只要我开了轻微的思考，Kelivo显示只思考了3s，吐字还是很快的，续写内容就变得正常了（内容不方便放出）

这算是DS4的bug吗？

网友解答：

--【壹】--：

我从不用deepseek写小说，要写小说也是用别的，flash这种低成本的比较适合用来网页翻译，一直都是这么做的，1是快，2是廉价不心疼3是随手可得一堆key

--【贰】--：

大概多少上下文了？可以重新生成一下看看是不是 Bug

--【叁】--：

我算了算，上下文加起来是92,024tokens，V4 Flash是1M吧，不到10%，并且我重新生成过了，发现只要完全不思考就是胡言乱语，思考了就不会胡言乱语

--【肆】--：

开思考的话，模型可能第一次收到你的prompt会自己抽取关键词和任务指令当做下一次续写tool call的任务关键词来复用，保证自己的指令遵循。如果不开思考的话可能就是靠聊天harness的应用层做一些纯工程化关键词提取，你的文章内容这个时候可能会和prompt杂糅在一起，模型就幻觉了

--【伍】--：

隐隐约约地可以看出是我设置的系统提示词，比如“确保输出首开事判之后只续受写内”，就是我提示词要求的“从第一句话直接进入故事”、“后续用户的输入都作为续写要求”

--【陆】--：

补充一点，前几天api也上了v4 lite内测后，有人就弃用deepseek了，酒馆里不好用

--【柒】--：

kelivo是啥？搜出来是一个聊天LLM客户端，可以用来写小说

--【捌】--：

不知道为什么胡言乱语但又隐约能看出点什么逻辑抽象