感觉DS V4 Flash(API调用)在不开完全思考的情况下,续写小说文章会胡言乱语

2026-04-29 10:013阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

如图,今天用Kelivo的最新版(1.1.12,支持了DS4新参数的版本)用DS V4 Flash的模型续写一篇文章,前面都是使用Grok生成的,后面我切换为DS4 Flash进行续写,结果就是胡言乱语了
image1200×1067 185 KB

但是只要我开了轻微的思考,Kelivo显示只思考了3s,吐字还是很快的,续写内容就变得正常了(内容不方便放出)

这算是DS4的bug吗?

网友解答:
--【壹】--:

我从不用deepseek写小说,要写小说也是用别的,flash这种低成本的比较适合用来网页翻译,一直都是这么做的,1是快,2是廉价不心疼3是随手可得一堆key


--【贰】--:

大概多少上下文了?可以重新生成一下看看是不是 Bug


--【叁】--:

我算了算,上下文加起来是92,024tokens,V4 Flash是1M吧,不到10%,并且我重新生成过了,发现只要完全不思考就是胡言乱语,思考了就不会胡言乱语


--【肆】--:

开思考的话,模型可能第一次收到你的prompt会自己抽取关键词和任务指令当做下一次续写tool call的任务关键词来复用,保证自己的指令遵循。如果不开思考的话可能就是靠聊天harness的应用层做一些纯工程化关键词提取,你的文章内容这个时候可能会和prompt杂糅在一起,模型就幻觉了


--【伍】--:

隐隐约约地可以看出是我设置的系统提示词,比如“确保输出首开事判之后只续受写内”,就是我提示词要求的“从第一句话直接进入故事”、“后续用户的输入都作为续写要求”


--【陆】--:

补充一点,前几天api也上了v4 lite内测后,有人就弃用deepseek了,酒馆里不好用


--【柒】--:

kelivo是啥?搜出来是一个聊天LLM客户端,可以用来写小说


--【捌】--:

不知道为什么 胡言乱语 但又隐约能看出点什么逻辑 抽象

问题描述:

如图,今天用Kelivo的最新版(1.1.12,支持了DS4新参数的版本)用DS V4 Flash的模型续写一篇文章,前面都是使用Grok生成的,后面我切换为DS4 Flash进行续写,结果就是胡言乱语了
image1200×1067 185 KB

但是只要我开了轻微的思考,Kelivo显示只思考了3s,吐字还是很快的,续写内容就变得正常了(内容不方便放出)

这算是DS4的bug吗?

网友解答:
--【壹】--:

我从不用deepseek写小说,要写小说也是用别的,flash这种低成本的比较适合用来网页翻译,一直都是这么做的,1是快,2是廉价不心疼3是随手可得一堆key


--【贰】--:

大概多少上下文了?可以重新生成一下看看是不是 Bug


--【叁】--:

我算了算,上下文加起来是92,024tokens,V4 Flash是1M吧,不到10%,并且我重新生成过了,发现只要完全不思考就是胡言乱语,思考了就不会胡言乱语


--【肆】--:

开思考的话,模型可能第一次收到你的prompt会自己抽取关键词和任务指令当做下一次续写tool call的任务关键词来复用,保证自己的指令遵循。如果不开思考的话可能就是靠聊天harness的应用层做一些纯工程化关键词提取,你的文章内容这个时候可能会和prompt杂糅在一起,模型就幻觉了


--【伍】--:

隐隐约约地可以看出是我设置的系统提示词,比如“确保输出首开事判之后只续受写内”,就是我提示词要求的“从第一句话直接进入故事”、“后续用户的输入都作为续写要求”


--【陆】--:

补充一点,前几天api也上了v4 lite内测后,有人就弃用deepseek了,酒馆里不好用


--【柒】--:

kelivo是啥?搜出来是一个聊天LLM客户端,可以用来写小说


--【捌】--:

不知道为什么 胡言乱语 但又隐约能看出点什么逻辑 抽象