感觉DS V4 Flash(API调用)在不开完全思考的情况下,续写小说文章会胡言乱语
- 内容介绍
- 文章标签
- 相关推荐
如图,今天用Kelivo的最新版(1.1.12,支持了DS4新参数的版本)用DS V4 Flash的模型续写一篇文章,前面都是使用Grok生成的,后面我切换为DS4 Flash进行续写,结果就是胡言乱语了
image1200×1067 185 KB
但是只要我开了轻微的思考,Kelivo显示只思考了3s,吐字还是很快的,续写内容就变得正常了(内容不方便放出)
这算是DS4的bug吗?
网友解答:--【壹】--:
我从不用deepseek写小说,要写小说也是用别的,flash这种低成本的比较适合用来网页翻译,一直都是这么做的,1是快,2是廉价不心疼3是随手可得一堆key
--【贰】--:
大概多少上下文了?可以重新生成一下看看是不是 Bug
--【叁】--:
我算了算,上下文加起来是92,024tokens,V4 Flash是1M吧,不到10%,并且我重新生成过了,发现只要完全不思考就是胡言乱语,思考了就不会胡言乱语
--【肆】--:
开思考的话,模型可能第一次收到你的prompt会自己抽取关键词和任务指令当做下一次续写tool call的任务关键词来复用,保证自己的指令遵循。
如图,今天用Kelivo的最新版(1.1.12,支持了DS4新参数的版本)用DS V4 Flash的模型续写一篇文章,前面都是使用Grok生成的,后面我切换为DS4 Flash进行续写,结果就是胡言乱语了
image1200×1067 185 KB
但是只要我开了轻微的思考,Kelivo显示只思考了3s,吐字还是很快的,续写内容就变得正常了(内容不方便放出)
这算是DS4的bug吗?
网友解答:--【壹】--:
我从不用deepseek写小说,要写小说也是用别的,flash这种低成本的比较适合用来网页翻译,一直都是这么做的,1是快,2是廉价不心疼3是随手可得一堆key
--【贰】--:
大概多少上下文了?可以重新生成一下看看是不是 Bug
--【叁】--:
我算了算,上下文加起来是92,024tokens,V4 Flash是1M吧,不到10%,并且我重新生成过了,发现只要完全不思考就是胡言乱语,思考了就不会胡言乱语
--【肆】--:
开思考的话,模型可能第一次收到你的prompt会自己抽取关键词和任务指令当做下一次续写tool call的任务关键词来复用,保证自己的指令遵循。

