感觉DS V4 Flash(API调用)在不开完全思考的情况下,续写小说文章会胡言乱语
- 内容介绍
- 文章标签
- 相关推荐
如图,今天用Kelivo的最新版(1.1.12,支持了DS4新参数的版本)用DS V4 Flash的模型续写一篇文章,前面都是使用Grok生成的,后面我切换为DS4 Flash进行续写,结果就是胡言乱语了
image1200×1067 185 KB
但是只要我开了轻微的思考,Kelivo显示只思考了3s,吐字还是很快的,续写内容就变得正常了(内容不方便放出)
这算是DS4的bug吗?
网友解答:--【壹】--:
我从不用deepseek写小说,要写小说也是用别的,flash这种低成本的比较适合用来网页翻译,一直都是这么做的,1是快,2是廉价不心疼3是随手可得一堆key
--【贰】--:
大概多少上下文了?可以重新生成一下看看是不是 Bug
--【叁】--:
我算了算,上下文加起来是92,024tokens,V4 Flash是1M吧,不到10%,并且我重新生成过了,发现只要完全不思考就是胡言乱语,思考了就不会胡言乱语
--【肆】--:
开思考的话,模型可能第一次收到你的prompt会自己抽取关键词和任务指令当做下一次续写tool call的任务关键词来复用,保证自己的指令遵循。如果不开思考的话可能就是靠聊天harness的应用层做一些纯工程化关键词提取,你的文章内容这个时候可能会和prompt杂糅在一起,模型就幻觉了
--【伍】--:
隐隐约约地可以看出是我设置的系统提示词,比如“确保输出首开事判之后只续受写内”,就是我提示词要求的“从第一句话直接进入故事”、“后续用户的输入都作为续写要求”
--【陆】--:
补充一点,前几天api也上了v4 lite内测后,有人就弃用deepseek了,酒馆里不好用
--【柒】--:
kelivo是啥?搜出来是一个聊天LLM客户端,可以用来写小说
--【捌】--:
不知道为什么 胡言乱语 但又隐约能看出点什么逻辑 抽象
如图,今天用Kelivo的最新版(1.1.12,支持了DS4新参数的版本)用DS V4 Flash的模型续写一篇文章,前面都是使用Grok生成的,后面我切换为DS4 Flash进行续写,结果就是胡言乱语了
image1200×1067 185 KB
但是只要我开了轻微的思考,Kelivo显示只思考了3s,吐字还是很快的,续写内容就变得正常了(内容不方便放出)
这算是DS4的bug吗?
网友解答:--【壹】--:
我从不用deepseek写小说,要写小说也是用别的,flash这种低成本的比较适合用来网页翻译,一直都是这么做的,1是快,2是廉价不心疼3是随手可得一堆key
--【贰】--:
大概多少上下文了?可以重新生成一下看看是不是 Bug
--【叁】--:
我算了算,上下文加起来是92,024tokens,V4 Flash是1M吧,不到10%,并且我重新生成过了,发现只要完全不思考就是胡言乱语,思考了就不会胡言乱语
--【肆】--:
开思考的话,模型可能第一次收到你的prompt会自己抽取关键词和任务指令当做下一次续写tool call的任务关键词来复用,保证自己的指令遵循。如果不开思考的话可能就是靠聊天harness的应用层做一些纯工程化关键词提取,你的文章内容这个时候可能会和prompt杂糅在一起,模型就幻觉了
--【伍】--:
隐隐约约地可以看出是我设置的系统提示词,比如“确保输出首开事判之后只续受写内”,就是我提示词要求的“从第一句话直接进入故事”、“后续用户的输入都作为续写要求”
--【陆】--:
补充一点,前几天api也上了v4 lite内测后,有人就弃用deepseek了,酒馆里不好用
--【柒】--:
kelivo是啥?搜出来是一个聊天LLM客户端,可以用来写小说
--【捌】--:
不知道为什么 胡言乱语 但又隐约能看出点什么逻辑 抽象

