用deepseek v4lite的2api来测试,让我感觉是在用gpt3.5,幻觉严重,不遵循指令
- 内容介绍
- 文章标签
- 相关推荐
增加一点总结吧,目前普遍倾向于是2api的问题,而不是模型本身问题导致其实际表现极差,等官方api出来再看,我对这1M上下文抱了极大的期待.
我想试试deepseek v4 lite的能力,用了论坛的deepseek的2api部署了一下,将其接入龙虾,刚测试第一条就下不去了,伪造信息过于严重.直接看图吧,openclaw有grok-search的这个技能的,并且已经在memory.md内明确写了如何使用这个技能,其他的所有api包括2api的ai都能正确使用,唯独deepseek v4lite的deepseek chat不行,我已经通过问询确认它上下文1M,知识库到2025年5月的v4lite.它多次伪造信息,如下图,这种情况怎么解,是我使用姿势太差了么:
image1738×1482 431 KB
image1740×1480 436 KB
image1722×1396 374 KB
多次执行后我已经完全失去了测试的信心,换用了其他的2api项目,全部一次成功,后来使用了kimi,minimax,claude都是没问题的.这是因为用2api的问题么?我使用的是论坛内老友的这个项目来2api.
GitHub - CJackHwang/ds2api: Deepseek客户端对话转API,高性能,多账号轮询,包含完整后台管理系统,支持纯vercel、d...
Deepseek客户端对话转API,高性能,多账号轮询,包含完整后台管理系统,支持纯vercel、docker部署使用,支持toolcall。兼容Opencode,Kilocode,Roocode,Claudecode等工具
网友解答:--【壹】--:
很多2api都会有工具调用的问题,毕竟是从网页对话2出来的
--【贰】--:
image1167×863 163 KB
很奇怪的行为, 思维连说要调用工具, 输出却直接报告任务完成
--【叁】--:
2api现在只能用来当玩具还是定官方api吧
--【肆】--:
这个项目只能用来聊天 工具调用别想了
--【伍】--:
不用测试了这个项目根本不行 cc roo code根本用不了 工具根本没办法调用
--【陆】--:
也就是这个2api项目的原因是吧,现在这个让我感觉实在太差了,不符合目前的网上反映的表现,再差也不能降级到这种程度啊.
--【柒】--:
web 端会自带系统提示。
--【捌】--:
嗯,目前确实无法使用,2api表现太差,改了标题,防止变抹黑了
--【玖】--:
是的,现在应该是工具调用有问题,不建议用ds2api来测。
但只看直接对话能力还是很强的
--【拾】--:
应该是2API的问题
--【拾壹】--:
?你确定你灰度到了吗
现在基本都没有吧
--【拾贰】--:
踢一脚,新版本对上下文做了优化后应该不至于这么离谱了,感觉更接近真实水平了
--【拾叁】--:
早上网页这一版和老年痴呆了一样,靠了,DeepSeek要是拉了,国内其他的就没戏了
--【拾肆】--:
只能说通过询问获取,问询上下文和知识库,它的回答符合灰度到的情况
--【拾伍】--:
image840×851 53.9 KB
直接写前端 代码效果并不差
--【拾陆】--:
这个2api原理就是提示词注入然后提取json,我也用相似的原理试了一下,看思维链,发现ds4lite会倾向于整个完全重新思考,glm5会真的当作是工具调用,马上返回结果。之前还看到有佬友说现在灰度模型打开联网搜索后联网倾向挺差的,可能工具调用相关根本没训练(不懂)?
--【拾柒】--:
用2api去测本来就很容易出现工具调用的大大小小的问题吧,还是等官方API上线了测呢
增加一点总结吧,目前普遍倾向于是2api的问题,而不是模型本身问题导致其实际表现极差,等官方api出来再看,我对这1M上下文抱了极大的期待.
我想试试deepseek v4 lite的能力,用了论坛的deepseek的2api部署了一下,将其接入龙虾,刚测试第一条就下不去了,伪造信息过于严重.直接看图吧,openclaw有grok-search的这个技能的,并且已经在memory.md内明确写了如何使用这个技能,其他的所有api包括2api的ai都能正确使用,唯独deepseek v4lite的deepseek chat不行,我已经通过问询确认它上下文1M,知识库到2025年5月的v4lite.它多次伪造信息,如下图,这种情况怎么解,是我使用姿势太差了么:
image1738×1482 431 KB
image1740×1480 436 KB
image1722×1396 374 KB
多次执行后我已经完全失去了测试的信心,换用了其他的2api项目,全部一次成功,后来使用了kimi,minimax,claude都是没问题的.这是因为用2api的问题么?我使用的是论坛内老友的这个项目来2api.
GitHub - CJackHwang/ds2api: Deepseek客户端对话转API,高性能,多账号轮询,包含完整后台管理系统,支持纯vercel、d...
Deepseek客户端对话转API,高性能,多账号轮询,包含完整后台管理系统,支持纯vercel、docker部署使用,支持toolcall。兼容Opencode,Kilocode,Roocode,Claudecode等工具
网友解答:--【壹】--:
很多2api都会有工具调用的问题,毕竟是从网页对话2出来的
--【贰】--:
image1167×863 163 KB
很奇怪的行为, 思维连说要调用工具, 输出却直接报告任务完成
--【叁】--:
2api现在只能用来当玩具还是定官方api吧
--【肆】--:
这个项目只能用来聊天 工具调用别想了
--【伍】--:
不用测试了这个项目根本不行 cc roo code根本用不了 工具根本没办法调用
--【陆】--:
也就是这个2api项目的原因是吧,现在这个让我感觉实在太差了,不符合目前的网上反映的表现,再差也不能降级到这种程度啊.
--【柒】--:
web 端会自带系统提示。
--【捌】--:
嗯,目前确实无法使用,2api表现太差,改了标题,防止变抹黑了
--【玖】--:
是的,现在应该是工具调用有问题,不建议用ds2api来测。
但只看直接对话能力还是很强的
--【拾】--:
应该是2API的问题
--【拾壹】--:
?你确定你灰度到了吗
现在基本都没有吧
--【拾贰】--:
踢一脚,新版本对上下文做了优化后应该不至于这么离谱了,感觉更接近真实水平了
--【拾叁】--:
早上网页这一版和老年痴呆了一样,靠了,DeepSeek要是拉了,国内其他的就没戏了
--【拾肆】--:
只能说通过询问获取,问询上下文和知识库,它的回答符合灰度到的情况
--【拾伍】--:
image840×851 53.9 KB
直接写前端 代码效果并不差
--【拾陆】--:
这个2api原理就是提示词注入然后提取json,我也用相似的原理试了一下,看思维链,发现ds4lite会倾向于整个完全重新思考,glm5会真的当作是工具调用,马上返回结果。之前还看到有佬友说现在灰度模型打开联网搜索后联网倾向挺差的,可能工具调用相关根本没训练(不懂)?
--【拾柒】--:
用2api去测本来就很容易出现工具调用的大大小小的问题吧,还是等官方API上线了测呢

