用deepseek v4lite的2api来测试,让我感觉是在用gpt3.5,幻觉严重,不遵循指令

2026-04-11 14:461阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

增加一点总结吧,目前普遍倾向于是2api的问题,而不是模型本身问题导致其实际表现极差,等官方api出来再看,我对这1M上下文抱了极大的期待.

我想试试deepseek v4 lite的能力,用了论坛的deepseek的2api部署了一下,将其接入龙虾,刚测试第一条就下不去了,伪造信息过于严重.直接看图吧,openclaw有grok-search的这个技能的,并且已经在memory.md内明确写了如何使用这个技能,其他的所有api包括2api的ai都能正确使用,唯独deepseek v4lite的deepseek chat不行,我已经通过问询确认它上下文1M,知识库到2025年5月的v4lite.它多次伪造信息,如下图,这种情况怎么解,是我使用姿势太差了么:
image1738×1482 431 KB
image1740×1480 436 KB
image1722×1396 374 KB

多次执行后我已经完全失去了测试的信心,换用了其他的2api项目,全部一次成功,后来使用了kimi,minimax,claude都是没问题的.这是因为用2api的问题么?我使用的是论坛内老友的这个项目来2api.

github.com

GitHub - CJackHwang/ds2api: Deepseek客户端对话转API,高性能,多账号轮询,包含完整后台管理系统,支持纯vercel、d...

Deepseek客户端对话转API,高性能,多账号轮询,包含完整后台管理系统,支持纯vercel、docker部署使用,支持toolcall。兼容Opencode,Kilocode,Roocode,Claudecode等工具

网友解答:
--【壹】--:

很多2api都会有工具调用的问题,毕竟是从网页对话2出来的


--【贰】--:

image1167×863 163 KB
很奇怪的行为, 思维连说要调用工具, 输出却直接报告任务完成


--【叁】--:

2api现在只能用来当玩具还是定官方api吧


--【肆】--:

这个项目只能用来聊天 工具调用别想了


--【伍】--:

不用测试了这个项目根本不行 cc roo code根本用不了 工具根本没办法调用


--【陆】--:

也就是这个2api项目的原因是吧,现在这个让我感觉实在太差了,不符合目前的网上反映的表现,再差也不能降级到这种程度啊.


--【柒】--:

web 端会自带系统提示。


--【捌】--:

嗯,目前确实无法使用,2api表现太差,改了标题,防止变抹黑了


--【玖】--:

是的,现在应该是工具调用有问题,不建议用ds2api来测。
但只看直接对话能力还是很强的


--【拾】--:

应该是2API的问题


--【拾壹】--:

?你确定你灰度到了吗
现在基本都没有吧


--【拾贰】--:

踢一脚,新版本对上下文做了优化后应该不至于这么离谱了,感觉更接近真实水平了


--【拾叁】--:

早上网页这一版和老年痴呆了一样,靠了,DeepSeek要是拉了,国内其他的就没戏了


--【拾肆】--:

只能说通过询问获取,问询上下文和知识库,它的回答符合灰度到的情况


--【拾伍】--:

image840×851 53.9 KB
直接写前端 代码效果并不差


--【拾陆】--:

这个2api原理就是提示词注入然后提取json,我也用相似的原理试了一下,看思维链,发现ds4lite会倾向于整个完全重新思考,glm5会真的当作是工具调用,马上返回结果。之前还看到有佬友说现在灰度模型打开联网搜索后联网倾向挺差的,可能工具调用相关根本没训练(不懂)?


--【拾柒】--:

用2api去测本来就很容易出现工具调用的大大小小的问题吧,还是等官方API上线了测呢