deepseek v4捞针能100%,而且会尝试反问不懂的部分

2026-04-29 10:143阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

flash不开思考也能做到,我扔进去的时候一秒就出答案了我还在愣神呢,结果全对。看来这个上下文很不错,用flash做个知识库检索应该是非常好的选择,
Image_1777022875506_8321302×472 22.1 KB

Image_1777022885817_164925×565 24.5 KB

Image_1777022884054_852928×509 17.4 KB

Image_1777022877201_624987×518 12.7 KB

网友解答:
--【壹】--:

DS的模型因为DSA的缘故,在这种无语义重复捞针测试中,成绩异常突出,但不代表实际上下文场景。使用DSA的模型都可以做到,包括GLM。
因此DSA模型,建议不要用这个捞针,这在测试集的github仓库的Readme中写了


--【贰】--:

不是很清楚,不过我开了三个会话,全部上传了一本完整的,显示存在的艺术理论著作,第一个让它根据著作写大纲,第二个让它根据著作和大纲写文章,第三个会话让他根据文章和著作找出处,结果完全正确,无幻觉,三个会话的内容都是我手动提供,我觉得起码在信息提取和校对方面ds不赖


--【叁】--:

這一類太簡單了,用啥分別都不大,測不出什麼能力來。

标签:人工智能
问题描述:

flash不开思考也能做到,我扔进去的时候一秒就出答案了我还在愣神呢,结果全对。看来这个上下文很不错,用flash做个知识库检索应该是非常好的选择,
Image_1777022875506_8321302×472 22.1 KB

Image_1777022885817_164925×565 24.5 KB

Image_1777022884054_852928×509 17.4 KB

Image_1777022877201_624987×518 12.7 KB

网友解答:
--【壹】--:

DS的模型因为DSA的缘故,在这种无语义重复捞针测试中,成绩异常突出,但不代表实际上下文场景。使用DSA的模型都可以做到,包括GLM。
因此DSA模型,建议不要用这个捞针,这在测试集的github仓库的Readme中写了


--【贰】--:

不是很清楚,不过我开了三个会话,全部上传了一本完整的,显示存在的艺术理论著作,第一个让它根据著作写大纲,第二个让它根据著作和大纲写文章,第三个会话让他根据文章和著作找出处,结果完全正确,无幻觉,三个会话的内容都是我手动提供,我觉得起码在信息提取和校对方面ds不赖


--【叁】--:

這一類太簡單了,用啥分別都不大,測不出什麼能力來。

标签:人工智能