deepseek v4捞针能100%,而且会尝试反问不懂的部分
- 内容介绍
- 文章标签
- 相关推荐
flash不开思考也能做到,我扔进去的时候一秒就出答案了我还在愣神呢,结果全对。看来这个上下文很不错,用flash做个知识库检索应该是非常好的选择,
Image_1777022875506_8321302×472 22.1 KB
Image_1777022885817_164925×565 24.5 KB
Image_1777022884054_852928×509 17.4 KB
Image_1777022877201_624987×518 12.7 KB
网友解答:--【壹】--:
DS的模型因为DSA的缘故,在这种无语义重复捞针测试中,成绩异常突出,但不代表实际上下文场景。使用DSA的模型都可以做到,包括GLM。
因此DSA模型,建议不要用这个捞针,这在测试集的github仓库的Readme中写了
--【贰】--:
不是很清楚,不过我开了三个会话,全部上传了一本完整的,显示存在的艺术理论著作,第一个让它根据著作写大纲,第二个让它根据著作和大纲写文章,第三个会话让他根据文章和著作找出处,结果完全正确,无幻觉,三个会话的内容都是我手动提供,我觉得起码在信息提取和校对方面ds不赖
--【叁】--:
這一類太簡單了,用啥分別都不大,測不出什麼能力來。
flash不开思考也能做到,我扔进去的时候一秒就出答案了我还在愣神呢,结果全对。看来这个上下文很不错,用flash做个知识库检索应该是非常好的选择,
Image_1777022875506_8321302×472 22.1 KB
Image_1777022885817_164925×565 24.5 KB
Image_1777022884054_852928×509 17.4 KB
Image_1777022877201_624987×518 12.7 KB
网友解答:--【壹】--:
DS的模型因为DSA的缘故,在这种无语义重复捞针测试中,成绩异常突出,但不代表实际上下文场景。使用DSA的模型都可以做到,包括GLM。
因此DSA模型,建议不要用这个捞针,这在测试集的github仓库的Readme中写了
--【贰】--:
不是很清楚,不过我开了三个会话,全部上传了一本完整的,显示存在的艺术理论著作,第一个让它根据著作写大纲,第二个让它根据著作和大纲写文章,第三个会话让他根据文章和著作找出处,结果完全正确,无幻觉,三个会话的内容都是我手动提供,我觉得起码在信息提取和校对方面ds不赖
--【叁】--:
這一類太簡單了,用啥分別都不大,測不出什麼能力來。

