DeepSeekv4神了
- 内容介绍
- 文章标签
- 相关推荐
deepseek在长上下文和工具调用上不管是pro和flash差距都非常小,都能准确记住长上下文内容,对于pro有这个表现是正常的,但是flash表现居然也不错!要知道flash的参数量才284B!
而经济上deepseek不管是pro还是flash都非常便宜(对比国外),但是能力却差不多,神!夯暴
网友解答:--【壹】--:
国产之光deepseek!嗷呜~天神下凡deepseek~
--【贰】--:
对我一直觉得这一次进步真的会为所有的 A I 模型带来长足的进步,这个长上下文只是真的长上下文,并不是那种超过100 K 就记不得的那种。
--【叁】--:
一方面是没卡,再一方面他们的路线本来就是长期路线
ds搞开源为的是技术,不是为了那个产品,也不是为了用户量
产品是不值钱的,可以开源扔出去白送给别人的。用户也是不值钱的,随时可以跑的。但是ds留下来的技术迭代研发的能力才是ds自己的护城河
--【肆】--:
捞针很稳,长上下文很稳。
deepseek在长上下文和工具调用上不管是pro和flash差距都非常小,都能准确记住长上下文内容,对于pro有这个表现是正常的,但是flash表现居然也不错!要知道flash的参数量才284B!
而经济上deepseek不管是pro还是flash都非常便宜(对比国外),但是能力却差不多,神!夯暴
网友解答:--【壹】--:
国产之光deepseek!嗷呜~天神下凡deepseek~
--【贰】--:
对我一直觉得这一次进步真的会为所有的 A I 模型带来长足的进步,这个长上下文只是真的长上下文,并不是那种超过100 K 就记不得的那种。
--【叁】--:
一方面是没卡,再一方面他们的路线本来就是长期路线
ds搞开源为的是技术,不是为了那个产品,也不是为了用户量
产品是不值钱的,可以开源扔出去白送给别人的。用户也是不值钱的,随时可以跑的。但是ds留下来的技术迭代研发的能力才是ds自己的护城河
--【肆】--:
捞针很稳,长上下文很稳。

