DeepSeek V4 好像官方那边给出的信息中还是没有提到多模态,也没有coding plan,佬们怎么看ds在如今大模型中所处的生态位
- 内容介绍
- 文章标签
- 相关推荐
DeepSeek V4 好像官方那边给出的信息中还是没有提到多模态,也没有coding plan,佬们怎么看ds在如今大模型中所处的生态位
想听听佬们的理解
image940×655 89.1 KB
--【壹】--:
利好其他国内模型。将v4融入自己的模型。
--【贰】--:
明显是来狙击Agent的,使用下来逻辑能力非常不错,数学解题和gemini3.1pro差不多,重点是废话很少,很突出重点
--【叁】--:
卢克开心了 因为上下文召回感觉还不错 昨天用了下v4l 挺快 就是没啥逻辑
--【肆】--:
DeepSeek 一方面帮其他模型冲击、探索新的技术方向
另一方面又保住了国内模型价格和开源的下限
V4 pro 价格是涨得比较多,看看所谓的 昇腾950 之后的降价能降多少吧
但大模型涨价肯定是必然的,都是为了挣钱嘛。何况大家的参数越来越大
--【伍】--:
研究型公司,用最低的成本,探索更前沿的技术。目标是推动技术发展
而不像那些纯商业公司,用尽办法搞营收搞增长。目标是把市值做大拉到更多投资
--【陆】--:
估计确实没有多模态,毕竟deepseek的团队规模还是不大,coding plan肯定就只能等其他三方平台上线了
--【柒】--:
我看文档里面有说多模态是未来开发的方向,到时候再整合进去
--【捌】--:
我感觉deepseek短期可能不会出token plan, 他们专注的是做模型
--【玖】--:
不是新闻为什么要发前沿快讯,发帖前请了解各个标签的含义,讨论帖自觉改成别的
--【拾】--:
我也想问来着,但是太卡了都没有发出贴来
感觉应该没有多模态?不然肯定会拎出来说的,遗憾
--【拾壹】--:
DeepSeek更像是长期主义者, 研究大于商业化, V4也是一贯的MIT开源
--【拾贰】--:
deepseek保持现状即可,不出codingplan也没事啊,我一直觉得deepseek是一家专门搞科研的公司,后续开源国模能力会迎来极大提升的,而且codingplan的话deepseek算力也不够啊
--【拾叁】--:
他不缺钱,所以不卖什么 coding plan。第二呢,他进步了,就代表着所有模型会一起跟着进步。它的生态位就是研究院。第三呢,之前传的上市,应该是为了留住人才。第四呢,我一直觉得那个是适配国产芯片的新闻是假的,没想到居然是真的。是真的,那么就意味着。算力一边倒的形势要开始逆转了。第五,纯属个人意见,仅供参考。
--【拾肆】--:
deepseek是面向炒股的基础研究,所以只有文本能力也正常
--【拾伍】--:
昨天看还在招多模态安全方面的岗,应该还得搞一段时间。定位没啥可说的,就开源模/国模第一呗
--【拾陆】--:
大模型守门员,比这差的就别做了,早点认清现实吧
补充一下,大家好像对守门员这个词有异议,我不是表达这个意思,不是说他差怎么样的,
是他的水平是一个标准线
今天刚上新当然性能不错
但是过去个小半年就赶不上了,这个时候的模型要是没超过ds就别上线了
至于为什么会有这个现象,可能是因为他发新模型慢吧
--【拾柒】--:
可靠消息:五一之前多模态模型就会开始灰度
--【拾捌】--:
价格掀桌派
deepseek的模型也许没别的好用,但价格永远是最便宜的,性价比最高的
之前听说过deepseek的主要业务是量化,做开源大模型是顺便的
--【拾玖】--:
梁总目标就是 AGI 啊,生态位就是研究底层技术,让别人跟就好。
模型这东西,只要性能领先,随时可以抢别人客户,完全没什么粘性的。
DeepSeek V4 好像官方那边给出的信息中还是没有提到多模态,也没有coding plan,佬们怎么看ds在如今大模型中所处的生态位
想听听佬们的理解
image940×655 89.1 KB
--【壹】--:
利好其他国内模型。将v4融入自己的模型。
--【贰】--:
明显是来狙击Agent的,使用下来逻辑能力非常不错,数学解题和gemini3.1pro差不多,重点是废话很少,很突出重点
--【叁】--:
卢克开心了 因为上下文召回感觉还不错 昨天用了下v4l 挺快 就是没啥逻辑
--【肆】--:
DeepSeek 一方面帮其他模型冲击、探索新的技术方向
另一方面又保住了国内模型价格和开源的下限
V4 pro 价格是涨得比较多,看看所谓的 昇腾950 之后的降价能降多少吧
但大模型涨价肯定是必然的,都是为了挣钱嘛。何况大家的参数越来越大
--【伍】--:
研究型公司,用最低的成本,探索更前沿的技术。目标是推动技术发展
而不像那些纯商业公司,用尽办法搞营收搞增长。目标是把市值做大拉到更多投资
--【陆】--:
估计确实没有多模态,毕竟deepseek的团队规模还是不大,coding plan肯定就只能等其他三方平台上线了
--【柒】--:
我看文档里面有说多模态是未来开发的方向,到时候再整合进去
--【捌】--:
我感觉deepseek短期可能不会出token plan, 他们专注的是做模型
--【玖】--:
不是新闻为什么要发前沿快讯,发帖前请了解各个标签的含义,讨论帖自觉改成别的
--【拾】--:
我也想问来着,但是太卡了都没有发出贴来
感觉应该没有多模态?不然肯定会拎出来说的,遗憾
--【拾壹】--:
DeepSeek更像是长期主义者, 研究大于商业化, V4也是一贯的MIT开源
--【拾贰】--:
deepseek保持现状即可,不出codingplan也没事啊,我一直觉得deepseek是一家专门搞科研的公司,后续开源国模能力会迎来极大提升的,而且codingplan的话deepseek算力也不够啊
--【拾叁】--:
他不缺钱,所以不卖什么 coding plan。第二呢,他进步了,就代表着所有模型会一起跟着进步。它的生态位就是研究院。第三呢,之前传的上市,应该是为了留住人才。第四呢,我一直觉得那个是适配国产芯片的新闻是假的,没想到居然是真的。是真的,那么就意味着。算力一边倒的形势要开始逆转了。第五,纯属个人意见,仅供参考。
--【拾肆】--:
deepseek是面向炒股的基础研究,所以只有文本能力也正常
--【拾伍】--:
昨天看还在招多模态安全方面的岗,应该还得搞一段时间。定位没啥可说的,就开源模/国模第一呗
--【拾陆】--:
大模型守门员,比这差的就别做了,早点认清现实吧
补充一下,大家好像对守门员这个词有异议,我不是表达这个意思,不是说他差怎么样的,
是他的水平是一个标准线
今天刚上新当然性能不错
但是过去个小半年就赶不上了,这个时候的模型要是没超过ds就别上线了
至于为什么会有这个现象,可能是因为他发新模型慢吧
--【拾柒】--:
可靠消息:五一之前多模态模型就会开始灰度
--【拾捌】--:
价格掀桌派
deepseek的模型也许没别的好用,但价格永远是最便宜的,性价比最高的
之前听说过deepseek的主要业务是量化,做开源大模型是顺便的
--【拾玖】--:
梁总目标就是 AGI 啊,生态位就是研究底层技术,让别人跟就好。
模型这东西,只要性能领先,随时可以抢别人客户,完全没什么粘性的。

