关于吹爆DS捞针能力下我对企业级RAG的思考

2026-04-29 09:491阅读0评论SEO问题

内容介绍
相关推荐

问题描述：

叠甲:
企业级RAG开发初学者, 还是有很多我不太明白的地方, 不吝赐教!

这两天高强度刷L站发现大家对于DS长上下文能力的赞誉,我现在对我当前在做的企业级RAG产生了巨大的怀疑…
当前我的RAG大量是基于适配短上下文而建立的,写了超级多的分段逻辑/向量化流程等,那现在我怀疑,如果上下文捞针能力足够强,是不是说,我可以只针对文章的总结做向量化查询,然后整篇文档md塞进去,直接让DS去找就合适呢? 这样可以说简化了我大量的前期处理流程.

各位我思路错了, 看我核心问题其实还是RAG录入和查询的问题, 正确的思路看我回复里大佬的帖子, 我觉得解决了我所有的疑问

网友解答：

--【壹】--：

长上下文全塞进去，那意味着更烧钱啊，塞进去的大部分都是无关的
厂商：最喜欢这种用户了

--【贰】--：

我也是做 RAG 的，只要 token 还贵，实时性要求还高，naive RAG 就还有价值。
用户就问个简单问题，你在那又是调工具又是路由的，成本又高，等待时间又长，最后的结果也不一定比直接答好————况且Agentic RAG 还得考虑 Agent 本身就是一个不完全可控的东西，你也不可能直接拿顶级闭源模型随便给用户用吧？只有“深度研究”这种功能才会考虑这条路线，那又是另外的场景了。graph RAG 这类主要也是把时间成本从线上转嫁出来，在索引的时候就先把关系建立好。

问题描述：

叠甲:
企业级RAG开发初学者, 还是有很多我不太明白的地方, 不吝赐教!

这两天高强度刷L站发现大家对于DS长上下文能力的赞誉,我现在对我当前在做的企业级RAG产生了巨大的怀疑…
当前我的RAG大量是基于适配短上下文而建立的,写了超级多的分段逻辑/向量化流程等,那现在我怀疑,如果上下文捞针能力足够强,是不是说,我可以只针对文章的总结做向量化查询,然后整篇文档md塞进去,直接让DS去找就合适呢? 这样可以说简化了我大量的前期处理流程.

各位我思路错了, 看我核心问题其实还是RAG录入和查询的问题, 正确的思路看我回复里大佬的帖子, 我觉得解决了我所有的疑问

网友解答：

--【壹】--：

长上下文全塞进去，那意味着更烧钱啊，塞进去的大部分都是无关的
厂商：最喜欢这种用户了

--【贰】--：

我也是做 RAG 的，只要 token 还贵，实时性要求还高，naive RAG 就还有价值。
用户就问个简单问题，你在那又是调工具又是路由的，成本又高，等待时间又长，最后的结果也不一定比直接答好————况且Agentic RAG 还得考虑 Agent 本身就是一个不完全可控的东西，你也不可能直接拿顶级闭源模型随便给用户用吧？只有“深度研究”这种功能才会考虑这条路线，那又是另外的场景了。graph RAG 这类主要也是把时间成本从线上转嫁出来，在索引的时候就先把关系建立好。