关于吹爆DS捞针能力下我对企业级RAG的思考

2026-04-29 09:491阅读0评论SEO问题
  • 内容介绍
  • 相关推荐
问题描述:

叠甲:
企业级RAG开发初学者, 还是有很多我不太明白的地方, 不吝赐教!

这两天高强度刷L站发现大家对于DS长上下文能力的赞誉,我现在对我当前在做的企业级RAG产生了巨大的怀疑…
当前我的RAG大量是基于适配短上下文而建立的,写了超级多的分段逻辑/向量化流程等,那现在我怀疑,如果上下文捞针能力足够强,是不是说,我可以只针对文章的总结做向量化查询,然后整篇文档md塞进去,直接让DS去找就合适呢? 这样可以说简化了我大量的前期处理流程.

各位我思路错了, 看我核心问题其实还是RAG录入和查询的问题, 正确的思路看我回复里大佬的帖子, 我觉得解决了我所有的疑问

网友解答:
--【壹】--:

长上下文全塞进去,那意味着更烧钱啊,塞进去的大部分都是无关的
厂商:最喜欢这种用户了


--【贰】--:

我也是做 RAG 的,只要 token 还贵,实时性要求还高,naive RAG 就还有价值。
用户就问个简单问题,你在那又是调工具又是路由的,成本又高,等待时间又长,最后的结果也不一定比直接答好————况且Agentic RAG 还得考虑 Agent 本身就是一个不完全可控的东西,你也不可能直接拿顶级闭源模型随便给用户用吧?只有“深度研究”这种功能才会考虑这条路线,那又是另外的场景了。graph RAG 这类主要也是把时间成本从线上转嫁出来,在索引的时候就先把关系建立好。

阅读全文
问题描述:

叠甲:
企业级RAG开发初学者, 还是有很多我不太明白的地方, 不吝赐教!

这两天高强度刷L站发现大家对于DS长上下文能力的赞誉,我现在对我当前在做的企业级RAG产生了巨大的怀疑…
当前我的RAG大量是基于适配短上下文而建立的,写了超级多的分段逻辑/向量化流程等,那现在我怀疑,如果上下文捞针能力足够强,是不是说,我可以只针对文章的总结做向量化查询,然后整篇文档md塞进去,直接让DS去找就合适呢? 这样可以说简化了我大量的前期处理流程.

各位我思路错了, 看我核心问题其实还是RAG录入和查询的问题, 正确的思路看我回复里大佬的帖子, 我觉得解决了我所有的疑问

网友解答:
--【壹】--:

长上下文全塞进去,那意味着更烧钱啊,塞进去的大部分都是无关的
厂商:最喜欢这种用户了


--【贰】--:

我也是做 RAG 的,只要 token 还贵,实时性要求还高,naive RAG 就还有价值。
用户就问个简单问题,你在那又是调工具又是路由的,成本又高,等待时间又长,最后的结果也不一定比直接答好————况且Agentic RAG 还得考虑 Agent 本身就是一个不完全可控的东西,你也不可能直接拿顶级闭源模型随便给用户用吧?只有“深度研究”这种功能才会考虑这条路线,那又是另外的场景了。graph RAG 这类主要也是把时间成本从线上转嫁出来,在索引的时候就先把关系建立好。

阅读全文