如何将RAG模型的最佳实践和调优方法应用于实际应用中?
- 内容介绍
- 文章标签
- 相关推荐
说实话, 不够强上,而是卡在知识库的搭建上,你懂的。咱就是说模型再牛,如果背后知识库搭得乱七八糟,那效果也好不到哪去。
知识库搭建:地基要稳
内卷。 先说说 得确保文档内容的准确性、时效性以及全面性。要是知识库缺失关键信息,后续的一切优化都是白搭,哈哈。这就好比盖房子,地基不稳,上面的装修再豪华也是危房。
引起舒适。 那咋办呢?可利用领域内的专业术语、 最新的术语更新数据等对 embedding 进行针对性训练,使模型能够更精准地理解和匹配与这些术语相关的 query。害,这事儿不简单,但值得一试。
文档处理:精装修
拿到文档后直接整篇丢给模型肯定是不行的, 会瞬间爆炸,得切片。切片的目的是将长文档分割成更小的片段,方便大模型处理和理解。但这里有个坑:切得太碎,语义支离破碎;切得太大,包含的噪音太多,检索时就不精准了。
就这? 咱可以用 SemanticSplitter 语意分隔器方法, 先按句子把整个文档初步分隔,然后按顺序默认每连续 3 句成一组,下一组往后移动 1 个句子,比如第一组是 ,第二组是 ,依此类推直到结束,再把每一组内容通过大模型的 Embedding 服务进行处理。
但是 这些通用的方法不一定对每个文档都最佳,所以呢 Langchain 和 Llamaindex 框架还提供多种其它的切片方法, 我直接起飞。 方便对不同形式的文档进行切片处理,你懂的。
检索优化:多路召回与重排序
得了吧... 系统会从多个知识库检索文本切片,开销,但能大幅提升准确率,绝对物超所值。
说实话, 不够强上,而是卡在知识库的搭建上,你懂的。咱就是说模型再牛,如果背后知识库搭得乱七八糟,那效果也好不到哪去。
知识库搭建:地基要稳
内卷。 先说说 得确保文档内容的准确性、时效性以及全面性。要是知识库缺失关键信息,后续的一切优化都是白搭,哈哈。这就好比盖房子,地基不稳,上面的装修再豪华也是危房。
引起舒适。 那咋办呢?可利用领域内的专业术语、 最新的术语更新数据等对 embedding 进行针对性训练,使模型能够更精准地理解和匹配与这些术语相关的 query。害,这事儿不简单,但值得一试。
文档处理:精装修
拿到文档后直接整篇丢给模型肯定是不行的, 会瞬间爆炸,得切片。切片的目的是将长文档分割成更小的片段,方便大模型处理和理解。但这里有个坑:切得太碎,语义支离破碎;切得太大,包含的噪音太多,检索时就不精准了。
就这? 咱可以用 SemanticSplitter 语意分隔器方法, 先按句子把整个文档初步分隔,然后按顺序默认每连续 3 句成一组,下一组往后移动 1 个句子,比如第一组是 ,第二组是 ,依此类推直到结束,再把每一组内容通过大模型的 Embedding 服务进行处理。
但是 这些通用的方法不一定对每个文档都最佳,所以呢 Langchain 和 Llamaindex 框架还提供多种其它的切片方法, 我直接起飞。 方便对不同形式的文档进行切片处理,你懂的。
检索优化:多路召回与重排序
得了吧... 系统会从多个知识库检索文本切片,开销,但能大幅提升准确率,绝对物超所值。

