Skip to content

1. RAG 怎么实现的,流程是什么样的

可以理解成“先查资料,再让模型回答”,而不是只让模型凭自己生成。 它的大致流程是:

第一步,把知识库内容切分成一段一段。 第二步,把这些内容做向量化,存到向量库里。 第三步,用户提问后,先把问题也转成向量,去知识库里检索最相关的内容。 第四步,把检索出来的内容连同用户问题一起交给大模型。 第五步,大模型基于这些上下文生成回答。