记忆中

1. RAG 怎么实现的，流程是什么样的

可以理解成“先查资料，再让模型回答”，而不是只让模型凭自己生成。它的大致流程是：

第一步，把知识库内容切分成一段一段。第二步，把这些内容做向量化，存到向量库里。第三步，用户提问后，先把问题也转成向量，去知识库里检索最相关的内容。第四步，把检索出来的内容连同用户问题一起交给大模型。第五步，大模型基于这些上下文生成回答。