一、前言
建议提前阅读以下文章:
-
安装 Python:Python 环境配置
二、简介
RAG,全称 Retrieval Augmented Generation,中文意思 检索增强生成。
实现步骤:
-
准备外部数据,并切割成一个个文本块。文本块转换成向量(向量包含文本之间的语法、语义等关系),存入向量数据库。
-
用户提问时,提问内容转换为向量,然后再向量数据库中查找相似的向量(与用户提问内容向量距离最近的向量,即最相关的段落)。
-
用户提问内容 和 相关的段落 被组合发给模型。
-
AI 将 相关的段落 作为上下文,进行回答。
以下为步骤图(源自:LangChain):