RAG流程

Created2025-01-07|Updated2025-08-21

|Post Views:

RAG流程：

mysql储存FQA高频问答对数据

问题检索：BM25

连接数据库

添加表（带着字段）

添加数据

json.dumps()

mysql 存储自己的网址和密码。（自己设计一个RAG系统）

声明回退问题，把原来的复杂查询简化，第一个query检索

进行改写。主题含义不变。

milvus可以处理的数据集的大小限制是多少

技术实现：

增强索引：设计目标、核心功能、技术实现

多粒度切块，把块-分子块，对应的父块，提供给LLM

文档切成一块，存储milvus中的文档，

query是为题，编程向量，

太长的拆成四个

128个向量

父块是一个

子块分成子块去做检索

切块的子块数都是超参数

混合检索：BM25，向量检索，字符检索

base：基础模块，配置、日志

core：核心逻辑模块，实现RAG的关键功能

main：系统运行入口，支持数据处理和交互查询

中午将一份唯二

通用知识由大语言模型回答，

直接 hyde 子查询会输

文档检索：支持抽向量和系数向量的混合检索，

中午，下午

语义关键字，倒排（关键字检索

两句话的相似性，

混合检索，重排序优化，

作为回答送给大模型，方便理解。

用户查询

代码目录结构：

配置管理、日志记录

config。py

最大支持customer service phone

fallback

document_process

langchain的文档加载器

markdowm text splitter

datetime import datetime

相对路径（三方包）

模型切分工具、

文档加载器的类（处理pdf、word、ppt、图片

OCR可以提取图像里的内容

optical character recognition光学字符识别

paddle paddle ocr的工具库，基于深度学习技术，

可以把图像中的文字提取出来。

pdf 中的图片，怎么解决？paddle OCR；只能识别简单的图片rapid OCR

cv2：

寻味羊*村超BA之苗侗味道（第一档口华兴美食城店）

docx第三方库

迭代器

读取ppt的内容OCRIMGLoader（file path）

添加源数据，direcotry_path

documents 所有的键

扩展名集合

source

Author: 甘虎文

Link: http://example.com/2025/01/07/RAG_Notes/RAG%E6%B5%81%E7%A8%8B/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

Related Articles

RAG-Milvus配置文件，文档处理模块日志书写原始子块，txt sparse vector parent content source timestamp 检索精准。分块检索，父块子块子块的文档切分器父类的文档切分器基于父块，切文档的处理模块创建并加载集合转换成向量并存储 trainer.train() model args 帮助简化训练流程。处理数据（※）帮助跟随节奏：敲注释，敲print信息。 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748检查模型路径是否存在加载预训练模型将模型移到指定设备记录加载成功的日志初始化新模型num labels=4；就是多分类default：就是2将模型移到指定设备记录初始化模型的日志保存模型（save_model)创建dataset对象训练bert分类模型# 加载数据集with open万能读取方式json.loads(value) for value in f.readlines(...

RAG-LangchainRAG解决什么问题：信息过时：网络检索，获取最新数据领域知识缺失：微调，将专有和私有的知识放到知识库里幻觉：RAG（retrieval augmented generate），减轻幻觉，基于相关文档进行生成，安全：RAG,无需将数据送到公开大模型中训练，放到本地知识库，使用本地的模型（api会泄露）进行调用，避免数据的公开和泄露。2）私有数据时存在本地知识库的，做一个权限的管控。 RAG定义：检索技术+生成（LLM提示）处理流程：构建索引（文件加载、内容读取、chunk构建（拆成小文件，小块）、向量化（小块文档向量化）、落向量化检索：query向量化，找到topk 生成：topk+query构建prompt；llm生成。开发框架：LLaMAIndex、Langchain（快速搭建大模型） Langchainlangchain将模型分为三种（ langchian是用于构建大模型应用程序的框架，帮助开发者更高效的组合和使用多语言的工具。原始大模型：LLM、chat models、embeddings chain：组装chain：chain&#...

RAG项目在windows系统下的环境安装流程

RAG项目环境安装流程1 python虚拟环境依赖文件 (requirements.txt) 自己创建requirements.txt文件, 将以下内容复制进去即可 123456789101112131415161718192021222324252627282930313233# Web框架fastapiuvicorn[standard]websockets# 数据库连接pymysqlredis# 向量检索rank_bm25scikit-learnnumpyjiebapandastransformerstorchlangchainlangchain_communitysentence_transformerspymilvus# AI模型openai# 配置和工具configparserlocustwebsocket-client# 其他依赖pydanticstarlette 打开cmd终端(win+r)输入以下命令 123456# 创建虚拟环境, 安装3.10及以上的python解析器conda create -n EduRAG python=3.10# 切换虚...

Loading Database