Skip to content

[日期] 预计学习时间:35-40 小时

4.1 RAG 演进路线

[!] 大厂 JD 高频要求:"精通 RAG 技术栈与工程实践"、"有 RAG 方案落地能力"

Naive RAG → Advanced RAG → Agentic RAG → Modular RAG
RAG全链路流程

Naive RAG: 文档 → 切片 → 向量化 → 存入向量库 → 检索 → 拼入 prompt → LLM 生成

Advanced RAG 优化手段:

优化方向难度效果大厂关注
查询改写(Query Rewriting)★★[OK]
混合检索(Hybrid Search)★★[OK]
重排序(Reranking)★★很高[OK][OK]
父文档检索(Parent Doc)★★[OK]
Chunk 优化策略★★[OK]

Agentic RAG: Agent 自主决定检索策略,多轮检索,判断结果是否充分。

RAG全链路流程

4.2 向量数据库

数据库类型大厂使用情况
Milvus分布式向量库[OK] 阿里、腾讯生产使用
Qdrant专用向量库[OK] 性能高,推荐
pgvectorPostgreSQL 扩展[OK] 已有 PG 基础设施首选
Elasticsearch 8.x搜索引擎[OK] 大厂搜索团队常用
ChromaDB嵌入式开发测试用

Embedding 模型选择:

4.3 Reranking

先粗检索 20 条,再用重排序模型精排到 5 条。这是提升 RAG 准确率最有效的单点优化。

python
# 使用 Cohere Rerank API 或 BGE-Reranker(国产开源)
from sentence_transformers import CrossEncoder
model = CrossEncoder("BAAI/bge-reranker-v2-m3")
scores = model.predict([("查询文本", "文档1"), ("查询文本", "文档2")])

学习资料清单

课程:

论文:

GitHub:

实践平台: