场景: 用户提问:"帮我介绍行下 LOL 中《流光镜影》这个英雄的技能有哪些 普通大模型回答:"在《英雄联盟》(League of Legends, LOL)当前版本(截至2025年12月)中,并没有名为《流光镜影》的英雄。"
问题:
- 知识过时,无法回答
- 用户体验差
- Bot价值大打折扣
解决方案:RAG( Retrieval-Augmented Generation)检索增强技术
什么是RAG
RAG是一种结合知识检索和语言生成的人工智能技术,主要用于解决大型语言模型幻觉问题

基本原理:在生成回答时,先从知识库中检索相关文档,将检索到的文档与原始问题一起输入LLM,LLM基于检索内容生成最终答案。
RAG中知识库如何构建
1.文档准备

文档预处理建议:
- 清理无关内容(广告、水印)
- 按主题分类整理
- 文件命名规范(含关键信息)
2.文档切片
文档切片:为了适应大语言模型的上下文长度限制,并提升检索的精确度和效率。
切片方式:
- 按字符数切分:固定长度(如每300字一段)
- 按符号切分:按照句号、换行符、感叹号等
- 按语义切分:识别主题变化点智能切分
一般选择方式: 按照符号和字符长度一块切分:一般200-500字/段 长度太小,上下文不完整,检索不准,长度太大,无关信息过多,干扰判断
3.文档向量化
文档向量化:将切分后的文本进行向量数字化,便于计算问题和文档的相似性。
大白话:电脑看不懂汉字,所以我们把每一句话都变成一串数字(坐标),意思越相近的话,它们在坐标系里的位置就挨得越紧。这样,电脑只要拿尺子量一下距离,就知道哪篇文档和你的问题最匹配了。
向量化作用:语义理解;相似度计算;快速检索

实践:英雄联盟游戏助手
1.创建知识库
步骤 
知识库上传文本 
文本分段 
- 分段标识符:按什么标点符号切开
- 分段最大长度:每段文本最大长度限制
- 分段重叠长度:指的是在对数据进行分段时,段与段之间存在一定的重叠部分。这种重叠可以帮助提高信息的保留和分析的准确性,提升召回效果。
- Q&A 分段:让大模型将文档读一遍,并根据文档内容,自己出题
2.让Agent应用知识库
步骤 
初始没有相关资料 
进行添加 
再次测试 