Skip to content
DAILY QUOTE

“ ”

场景: 用户提问:"帮我介绍行下 LOL 中《流光镜影》这个英雄的技能有哪些 普通大模型回答:"在《英雄联盟》(League of Legends, LOL)当前版本(截至2025年12月)中,并没有名为《流光镜影》的英雄。"

问题:

  • 知识过时,无法回答
  • 用户体验差
  • Bot价值大打折扣

解决方案:RAG( Retrieval-Augmented Generation)检索增强技术

什么是RAG

RAG是一种结合知识检索和语言生成的人工智能技术,主要用于解决大型语言模型幻觉问题

基本原理:在生成回答时,先从知识库中检索相关文档,将检索到的文档与原始问题一起输入LLM,LLM基于检索内容生成最终答案。

RAG中知识库如何构建

1.文档准备

文档预处理建议:

  • 清理无关内容(广告、水印)
  • 按主题分类整理
  • 文件命名规范(含关键信息)

2.文档切片

文档切片:为了适应大语言模型的上下文长度限制,并提升检索的精确度和效率。

切片方式:

  1. 按字符数切分:固定长度(如每300字一段)
  2. 按符号切分:按照句号、换行符、感叹号等
  3. 按语义切分:识别主题变化点智能切分

一般选择方式: 按照符号和字符长度一块切分:一般200-500字/段 长度太小,上下文不完整,检索不准,长度太大,无关信息过多,干扰判断

3.文档向量化

文档向量化:将切分后的文本进行向量数字化,便于计算问题和文档的相似性。

大白话:电脑看不懂汉字,所以我们把每一句话都变成一串数字(坐标),意思越相近的话,它们在坐标系里的位置就挨得越紧。这样,电脑只要拿尺子量一下距离,就知道哪篇文档和你的问题最匹配了。

向量化作用:语义理解;相似度计算;快速检索

实践:英雄联盟游戏助手

1.创建知识库

步骤

知识库上传文本

文本分段

  • 分段标识符:按什么标点符号切开
  • 分段最大长度:每段文本最大长度限制
  • 分段重叠长度:指的是在对数据进行分段时,段与段之间存在一定的重叠部分。这种重叠可以帮助提高信息的保留和分析的准确性,提升召回效果。
  • Q&A 分段:让大模型将文档读一遍,并根据文档内容,自己出题

2.让Agent应用知识库

步骤

初始没有相关资料

进行添加

再次测试