Mystpet's Blog

场景：用户提问："帮我介绍行下 LOL 中《流光镜影》这个英雄的技能有哪些普通大模型回答："在《英雄联盟》（League of Legends, LOL）当前版本（截至2025年12月）中，并没有名为《流光镜影》的英雄。"

问题：

解决方案：RAG( Retrieval-Augmented Generation)检索增强技术

什么是RAG

RAG是一种结合知识检索和语言生成的人工智能技术,主要用于解决大型语言模型幻觉问题

基本原理：在生成回答时,先从知识库中检索相关文档，将检索到的文档与原始问题一起输入LLM，LLM基于检索内容生成最终答案。

文档预处理建议：

文档切片：为了适应大语言模型的上下文长度限制，并提升检索的精确度和效率。

切片方式：

一般选择方式：按照符号和字符长度一块切分：一般200-500字/段长度太小，上下文不完整，检索不准，长度太大，无关信息过多，干扰判断

文档向量化：将切分后的文本进行向量数字化，便于计算问题和文档的相似性。

大白话：电脑看不懂汉字，所以我们把每一句话都变成一串数字（坐标），意思越相近的话，它们在坐标系里的位置就挨得越紧。这样，电脑只要拿尺子量一下距离，就知道哪篇文档和你的问题最匹配了。

向量化作用：语义理解；相似度计算；快速检索

步骤

知识库上传文本

文本分段

步骤

初始没有相关资料

进行添加

再次测试