网站建设柒首先金手指6专做网站
2026/5/21 17:18:35 网站建设 项目流程
网站建设柒首先金手指6,专做网站,360网站怎么做链接,wordpress存档显示文章所有内容一、先搞懂#xff1a;RAG 到底是什么#xff1f;1. 官方名字RAG Retrieval-Augmented Generation检索增强生成#xff0c;核心逻辑是「让大模型先查 “专属资料”#xff0c;再基于资料回答问题」。2. 小白通俗理解普通大模型#xff08;Qwen / ChatGPT 等#xff09;就…一、先搞懂RAG 到底是什么1. 官方名字RAG Retrieval-Augmented Generation检索增强生成核心逻辑是「让大模型先查 “专属资料”再基于资料回答问题」。2. 小白通俗理解普通大模型Qwen / ChatGPT 等就像一个只靠脑子里记忆答题的学生只记得训练时学过的 “旧知识”不知道你的私人文档、公司手册、最新新闻、课程笔记这类它没学过的内容没记住又被问就开始瞎编幻觉RAG 就是给这个学生配一本可随时翻阅的 “随身资料册”你提问 → 模型先去资料册里找最相关的几段话→ 拿着找到的资料组织语言回答 → 不瞎编、只按资料说。3. RAG 解决的三大问题大模型不知道私有数据你的笔记、文档、合同、课程大模型知识过时训练截止后新发生的事大模型胡说八道幻觉没见过也强行编答案二、RAG 三大核心知识点按执行顺序讲1. 第一步文本拆分把长文档切成小段1.1 为什么要拆分大模型一次能 “读” 的文字长度有限上下文窗口读不下一整篇长文章 / 整本书太长的文本模型抓不住重点检索也不精准我们要做的把一份长文档切成很多短片段chunk1.2 通俗叫法“切书、切文档”把一本书 → 切成一段一段小文字块每段几十几百字。1.3 小白常用拆分规则不用复杂算法实际工具会自动做你只要理解逻辑按标点 / 段落切先按自然段分开太长的段再继续切固定长度切比如每 256 字、512 字切一段保留小段重叠前后两段稍微重叠几个字防止把一句话从中间切断丢失语义1.4 拆分后的结果一份学习笔记.md→ 变成片段 1RAG 是检索增强生成用于解决大模型幻觉...片段 2文本拆分的目的是适配模型上下文长度...片段 3向量数据库用来存储文本对应的数字向量...这些小段就是后面要存进数据库、用来检索的最小单位。2. 第二步向量与向量数据库FAISS / Milvus2.1 先懂什么是 “向量”文字是字符串计算机没法直接算 “两段文字像不像”。所以要把每一小段文本转换成一串固定长度的数字—— 这串数字就叫向量embedding / 词向量 / 文本向量。人话把文字 “翻译” 成计算机能看懂、能计算距离的数字数组例子简化“RAG 介绍” →[0.12, 0.45, -0.23, ...]长度一般几百几千位“苹果水果” →[0.88, -0.11, 0.32, ...]语义越接近的两段文字它们对应的向量在空间里距离越近。2.2 向量数据库是干嘛的普通数据库MySQL存的是文字、数字、表格不擅长做 “向量相似度计算”。向量数据库 专门存向量、并能快速算 “哪个向量和我最像” 的数据库核心职责只有两件事存把所有文本片段对应的向量存起来查你给一个新向量你的问题它快速找出距离最近、语义最相似的若干个片段2.3 FAISS vs Milvus小白怎么选库 / 系统定位部署难度适合谁小白结论FAISSFacebook 开源轻量向量检索库极低本地 pip 安装无服务、无端口、无配置个人学习、本地 demo、小批量文本入门首选Windows 直接跑Milvus企业级分布式向量数据库较高要起服务、端口、后台守护生产环境、大量数据、多用户并发入门先不学做项目上线再考虑一句话你自己本地玩、做课程 demo、存几十 / 几百篇文档 →用 FAISS公司上线、海量数据、多人同时用 → 再上 Milvus3. 第三步相似性搜索“找最相关的资料”3.1 什么是相似性搜索你提一个问题 → 把问题也转成向量 → 去向量库里找和这个向量距离最近的 N 个文本片段→ 这就是相似性搜索。不按关键词精确匹配不是百度式搜词按语义相似匹配你问“RAG 怎么避免大模型瞎编”能搜到“检索增强可以为模型提供外部参考资料降低幻觉概率”哪怕文字不完全一样只要意思接近就能搜到3.2 搜索到干嘛用把搜到的最相关的几段原文拼在一起当做 **“参考资料”**和你的问题一起喂给大模型。给模型的提示词大致长这样请根据下面的参考资料回答用户问题只使用资料里的内容不知道就说 “根据资料无法回答”不要编造。参考资料xxxxxxxxxxxx用户问题xxxxxx这就是“让模型查资料再回答”的完整逻辑。三、完整 RAG 流程从头到尾顺一遍小白必背以 “把你的 AI 自学笔记做成 RAG让模型按笔记回答” 为例准备文档把你的笔记、文章、PDF 转成纯文本自学笔记.txt文本拆分用工具把长文本切成几百字左右的小片段向量化embedding用一个 “向量模型”把每一段文字 → 转换成向量存入向量库把 “文本片段 对应向量” 一起存进FAISS本地用户提问比如“LoRA 微调为什么不用从头训练大模型”问题向量化把这个问题也转成向量相似性搜索FAISS 找出笔记中语义最接近的 2~3 个片段拼接提示词把问题 搜到的片段一起发给大模型Ollama 里的 Qwen 等模型生成答案模型只基于你提供的笔记内容回答不会瞎编、不会用外部过时知识四、小白本地 Windows 极简工具链无 Anaconda、纯 pip、本地运行和前面学的 Ollama、Windows 环境完全对齐不用云、不用复杂服务文档加载 / 文本拆分langchain封装好拆分函数不用自己写向量数据库faiss-cpuCPU 版Windows 直接 pip向量模型通用开源 embedding 模型本地跑大模型Ollama Qwen2:0.5b之前已经装过安装命令CMD 里直接运行pip install langchain langchain-community faiss-cpu -i https://pypi.tuna.tsinghua.edu.cn/simple这套组合就是目前最适合小白入门 RAG 的本地方案。五、核心名词一句话总结方便记忆RAG让大模型先检索外部资料再生成答案解决幻觉和私有知识问题文本拆分把长文档切成小段适配模型长度、提高检索精度向量文本转换成的一串数字用来表示语义、计算相似程度向量数据库专门存向量、快速做相似查找的数据库FAISS轻量本地向量库小白 RAG 入门标配Milvus企业级向量数据库生产使用入门先放一放相似性搜索根据问题语义找出库里最相关的文本片段核心逻辑查资料 → 给模型看资料 → 模型按资料回答六、小白避坑 3 条不要一上来用 Milvus入门先用 FAISS本地一键跑通别被部署劝退片段不要切太长 / 太短太长搜不准太短信息碎一般 128~512 字区间最常用RAG≠微调LoRA 微调改模型参数给模型 “记到脑子里”RAG不改模型只给模型 “翻书看”不训练、速度快、适合频繁更新的资料整体知识点速记版可直接背RAG 让大模型查资料再回答解决幻觉、私有知识、知识过时。第一步文本拆分长文档切小段方便检索和模型阅读。第二步向量数据库把文字转成数字向量存起来FAISS 适合本地小白Milvus 适合企业生产。第三步相似性搜索用问题向量找最相似的文本片段拼给模型做参考。整套流程文档→切分→向量化→存 FAISS→提问→向量化问题→搜相似片段→模型按片段回答。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询