建站平台的服务产品分析邯郸58同城网
2026/5/21 16:19:46 网站建设 项目流程
建站平台的服务产品分析,邯郸58同城网,小程序定制开发公司平台,wordpress后台特别慢检索增强生成#xff08;RAG#xff09;是生成式 AI #xff08;GenAI#xff09;中的一类应用#xff0c;支持使用自己的数据来增强 LLM 模型#xff08;如 ChatGPT#xff09;的知识。 RAG 通常会用到三种不同的AI模型#xff0c;即 Embedding 模型、Rerankear模型以…检索增强生成RAG是生成式 AI GenAI中的一类应用支持使用自己的数据来增强 LLM 模型如 ChatGPT的知识。RAG 通常会用到三种不同的AI模型即 Embedding 模型、Rerankear模型以及大语言模型。本文将介绍如何根据您的数据类型以及语言或特定领域如法律选择合适的 Embedding 模型。1文本数据MTEB 排行榜HuggingFace** 的MTEB leaderboard是一个一站式的文本 Embedding 模型榜您可以了解每个模型的平均性能。您可以将“Retrieval Average”列进行降序排序**因为这最符合向量搜索的任务。然后寻找排名最高、占内存最小的模型。Embedding 向量维度是向量的长度即 f(x)y 中的 y模型将输出此结果。最大 Token 数是输入文本块的长度即 f(x)y 中的 x 您可以输入到模型中。除了通过 Retrieval 任务排序外您还可以根据以下条件进行过滤语言支持法语、英语、中文、波兰语。例如taskretrieval,Languagechinese法律领域文本。例如taskretrievalLanguagelaw值得注意的是由于部分训练数据最近才得以公开一些 MTEB 上的 Embedding 模型可能是看似合适但实际不合适的模型排名虚高实际表现可能会有所不同。因此HuggingFace 发布了一篇博客介绍了判断模型排名是否可信的要点。点击模型链接称为“模型卡片”后寻找解释模型如何训练和评估的博客和论文。仔细查看模型训练使用的语言、数据和任务。同时寻找由知名公司创建的模型。例如在 voyage-lite-02-instruct 模型卡片上您会看到其他的 VoyageAI 模型列出但不包括这个。这是一个提示该模型是一 个overfitting 模型不应使用在下面的截图中我会尝试来自 Snowflake 的新模型“snowflake-arctic-embed-1”因为它排名较高体积小到足以在我的笔记本电脑上运行并且模型卡片上有博客和论文的链接。使用 HuggingFace 的好处就是在选择完 Embedding 模型后如果您需要更换模型只需要在代码中修改 model_name 即可import torchfrom sentence_transformers import SentenceTransformer # Initialize torch settingstorch.backends.cudnn.deterministic TrueDEVICE torch.device(cuda:3 if torch.cuda.is_available() else cpu) # Load the model from huggingface.model_name WhereIsAI/UAE-Large-V1 # Just change model_name to use a different model!encoder SentenceTransformer(model_name, deviceDEVICE) # Get the model parameters and save for later.EMBEDDING_DIM encoder.get_sentence_embedding_dimension()MAX_SEQ_LENGTH_IN_TOKENS encoder.get_max_seq_length() # Print model parameters.print(fmodel_name: {model_name})print(fEMBEDDING_DIM: {EMBEDDING_DIM})print(fMAX_SEQ_LENGTH: {MAX_SEQ_LENGTH_IN_TOKENS})2图像数据ResNet50有时候您可能想要搜索与输入图像相似的图片。比如您可能在寻找更多苏格兰折耳猫的图片。在这种情况下您可以上传一张苏格兰折耳猫的图片并要求搜索引擎找到类似的图片。ResNet50是一种流行的 CNN 模型最初由微软在 2015 年使用 ImageNet** 数据训练。同样对于视频搜索ResNet50 仍然可以将视频转换为 Embedding 向量。然后对静态视频帧进行相似性搜索返回给用户最相似的视频作为最匹配结果。3音频数据PANNs类似于以图搜图您也可以基于输入的音频片段搜索相似音频。PANNs预训练音频神经网络是常用的音频搜索 Embedding 模型因为 PANNs 基于大规模音频数据集预训练并且擅长音频分类和标记等任务。4多模态图像与文本数据SigLIP 或 Unum近几年涌现了一批针对多种非结构化数据文本、图像、音频或视频混合训练的 Embedding 模型。这些模型能够在同一向量空间内同时捕获多种类型的非结构化数据的语义。多模态 Embedding 模型支持使用文本搜索图像、为图像生成文本描述或以图搜图。OpenAI** 在 2021 年推出的CLIP是标准的 Embedding 模型。但由于其需要用户自行进行微调难以使用所以到了 2024 年谷歌推出了的SigLIPSigmoidal-CLIP。该模型在使用 zero-shot prompt时取得了不错的表现。小型 LLM 模型如今变得越来越流行。因为这些模型不需要大型云计算集群可以在笔记本电脑上运行。小模型占用的内存较少延时更低运行速度比大型模型更快。Unum提供了多模态小型 Embedding 模型。5多模态文本、音频、视频数据多模态文本-音频 RAG 系统大多使用多模态生成型 LLM。这类应用首先将声音转换为文本生成声音-文本对然后将文本转换为 Embedding 向量。之后您可以像往常一样使用 RAG 来检索文本。在最后一步文本被映射回音频。OpenAI 的Whisper可以将语音转录为文本。此外OpenAI 的Text-to-speech (TTS)** 模型也可以将文本转换成音频。多模态文本-视频的 RAG 系统使用类似的方法首先将视频映射到文本转换为 Embedding 向量搜索文本并返回视频作为搜索结果。OpenAI 的Sora可以将文本转换成视频。与 Dall-e 类似您提供文本提示而 LLM 生成视频。Sora 还可以通过静态图像或其他视频生成视频。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容​一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容​2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询