帝舵手表网站上海房屋装修公司实力排名
2026/5/21 17:32:50 网站建设 项目流程
帝舵手表网站,上海房屋装修公司实力排名,学校网站建设的意义和应用,seo外包公司自从ChatGPT横空出世以来#xff0c;AI“黑话”层出不穷#xff0c;什么RAG、Agent、MCP、A2A... 现在又来了个Context Engineering#xff08;上下文工程#xff09;#xff0c;是不是有点懵#xff0c;别担心#xff0c;这篇文章会一一给你解答。 你好#xff0c;我是…自从ChatGPT横空出世以来AI“黑话”层出不穷什么RAG、Agent、MCP、A2A... 现在又来了个Context Engineering上下文工程是不是有点懵别担心这篇文章会一一给你解答。你好我是测试蔡坨坨。自从ChatGPT横空出世以来AI“黑话”层出不穷什么RAG、Agent、MCP、A2A... 现在又来了个Context Engineering上下文工程那什么是ContextContext Engineering又是什么它解决了什么问题以及如何解决问题是不是有点懵别担心这篇文章会一一给你解答。准备好了吗让我们开始这场上下文之旅什么是Context从黑盒子说起单纯从外部来看大模型就像是一个神秘的黑盒。你给它输入 → 它就给你输出就这么简单粗暴不过这个输入是有大小限制的这就是上下文窗口Context Window就像你的大脑一样一次只能记住有限的信息。这里的Context指的就是模型输入。Context到底是什么简单来说Context就是模型在处理当前任务时能够看到的所有信息。它包括用户的问题背景信息用户的历史对话相关资料可用工具列表工具执行结果Context WindowAI的记忆容量而Context Window指的就是模型输入中最多能包含的token数量。Token可以理解为文本被拆分成的最小单位可能是一个字、一个词、或者是一个标点符号。简单记住1个token ≈ 0.75个英文单词1个token ≈ 1.5个汉字举个栗子Gemini 2.5 Pro最多能输入100万token的上下文一旦超过这个限制前面的内容就会被无情丢弃只保留最后的100万token。 100万token大约相当于七本书的长度也就是说Gemini 2.5 Pro可以一次性读完约七本书的内容这个容量已经是非常惊人了。看到这里你可能会想Context这么长那我直接把所有资料都丢进去让模型自己理解不就行了理想很丰满现实很骨感智能客服的美好幻想假设你想做一个智能客服希望它能回答用户关于公司产品的各种问题。这个智能客服的核心就是一个大模型。大模型虽然很强但直接问它关于你们公司产品的问题它只能无奈地回答我不知道啊我知道个锤子♂️。于是你灵机一动没关系我们有产品使用手册直接丢给大模型就好了你的想法是这样的产品手册几十页丢进去几百页也丢进去上千页统统丢进去反正Context Window这么大管它哪些内容相关不相关让模型自己去理解这样做对吗答案是不对❌三个残酷的现实问题事实并没有那么简单在实际使用过程中我们会遇到三个非常现实的问题1️⃣ 大多数模型的Context Window其实很小气虽然Gemini 2.5 Pro有100万token但看看其他模型模型Context Window备注Gemini 2.5 Pro100万土豪级别GPT-440万还算够用Claude 420万中规中矩Deepseek V312.8万有点紧张要命的是有时候为了节省成本我们经常使用一些小模型它们的Context Window可能只有几万token。连一个完整的产品使用手册都装不下2️⃣ 信息太杂乱AI也会选择困难症即使你的模型有超大Context Window也不能把所有资料不加筛选地全部丢给它想象一下你让一个人在一堆杂乱无章的文件中找答案他会怎么样被信息淹没分不清重点给出模糊的回答AI模型也是一样的杂乱、冗余、矛盾的信息会让它选择困难最终输出含糊其辞的回答。关键insight与其把所有信息都塞进去不如精心设计和组织确保模型看到的是准确、有结构、重点突出的内容。3️⃣ 输入越多钱包越瘪这是最现实的问题大多数模型厂商都是按token计费如果不加控制地塞入大量上下文内容即使效果还行也可能带来不必要的开销。优化输入 优化成本所以我们看到直接把资料丢给大模型的思路是行不通的这里存在很多的问题。那我们该如何解决它们呢这就引出Context Engineering了什么是Context Engineering定义解析Context Engineering翻译成中文就是上下文工程。从字面上来看Context Engineering似乎就是针对Context所做的一些技术。回想一下Context的含义Context 给模型的输入Context Engineering 对模型输入做优化核心理念Context Engineering关注的不是怎么训练模型而是怎么精心设计给模型的输入内容。它要让模型在有限的Context Window里面尽可能地理解更准答得更好花得更少核心思想不改变模型的结构只改变模型能看到什么。就像给AI戴上了一副智能眼镜为什么Context Engineering突然火了其实Context这个概念一直都存在但是Context Engineering却是最近一段时间才火起来。两大推动力1️⃣ 模型足够强大了现在的模型已足够强大对比一年前的模型简直是天壤之别对于现在的模型来说你只要给到它✅ 足够精细的要求✅ 足够完整的相关资料模型就能给出非常准确有用的回答关键insight在大部分情况下如果模型的回答不能让你满意这并不是因为模型不够强大而是因为你没有给到模型足够清晰、完整的信息。而这一点正是Context Engineering要解决的问题2️⃣ Agent的兴起Agent是一种把大模型和工具结合起来让模型能够独立感知环境、影响环境从而解决用户问题的技术。Agent运行时会产生大量信息可用工具信息工具执行结果运行历史记录使用多少次工具 → 就有多少个工具执行结果 → Agent运行时间长了 → 这些结果占满整个Context Window → 影响模型后续回答效果这就是为什么Agent兴起之后Context Engineering的话题也随之火了起来因为Context的管理效果直接影响到Agent的执行结果。Context Engineering的四大绝招在了解了Context Engineering兴起的原因之后接下来我们就看一下它具体的实现方法。Context Engineering并不是某项单一的技术而是多种技术组成的方法体系。四大核心步骤Context Engineering分为四个步骤保存Context选择Context压缩Context隔离Context让我们逐一击破第一招保存Context保存Context就是说我们把Context做个筛选总结并找个地方保存起来比如内存/硬盘之类的地方在模型需要的时候再发给模型。经典案例ChatGPT的记忆功能这里一个比较典型的例子就是ChatGPT的记忆功能。比如我在一次对话中跟ChatGPT说我的名字是蔡坨坨我有一个公众号叫测试蔡坨坨在这个公众号里我分享过软件测试、Python测试开发、AI、RAG、GraphRAG、MCP等相关的内容记住这些注意到这个已更新保存的记忆这代表ChatGPT把这段内容存入到它的记忆库里面去了核心价值这个保存的动作是Context Engineering的第一步它解决了信息持久化的问题。就像给AI装了个外置硬盘但光存下来还不够ChatGPT的记忆库是可以存放很多条记录的那在未来的工作中ChatGPT是如何从这个庞大的记忆库里面精准的找到它想要的信息呢第二招选择Context这就引出了Context Engineering的第二个步骤选择Context选择Context就是从海量的信息中选择出一部分与用户问题最相关的内容并且把它们放在模型的Context里面。关键insight一个好的选择策略是整个系统高效准确运行的保障就像一个聪明的图书管理员选择又分为静态选择和动态选择静态选择AI的基本法静态选择就是把一些永远重要、必须要遵守的信息在每一次请求时全部放到Context里面。它就像是给AI焊在脑子里的系统指令或者核心原则⚡经典例子Cursor的rules文件Claude Code的CLAUDE.md文件Trae的user_rules.md、project_rules.md文件这些文件指定了当前项目的信息编码时需要遵守的规范AI行为的核心原则策略要点这些信息至关重要无论用户问什么都必须在场对于这类短小但至关重要的信息最有效的策略就是全部都要只要确保它们加起来不会撑爆Context Window就行。动态选择智能图书管理员说完了静态选择接下来我们看一下更强大、也更为常见的动态选择。动态选择是指选择与用户问题最相关的内容并且把它放入Context中。它不是所有的东西都塞进去而是像一个聪明的图书管理员为你精准地找到需要的那几页。经典案例ChatGPT从记忆库中挑选与用户问题最相关的记忆。从数十个甚至数百个工具中挑选最相关的3个工具放入Context这也是一种动态选择。最著名的实现方式RAG检索增强生成PS关于RAG的内容可参考「搭建一个本地AI知识库需要用到哪些技术栈」️ 第三招压缩Context压缩Context是指在保留关键信息的前提下减少Context的长度。核心理念用最少的字符传达最多的信息就像把一本厚书压缩成精华版➡️常见压缩方式压缩Context有很多种方式总结把长对话浓缩成几句话关键词提取提炼文档核心要点信息去重删除重复内容结构化提取保留关键数据结构实战案例Agent的历史消息压缩Agent在运行时会在Context中积累大量的历史消息一般来说这些历史消息中最占空间的便是模型的输出文本和工具执行结果两类数据。如果不做处理的话这些消息便会迅速挤满Context的全部空间从而影响模型的后续回答效果。经典解决方案Claude Code的auto-compact程序对以往的Context做压缩总结之前的内容把原来的内容扔掉总结后Context Window的使用量就会降下来用户甚至可以在Claude.md里面指定压缩方案压缩的好处让我们在有限的Context Window中放入更多信息从而提高模型性能第四招隔离Context说完压缩Context下面我们就来说说最后一个策略隔离Context。隔离Context是指把不同类型的信息分别放在不同的Context中从而避免信息之间的相互干扰核心思想让不同类型的信息各司其职避免串台现象就像把不同的菜分装在不同的盘子里️经典案例Anthropic的Multi-Agent系统隔离Context最典型的应用场景就是Multi-Agent系统。不同模块之间的Context是互相隔离的互不干扰。原文「How we built our multi-agent research system」在Multi-Agent系统中Lead Agent系统的总指挥官负责任务下发和归纳总结。Subagent各司其职的专业助手工作流程用户请求 → Lead Agent用户请求会先打到Lead AgentLead Agent分解任务 → 各个Subagent在接收到用户请求之后Lead Agent便会把用户的问题拆解成多个task并下发到其他的Agent系统里Anthropic把这些Agent称为Subagent搜索内部知识库的Subagent → 获取内部信息联网搜索的Subagent → 获取外部信息Lead Agent汇总所有结果 → 生成最终报告Context隔离体现每个Subagent都有专属的Context各Context之间互不干扰职责清晰这就是隔离Context的典型例子不同系统拥有不同Context各司其职互不干扰总结Context Engineering 的关键在于“让模型看到对当前任务最必要且组织良好的信息”。通过先保存与结构化知识再用静态/动态策略精准选择配合总结与关键词等方式压缩并在多主体/多任务中做好隔离可在有限的上下文窗口内显著提升回答质量降低冗余与成本。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询