2026/4/6 5:39:02
网站建设
项目流程
wordpress网站之间互联,seo研究中心好客站,深圳手机网站定制开发,支持wordpress空间1 引言 如果你使用大语言模型#xff08;LLMs#xff09;有一段时间了#xff0c;可能会遇到这样的时刻#xff1a;模型非但帮不上忙#xff0c;反而成了阻碍。回答质量下降、频繁提示需要开启新对话窗口、设定的限制条件不断被遗忘——这些都是模型上下文变得污染过…1 引言如果你使用大语言模型LLMs有一段时间了可能会遇到这样的时刻模型非但帮不上忙反而成了阻碍。回答质量下降、频繁提示需要开启新对话窗口、设定的限制条件不断被遗忘——这些都是模型上下文变得污染过重时的典型表现。在构建AI智能体时这些问题可能直接决定系统的成败是成为可靠的生产级智能体还是仅能在本地测试中正常运行却在实际生产环境中崩溃。要弥合这一差距、打造稳定可靠的智能体系统就必须掌握有效的上下文管理方法。这正是上下文工程的用武之地它对于大规模构建可靠智能体至关重要。2 理解大语言模型中的上下文在深入探讨上下文工程之前我们先明确在大语言模型领域中上下文的含义。上下文Context指的是大语言模型在处理任务时能够看到和处理的所有信息本质上是模型为了完成请求可访问和参考的全部数据。包括但不限于你的提示词和系统指令对话中的历史消息检索增强生成RAG的文档及检索到的信息工具调用的结果和响应图像、音频或文档等多模态输入每个大语言模型都有一个上下文窗口。这是模型在单次会话中可访问和参考的信息量以tokens为单位的硬性限制。一旦超出这个限制模型要么会截断信息要么会直接拒绝处理请求。不同模型的上下文窗口差异很大从几十万个token到数百万个token不等。此外输入类型文本vs图像等对token的消耗也有显著影响。3 什么是上下文工程上下文工程——正如特斯拉前AI总监安德烈·卡帕斯Andrej Karpathy在推文中所描述的——是一种精妙的艺术与科学旨在为模型的下一步操作在上下文窗口中填充恰到好处的信息。它不仅限于单一提示词的设计而是对智能体或大语言模型可访问的整个系统进行管理。可以将其比作微调智能体的大脑当人类需要解决问题时会借助各种输入和参考点来判断正确方案而上下文工程的核心就是为智能体管理这些输入和参考点。4 上下文工程vs提示工程你可能已经熟悉提示工程prompt engineering但它只是构建可靠AI系统的一部分。提词工程侧重于编写清晰、具体的指令使用有效的提示词模板和格式设计示例和演示内容优化对模型的即时请求而上下文工程则侧重于长期管理整个信息环境决定在多次交互中应包含或排除哪些信息处理长时间运行的对话和会话优化系统在大规模场景下的可靠性和一致性打个比方提示工程就像打磨专辑中的一首歌曲而上下文工程则是管理整张专辑的曲目编排和制作流程。5 为什么这对智能体构建至关重要构建可扩展的智能体时需要考虑诸多因素。通常一个智能体必须具备以下能力维持长时间对话访问多个数据源使用各种工具记住过往决策处理复杂的多步骤任务如果没有有效的上下文工程系统性能会很快遇到瓶颈同时token使用效率低下会直接导致成本增加。此时仅靠优化提示词无法解决问题。糟糕的上下文管理可能导致四种常见的上下文失效上下文污染——错误或幻觉响应干扰上下文上下文冲突——信息矛盾导致输出不一致上下文混淆——无关数据影响输出结果上下文过载——过多信息淹没模型的训练知识6 上下文工程的四大支柱为避免常见的上下文失效以下四大核心原则将帮助你构建更稳健的生产级系统。虽然这些技术并非万无一失但相比没有这些原则它们能让我们对上下文拥有更强的掌控力。1写入上下文Write Context将信息存储在上下文窗口之外以便后续检索和使用。这涉及创建持久化的记忆系统用于跨会话和交互保存重要信息。可以通过模型可读取的文件实现也可以直接在智能体管理的状态中存储。核心策略使用基于文件的记忆系统如Claude.md文件或Cursor中的规则文件为大规模事实集合实现嵌入式文档存储基于用户反馈和交互自动创建记忆存储无法放入上下文窗口的结构化信息2筛选上下文Select Context仅选择完成当前任务所需的相关信息放入上下文。智能检索确保纳入正确信息同时排除会降低性能的噪声。只保留必要信息不仅能为问题解决提供更准确的上下文还能减少token消耗从而降低成本。核心策略对文档检索实施语义相似度评分使用相关性阈值过滤低质量匹配结果设计同时考虑时效性、重要性和相似度的检索机制当没有高度相关的信息时制定备选策略让检索方式适应特定任务的需求3压缩历史Compress Histories提炼出完成任务所需的最少token。随着对话和智能体运行轨迹的延长智能压缩有助于维持系统性能。这包括对信息进行总结和/或在必要时移除信息。核心策略在自然边界完成的阶段、工具调用后对上下文进行总结总结token密集型的工具调用反馈同时保留关键见解为重要的对话里程碑创建检查点当接近上下文限制时自动压缩信息4隔离上下文Isolate Contexts在多个窗口或智能体之间拆分上下文以分解任务。有时最好的上下文管理方式是上下文分离让不同组件专注于特定方面。Anthropic的多智能体研究系统就体现了这一原则。他们没有将所有内容塞进一个庞大的上下文窗口而是使用专门的子智能体每个子智能体都在自己专注的上下文窗口中运行。这使得系统能够突破单一智能体的处理极限同时保持清晰度和专注力。核心策略使用多个专业智能体而非一个全能型智能体创建沙盒环境将对象与主上下文隔离为易于并行化的任务设计多智能体系统通过清晰的边界在不同上下文窗口中分离关注点7 小结总结如下上下文工程与提示词工程不同它专注于管理整个信息环境四大问题污染、冲突、混淆、过载可能导致即使是设计良好的系统失效四大支柱写入、筛选、压缩、隔离提供了系统性改进的框架更好的上下文管理直接意味着更低的成本、更高的可靠性和更优的用户体验上下文工程仍是一个不断发展的领域最佳实践仍在通过实际实验探索。我们分享的成功经验和失败教训越多就能越快共同构建更优秀的AI系统。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事02适学人群应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】