2026/5/21 15:30:47
网站建设
项目流程
推广网站最有效方法,梧州网站建设,网站开发主框架一般用什么布局,常用的网络营销方式有Andrej Karpathy提出将提示词工程更名为上下文工程#xff0c;认为工业级LLM应用中填充上下文窗口才是关键。作为Software 3.0范式的核心#xff0c;上下文工程是科学与艺术的结合#xff0c;需科学配置任务描述、少样本示例、RAG等数据#xff0c…Andrej Karpathy提出将提示词工程更名为上下文工程认为工业级LLM应用中填充上下文窗口才是关键。作为Software 3.0范式的核心上下文工程是科学与艺术的结合需科学配置任务描述、少样本示例、RAG等数据同时理解LLM的人类精神。LLM正成为新型操作系统而完整的LLM应用还需问题拆分、控制流等功能。上下文工程不仅关乎模型性能更是通向AGI的重要路径。提示词工程该改名了Andrej Karpathy 最新发声建议用「上下文工程」context engineering取代「提示词工程」prompt engineering。这个提议并不只是个简单的文字游戏而是有着背后的思考和洞察。Karpathy 指出人们一听到「提示词」就会联想到日常使用 LLM 时输入的简短任务描述。但在真正的工业级 LLM 应用中填充上下文窗口才是一门精妙的艺术与科学。为什么是艺术与科学说它是科学因为做好这件事需要任务描述和解释少样本示例few shot examplesRAG检索增强生成相关数据可能是多模态的工具调用状态和历史记录内容压缩太少或格式不对LLM 就缺乏必要的上下文性能无法达到最优。太多或不相关不仅成本上升性能反而可能下降。说它是艺术则是因为需要对 LLM 心理学有直觉般的理解——Karpathy 戏称为「人类精神」people spirits的引导直觉。Dallas(i_Forget_) 对此吐槽道「人类精神」这个说法-1分。但我还是同意这确实既是艺术也是科学。从 Software 3.0 说起要理解「上下文工程」的重要性得从 Karpathy 在 YC AI Startup School 的演讲说起——他提出了 Software 3.0 的概念认为软件正在经历根本性转变。Software 1.0 是传统编程开发者用 Python、C 等语言编写明确的指令。Software 2.0 是神经网络时代通过数据训练模型代码变成了模型权重。而 Software 3.0则是用自然语言与 LLM 交互的新范式。Karpathy 最具洞察力的观点是LLM 不仅仅是工具或 API它正在成为一种新型操作系统。这个新操作系统有自己的「CPU」推理能力、「RAM」上下文窗口、甚至「文件系统」通过 RAG 访问的知识。他甚至将当前的 AI 格局比作 1960 年代的大型机和分时共享时代计算资源昂贵且集中化用户通过「终端」聊天界面远程访问计算能力以分时方式分配。上下文工程也只是冰山一角更重要的是Karpathy 强调上下文工程本身只是 LLM 应用的一小部分。一个完整的 LLM 应用还需要恰到好处地拆分问题为控制流精准地打包上下文窗口调度合适类型和能力的LLM 调用处理生成-验证的用户交互流程更多——防护栏、安全、评估、并行处理、预取……所以上下文工程只是这个厚重软件层中的一小块这层软件协调着各个 LLM 调用以及更多功能最终形成完整的 LLM 应用。「ChatGPT套壳」这个贬义说法已经过时了而且大错特错。反而将成为新的攻坚方向。网友热议Mike Renwick(runonthespot) 提出了另一个角度我更喜欢「行为工程」。不仅是上下文还包括围绕它的抽象。控制流、状态、上下文/任务分割和隔离。像 dspy 这样的概念以及其上的层。有些只是经典编程但其他的更偏向概率。Anil Vaitla(avaitla16) 分享了实践经验我发现评估工程是下一步也是实现上下文工程的关键。有一个好的答案集和手工整理的正确答案可以让你搞清楚应该用什么样的上下文来解决提示。一旦答案集中的所有提示都被解决它似乎能很好地泛化到终端用户提出的新提示。有人已经发现contextengineering.com 这个域名20年前就被注册了Alan Zhu(alanzhuly) 把视角拉到了个人智能层面「上下文工程」对个人智能至关重要——特别是在设备上运行的小型专用语言模型。围绕个人的有意义、持久的上下文不仅会解锁新的日常使用场景还会改变人们与 AI 和技术的互动方式重塑他们的生活方式。Josh Clemm(joshclemm) 用一个生动的例子说明了选择正确上下文的重要性选择正确的上下文太重要了因为 LLM 经常会把你传给它的任何东西当作权威。还记得「在披萨上加胶水」吗它们已经改进了但仍然不够好。所以我们在正确的时间设计正确上下文的能力至关重要dex(dexhorthy) 甚至写了一篇关于这个主题的文章Michelle(michellelsun) 用一个精妙的比喻总结道上下文工程 ≈ 为模型策划一个 JIT即时记忆馈送——只包含最相关、经过验证、隐私安全的数据片段。把这个物流层做好即使是适度的上下文窗口也能胜过仅凭花哨的提示。LLM 的「心理学」特征Karpathy 在演讲中生动地将 LLM 描述为具有独特认知特征的「易错的天才」fallible savants。锯齿状智能Jagged IntelligenceLLM 可能在某些任务上表现超人但在看似简单的问题上却会失败。比如它能解决复杂的数学问题却可能错误地认为 9.11 大于 9.9。顺行性失忆症Anterograde AmnesiaKarpathy 形容 LLM 就像患有顺行性失忆症的同事——一旦训练结束它们就无法巩固或建立长期知识只有短期记忆上下文窗口。幻觉LLM 有时会犯人类不会犯的错误比如坚持「strawberry」里有两个「r」。模型生成的信息听起来令人信服但完全是错的。易受欺骗它们极易受到提示注入的影响。下一个爆火方向Mehrdad Yazdani(crude2refined) 问道说得好这能像 vibe coding 那样成为一个真正的概念吗SKP(skpolepaka) 则比较悲观我理解把它叫做提示工程的问题但这艘船可能已经起航了。现在恐怕很难把它重新命名为上下文工程了。但 David Sancho(davesnx) 调侃道太晚了vibe coding 的概念太强大了它像火一样蔓延。eren(Eremeyen3) 提出的尖锐问题你怎么让上下文工程具有未来适应性在我看来像vibe coding 一样——当我们还在争论该叫什么的时候挑战其实才刚刚开始。更大的上下文图景回到 Karpathy 的观点当他说 LLM 正在成为一种新型操作系统时我们或许还需要思考什么是真正完整的上下文现在的「上下文工程」主要聚焦于如何在有限的上下文窗口内塞入最相关的信息。但这可能只是开始。真正的上下文应该包括用户刚才看了什么网页正在使用什么软件在 IM 软件上与谁进行了什么对话当前的时间、地点、环境状态甚至用户的情绪、意图、长期目标如 Karpathy 在特斯拉的经历所示自动驾驶系统经过十年发展仍需要人类监督。这告诉我们即使有了强大的模型获取和理解完整的上下文仍是巨大挑战。Karpathy 用「钢铁侠战衣」的比喻来说明 AI 增强和完全自主之间的光谱而战衣既可以由托尼·斯塔克直接驾驶增强也可以作为智能体半自主运行。也许当我们从「提示词」走向「上下文」再走向更完整的环境感知时我们才真正接近 AGI 的可能性。模型的能力提升可能会遇到瓶颈会在一定程度上撞墙但如果我们能更全面、更精准地获取和提供上下文让 AI 真正理解「此时此地此人」的完整语境那可能将迎来新的范式转变。从给机器下指令到为机器构建理解世界的框架再到让机器真正感知和理解它所处的世界。这或许才是通向 AGI 的开始。那么如何系统的去学习大模型LLM作为一名从业五年的资深大模型算法工程师我经常会收到一些评论和私信我是小白学习大模型该从哪里入手呢我自学没有方向怎么办这个地方我不会啊。如果你也有类似的经历一定要继续看下去这些问题啊也不是三言两语啊就能讲明白的。所以我综合了大模型的所有知识点给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢我就曾放空大脑以一个大模型小白的角度去重新解析它采用基础知识和实战项目相结合的教学方式历时3个月终于完成了这样的课程让你真正体会到什么是每一秒都在疯狂输出知识点。由于篇幅有限⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》扫码获取~为什么要学习大模型我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年人才缺口已超百万凸显培养不足。随着AI技术飞速发展预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。大模型学习指南路线汇总我们这套大模型资料呢会从基础篇、进阶篇和项目实战篇等三大方面来讲解。①.基础篇基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念用最易懂的方式带你入门大模型。②.进阶篇接下来是进阶篇你将掌握RAG、Agent、Langchain、大模型微调和私有化部署学习如何构建外挂知识库并和自己的企业相结合学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。③.实战篇实战篇会手把手带着大家练习企业级的落地项目已脱敏比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等从而帮助大家更好的应对大模型时代的挑战。④.福利篇最后呢会给大家一个小福利课程视频中的所有素材有搭建AI开发环境资料包还有学习计划表几十上百G素材、电子书和课件等等只要你能想到的素材我这里几乎都有。我已经全部上传到CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】相信我这套大模型系统教程将会是全网最齐全 最易懂的小白专用课