2026/5/21 11:40:09
网站建设
项目流程
如何在电商网站做市场调研,好看的 网站后台模板,男男床做第一次视频网站,网站维护的具体问题本文深入解析了AI Agent的核心概念#xff0c;从ChatGPT的局限性出发#xff0c;阐明AgentLLM行动能力的本质。详细介绍了Agent的三大核心组件#xff1a;LLM(大脑)、Tools(工具/手脚)和Agent Loop(控制循环)。通过OpenCode实例展示了不同Agent类型及其权限控制机制#xf…本文深入解析了AI Agent的核心概念从ChatGPT的局限性出发阐明AgentLLM行动能力的本质。详细介绍了Agent的三大核心组件LLM(大脑)、Tools(工具/手脚)和Agent Loop(控制循环)。通过OpenCode实例展示了不同Agent类型及其权限控制机制并解释了ReAct模式和Function Calling技术如何使Agent能够自主思考和行动实现与外部世界的智能交互。本章目标理解 Agent 的核心概念建立对 AI Agent 的整体认知1.1 从 ChatGPT 到 Agent普通聊天机器人的局限当你使用 ChatGPT 网页版时它只能回答问题生成文本进行对话但它不能读取你电脑上的文件执行命令访问互联网获取实时信息修改代码这是因为普通的 LLM大语言模型只是一个大脑它没有手脚去与外部世界交互。Agent LLM 行动能力Agent智能体是在 LLM 基础上赋予它与外部世界交互能力的系统。┌─────────────────────────────────────────────────────────────┐│ ││ 普通 LLM: 用户 ──▶ LLM ──▶ 文本回复 ││ ││ Agent: 用户 ──▶ LLM ──▶ 思考 ──▶ 行动 ──▶ 观察 ││ ◀────────────────────┘ ││ (循环) ││ │└─────────────────────────────────────────────────────────────┘一个具体的例子假设你对 Agent 说“帮我看看 package.json 里的依赖版本”普通 LLM 的回答“我无法访问你的文件系统请把 package.json 的内容粘贴给我。”Agent 的行为思考用户想知道依赖版本我需要读取 package.json行动调用read工具读取文件观察获取到文件内容回答基于文件内容告诉用户依赖版本这就是 Agent 的核心价值它能自主决定采取什么行动来完成任务。1.2 Agent 的核心组成一个完整的 Agent 系统由以下部分组成┌─────────────────────────────────────────────────────────────┐│ Agent 系统 │├─────────────────────────────────────────────────────────────┤│ ││ ┌─────────────────────────────────────────────────────┐ ││ │ LLM (大脑) │ ││ │ │ ││ │ • 理解用户意图 │ ││ │ • 决定下一步行动 │ ││ │ • 分析工具执行结果 │ ││ │ • 生成最终回复 │ ││ └─────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌─────────────────────────────────────────────────────┐ ││ │ Tools (工具/手脚) │ ││ │ │ ││ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ ││ │ │ read │ │ write │ │ bash │ │ search │ │ ││ │ │ 读文件 │ │ 写文件 │ │执行命令 │ │ 搜索 │ │ ││ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ ││ └─────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌─────────────────────────────────────────────────────┐ ││ │ Agent Loop (控制循环) │ ││ │ │ ││ │ 思考 ──▶ 行动 ──▶ 观察 ──▶ 思考 ──▶ ... ──▶ 完成 │ ││ └─────────────────────────────────────────────────────┘ ││ │└─────────────────────────────────────────────────────────────┘三大核心组件组件作用类比LLM理解、推理、决策大脑Tools与外部世界交互手脚Agent Loop协调 LLM 和 Tools神经系统关键概念Function Calling / Tool Use现代 LLM如 Claude、GPT-4都支持一种叫Function Calling或Tool Use的能力。简单说就是 LLM 可以输出一种特殊格式表示我想调用某个工具{ tool: read, arguments: { filePath: package.json }}Agent 系统检测到这种输出后会解析出要调用的工具和参数执行工具把结果返回给 LLMLLM 继续思考下一步这就是 Agent 能行动的技术基础。1.3 OpenCode 中的 Agent现在让我们看看 OpenCode 是如何实现 Agent 的。核心文件位置packages/opencode/src/├── agent/│ └── agent.ts ← Agent 定义├── session/│ ├── index.ts ← 会话管理│ ├── llm.ts ← LLM 调用│ └── processor.ts ← Agent Loop 实现├── tool/│ ├── tool.ts ← 工具基础定义│ ├── read.ts ← 读文件工具│ ├── bash.ts ← 执行命令工具│ └── ... ← 其他工具└── provider/ └── provider.ts ← LLM 提供商管理Agent 的定义打开packages/opencode/src/agent/agent.ts你会看到 Agent 的类型定义// 简化版突出核心字段exportconstInfo z.object({name: z.string(), // Agent 名称如 builddescription: z.string().optional(), // 描述告诉 LLM 这个 Agent 的用途mode: z.enum([subagent, primary, all]), // 运行模式// 权限控制决定 Agent 能使用哪些工具permission: PermissionNext.Ruleset,// 可选指定使用的模型model: z.object({ modelID: z.string(), providerID: z.string(), }).optional(),// 自定义系统提示词prompt: z.string().optional(),// LLM 参数temperature: z.number().optional(),topP: z.number().optional(),})关键理解nameAgent 的唯一标识permission控制 Agent 能做什么非常重要prompt定制 Agent 的行为风格model可以为不同 Agent 指定不同的 LLMOpenCode 的内置 AgentOpenCode 预定义了几个 Agent各有不同的用途// 来自 agent.ts 的内置 Agent 定义constresult: Recordstring, Info {// 1. build - 默认的开发 Agentbuild: { name: build, permission: PermissionNext.merge(defaults, user), // 全权限 mode: primary, native: true, },// 2. plan - 只读分析 Agentplan: { name: plan, permission: PermissionNext.merge( defaults, PermissionNext.fromConfig({ edit: { *: deny, // 禁止编辑 .opencode/plan/*.md: allow, // 只能写计划文件 }, }), user, ), mode: primary, native: true, },// 3. general - 通用子 Agentgeneral: { name: general, description: General-purpose agent for researching complex questions and executing multi-step tasks., permission: PermissionNext.merge( defaults, PermissionNext.fromConfig({ todoread: deny, todowrite: deny, }), user, ), mode: subagent, // 作为子 Agent 被调用 native: true, hidden: true, },// 4. explore - 代码探索 Agentexplore: { name: explore, permission: PermissionNext.merge( defaults, PermissionNext.fromConfig({ *: deny, grep: allow, glob: allow, list: allow, bash: allow, read: allow, // ... 只允许搜索类工具 }), user, ), description: Fast agent specialized for exploring codebases., mode: subagent, native: true, },}Agent 对比表Agent用途权限使用场景build开发构建全权限写代码、执行命令、修改文件plan规划分析只读分析代码、制定计划不修改general子任务受限被其他 Agent 调用执行子任务explore代码探索只读搜索快速搜索和理解代码库1.4 动手实验体验不同 Agent实验 1切换 Agent启动 OpenCodecd packages/opencode bun dev默认使用的是buildAgent按Tab键切换到planAgent观察界面上 Agent 名称的变化实验 2感受权限差异在buildAgent 下输入创建一个文件 test.txt内容是 hello world→ Agent 会成功创建文件切换到planAgent输入同样的请求 → Agent 会拒绝因为没有写权限实验 3查看 Agent 配置在 OpenCode 中输入/config可以看到当前的配置包括 Agent 相关设置。1.5 知识补充Agent 的学术背景ReAct 模式OpenCode 使用的 Agent 模式基于ReActReasoning Acting论文。核心思想是让 LLM 交替进行Reasoning推理思考当前情况决定下一步Acting行动执行具体操作Observation观察获取行动结果Thought: 用户想知道 package.json 的内容我需要读取这个文件Action: read(filePathpackage.json)Observation: {name: opencode, version: 1.0.0, ...}Thought: 我已经获取到文件内容可以回答用户了Answer: package.json 的内容是...为什么 ReAct 有效可解释性每一步都有明确的思考过程可控性可以在任何一步介入或修正灵活性可以处理复杂的多步骤任务其他 Agent 模式模式特点适用场景ReAct推理行动交替通用任务Plan-and-Execute先规划后执行复杂任务Tree of Thoughts多路径探索需要回溯的任务Multi-Agent多个 Agent 协作大型复杂任务OpenCode 主要使用 ReAct 模式但也支持 Multi-Agent通过task工具。1.6 本章小结核心概念回顾Agent LLM Tools LoopLLM 负责思考和决策Tools 负责与外部世界交互Loop 协调整个过程Function Calling是 Agent 能行动的技术基础权限控制是 Agent 安全性的关键OpenCode 代码对照概念OpenCode 实现文件位置Agent 定义Agent.Infosrc/agent/agent.ts工具系统Tool.define()src/tool/tool.tsAgent LoopSessionProcessorsrc/session/processor.tsLLM 调用LLM.stream()src/session/llm.ts检查清单理解 Agent 和普通 LLM 的区别知道 Agent 的三大核心组件了解 OpenCode 的内置 Agent 及其差异完成了动手实验AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。掌握大模型技能就是把握高薪未来。那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。因此这里给大家整理了一份《2026最新大模型全套学习资源》包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。5. 大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。企业对人才的需求从“单一技术”转向 “AI行业”双背景。金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】