一起来做网站17360免费建站网页链接
2026/5/21 15:12:41 网站建设 项目流程
一起来做网站17,360免费建站网页链接,e站注册网站,嘉兴网站建设定制这篇文章源于我近半年关于Agent#xff08;去除敏感信息#xff09;的生产实践#xff0c;也源于近一年和各个团队关于Agent的一些交流#xff0c;包括我对类Manus项目的一些困惑。 就当前来说#xff0c;存在两个截然相反的声音#xff1a;Agent就是未来#xff0c;其他…这篇文章源于我近半年关于Agent去除敏感信息的生产实践也源于近一年和各个团队关于Agent的一些交流包括我对类Manus项目的一些困惑。就当前来说存在两个截然相反的声音Agent就是未来其他技术都过时了 VS AgentManus没有用不解决实际问题。以下几乎是原话摘录Agent支持派AI开发变化太快了上半年的经验在下半年已经不适用了去年Dify、n8n牛逼哄哄的今年agent模型流行后新开发的项目都是agent自主规划了已经没人考虑Dify、n8n这种落后的思路了事实就是新的Agent比旧的工作流效果好太多了…Manus自始至今从产品角度而言思路是完全失败的。它没有专业数据、没有专属工具链、没有行业认证、没有与业务深度绑定的集成也没有与高价值业务场景的绑定也就是任何人都能做。所以它更偏向工程能力的延伸而不是在构建场景护城河用户会发现当他们遇到真正复杂的问题时这个通用 Agent 还是帮不上忙最终不得不转向专业的垂直产品或人工服务导致用户留存率不高…总结下来就一句话有人觉得Agent已经无所不能代表当前先进生产力了、也有人认为Agent撒也不是谁都能做毫无壁垒费Token还不解决实际问题。怎么说呢过于悲观和过于乐观的认知都是错误的他直接导致的结果就是各个公司乱投入或者不投入而我这边近3年全部在做AI相关工作前前后后接触了40多家公司做了25个AI项目花钱多的过2亿、花钱少的不到10万在Agent这块有些个人心得我们今天就来系统性的探讨下Agent这东西到底先进到哪以及他到底能不能解决实际问题unsetunset为什么25年是Agent元年unsetunset首先Agent的核心是外部工具调用而非严格意义来说Function Calling 是Agent架构的基石因为有了他才有正经的Tools调用。虽然在官方提出这Function Calling之前也能够自己训练模型或者让模型输出类似的格式去模拟Function Calling但这毕竟不是正道因为换个模型也许就不好用了。当前最经典的Agent框架是ReAct他大约是在2022年提出论文《ReAct: Synergizing Reasoning and Acting in Language Models》其中就有伪FC的实现。最后到23年6月OpenAI的更新正式提出了Function Calling将他作为ChatGPT 产品的正式能力后续逐渐成为事实上的标准各个基座模型都有对应实现有了这个基础后Agent的出现就变得更加顺滑了。国内概念的火热从年初的Manus开始但如果真要追溯早期、又出圈的Agent的话可以是2023年3月的开源项目Auto-GPT只不过就算今年的Manus在早期因为基座能力不足都表现不佳遑论更早期的Auto-GPT了呢从Manus发布后2025 AI应用元年逐渐转移成2025 AI Agent元年模型也取得了长足的发展包括整体的推理能力、上下文长度得到了极大的加强而且我相信各个基座模型一定在工具调用这块做了大量微调训练其直接的结果是下半年的工具调用能力有明显的加强。虽然模型的稳定性调用能力有不小的加强但在工具多了后依旧会有找不到、乱调用的问题。于是Claude开始收集了大量Tools调优经验在25年10月正式提出了Skills技术可以认为他是在对整体Function Calling进行补足当然Skills除了提升工具识别能力之外还做了很多其他工作。现阶段使用Skills Function Calling 上下文工程已经可以将准确率做得很不错了比如我们就能折腾到90%这在之前是很难的。以上是我从技术层面看到的近三年Agent发展的情况也就是说在今年之前想要做出个好的Agent几乎不可能在今年下半年开始整体难度会小非常多最后这里的结论就是之前对于Agent的很多质疑乃至产品体验差的问题在2026年应该会得到很大的缓解。所以要说Agent直接依赖于模型能力的变迁这句话还真的没问题你怎么优化都可能比不上模型一次能力升级。接下来我们再来说其核心编排层这个可以解释为什么Agent会越来越强一、规划框架思考-行动-观察很多同学知道Agent的工作模式一直在模仿人但多数同学对ReAct这个词并不熟也不能理解思考-行动-观察这套循环到底有什么作用毕竟多聊一轮响应速度就会慢很多还会多花不少冤枉钱耗Token关于为什么要有这么多循环我认为主要是模型能力不足所致需要多轮调优才能最终做出合理的规划。他就像一个需要调教的学生下面这个案例可以很好说明循环调教对于模型做出合理规划的意义六顶思考帽是一种经典的“平行思维”框架旨在将混乱的思考过程结构化。其核心是赋予思考者六种不同的角色“帽子”白帽客观中立只关注事实与数据。红帽感性直觉表达情绪与预感。黑帽谨慎批判专注风险与缺陷。黄帽积极乐观看到价值与机会。绿帽创新创造探索新想法与可能性。蓝帽统筹控制管理思考流程与总结。其威力在于强制切换视角避免人们被单一立场比如一味批判或盲目乐观所困从而实现对问题的全方位审视。举个具体的案例要不要在公司上马一个Agent项目跑一轮六顶思考帽大致会变成这样一套 ReAct 循环白帽我到底知道哪些事实现在公司有什么基础预算多少有哪些现成数据和系统黑帽最坏的情况是什么可能踩哪些坑哪些部门一定会强烈反对黄帽如果成功了最大的收益是什么对业务、对团队能力有哪些放大绿帽在现有资源约束下有没有一些性价比更高的落地路线比如先从一个小流程改造而不是一上来做全栈Agent平台。蓝帽把前面所有视角收束成一个可执行的行动计划先做什么怎么拆阶段怎么验证失败后怎么止损蓝猫开始收尾做输出了。这一整套六顶思考帽跑下来模型在不断地对自己刚刚的想法进行追问、纠偏和补充这就是典型的模型自问自答这有三个好处第一强行补全视角第二把想清楚从一次性梭哈变成逐步逼近最终让规划从黑盒直觉变成可复盘的过程。六顶思考帽这种玩法就是设计了一套学生自己跟自己对话的训练框架以达到对模型调教的目的从 Agent 的角度看这就是把思考-行动-观察这条 ReAct 循环进一步做了角色化化的实现。这一套的结果是模型的规划能力不是凭空长出来的而是在一次次自问自答中长出来的。并且随着模型能力的进一步加强其生成的解法会更加完善所以从框架层面来说Agent架构确实会越来越好只不过费Token暂时没法避免。在了解Agent进化史后我们再看看最经典的旅游案例二、Tools排列组合首先大家要理解模型本身是没有思考能力的他的每次回答都是一次千锤百炼的文本统计模仿比如DeepSeek是没有办法识别Claude Code 10月发布的Skills技术的这东西在他的基础数据里没有对于模型没有的东西他一定会胡编乱造这个可以从论文《OpenAIWhy Language Models Hallucinate》看出来。为了解决这个问题模型就一定要引入外部工具调用的能力Function Calling、MCP等出现后模型就开始从问答机器人逐渐往解决具体问题的Agent做进化了。而这也是很多人认为Agent是先进技术、先进生产力的原因严格来说他对工具利用的效率会更高在之前我们解决问题的方式是Workflow AI模型会在流程中某个节点上贡献自己的一己之力。Workflow虽然稳定、效率也高但Workflow不得不面对一个问题总会有20%的场景是他无法满足的而这种长尾问题很严重也许10个Workflow可以解决80%的问题但如果想要把80%提升到85%可能需要100个Workflow提升到90%可能需要1000个…于是这里核心矛盾也就出现了Workflow无法满足用户无穷的需求并且约到后面成本越高那么该怎么办呢答案是用有限的工具去约束用户无穷的意图能这样做的原因是模型基本能力已经很强了**ReAct思考-行动-观察**架构能很好的多数时候能实现规划工作另外由于互联网这些年的发展很多工具已经很成熟了常用的如搜索引擎、地图服务、文件处理等都非常标准不太标准的如订票、支付、抖音APP操作等非要做也可以用RPA技术过渡垂直平台如携程早晚会开放接口更进一步当前Computer-Use、Browser-Use乃至手机操作等更平台型的技术都在使劲突破当然最厉害的大杀器还是AI Coding理论上这家伙能够把所有的工具生成出来实际肯定做不到所以模型规划 Tools排列组合理论上是可以解决20%的问题的就算不能解决但他也会大大降低将80%变为90%的成本。这里举个我自己的例子三、Planning Tools 收束意图去年以来事情就变得特别多、特别杂我需要找课题、写文章、开发课件、做拜访、出差咨询、各种售前…最后还需要稍微花点心思管理团队但事情多了的结果就一个很多事情会被漏掉。一开始我用的 Todolist 提醒把要做的事记下来设个时间提醒自己别忘做完就勾掉只不过后面问题变多了简单的模式就不好用了任务来源越来越多微信聊天、公众号文章、抖音/视频号、小程序消息每条 todo 背后的上下文不一样有的是选题有的是客户有的是灵感片段还要和团队共享、分配、跟进这时候Workflow排上了用场如果是某个微信群就抄到表 A如果包含选题两个字就打某个标签如果是抖音链接就丢给某个脚本处理这就跟上面说的类似了规则不够用一旦入口多一点、场景多一点Workflow 就会爆炸刚才说的“10 个流程覆盖 80%想做到 90% 要 1000 个流程”的问题就出现了。这里就轮到 Agent 上场了。对我来说核心不是再造一个巨复杂的系统而是在一个相对稳定的 Todolist / 项目看板之上加一个项目小助理Agent让它帮我把事情从“世界”搬运到“列表”。这个小助理手里只有几类 Tools文本提取类从微信消息、抖音、网页链接中抽取正文内容加工类摘要、改写、提炼关键句结构化写入类写入多维表格 / 看板字段包括来源、类型、优先级、截止时间等通知提醒类给我或同事发一条“你该处理了”的消息从 Tools 的视角看这套能力很“有限”就是几种固定的操作但从“意图”的视角看它可以覆盖非常多种变体把这篇公众号发给你帮我记成一个选题 todo这个抖音视频不错帮我提炼成一条学习任务客户在微信里说的需求帮我拆成三个可执行任务分给不同同事这篇长论文只要结论帮我变成一个写作素材条目相信从这里大家也看出来Agent的核心价值了他会大大增加我Workflow的泛化能力模型用 ReAct 式的思考-行动-观察循环来决定怎么排列组合这些 Tools对同一个输入它会先判断这是“选题”“学习任务”还是“客户需求”再按套路调用提取文本 → 生成摘要 → 识别类型 → 写入对应项目表 → 视情况创建提醒如果发现字段不全就再问一句补信息继续调用这里结果是我不需要为每种场景写死一个 Workflow只要提供一组通用的能力工具再把“该怎么组合这些工具”交给模型的规划能力就能在有限规则下去承接用户几乎无穷的意图变化。这就是前面那句话的落地版有限的 Tools 模型的规划能力可以在成本可控的前提下大幅“吃掉”长尾需求。从这个角度来说Agent不能说是先进的技术但我也没想到其他的解法这本来就是一种时间、空间成本、稳定性 换取 兜底的设计如果设计如此的话就不能去挑Agent的那些毛病。四、结语当然一套优秀的Agent必定离不开记忆模块只不过大家要明白记忆体系虽然很复杂但他在Agent架构中的最最核心的意义是让模型更清晰的理解用户意图以做更合理的规划、调用更合适的工具组合所以记忆问题我们在这里就不做展开因为其实记忆系统衍生出来的上下文工程才是整个工程架构里面最难、最烦、成本最高的部分这里面涉及了各种结构设计、状态更新、偏好记录、只是增强等等这里根本没办法放开了聊。最后我们收一收关于**Agent 是未来的先进生产力还是一个谁都能做的伪概念**我相信大家现在有了一个清晰的判断了。Agent 不仅是一项先进的技术架构更是当前 AI 应用演进中极具价值的范式突破这东西并不是一下子蹦出来的而是建立在坚实的演进逻辑之上从早期的伪工具调用到 2023 年 OpenAI 推出 Function Calling 成为业界标准再到 Claude Skills 等工程优化。模型在工具调用、规划与执行上的能力已经实现了质的飞跃。这是 2025 年 Agent 从“玩具”走向“工具”的核心原因。从工程实践来看Agent 也不是玄学而是一种清醒的取舍用更多 Token、更多循环、更多系统复杂度去换更高的覆盖率和更强的泛化能力。本质上是用「时间 成本 稳定性的一点点牺牲」换「业务长尾的极大收缩」。如果你认同真实世界业务必然是长尾、必然充满变化那在当前技术条件下很难找到比 Agent 更合理的工程解法。再看 Manus 这条线也许现实会更有说服力。一个被无数人嘲讽为套壳、一个周末就能抄出来的产品几个季度过去了既没有被替代反而在 RLI 等 Benchmark 上长期排在第一这说明什么说明它踩中的不是噱头而是正确的结构性选择Less structure, more intelligence。展望未来正如Manus张涛所言Agent 将向着更通用的工具平台、更持久的伴随式服务、更主动的意图理解演进。它或许尚不完美在成本控制、复杂场景稳定性方面仍需探索但其路径已经清晰作为扩展人类智能与效率的新一代中介Agent 正在将 AI 从“对话的奇迹”转变为“行动的伙伴”。因此对于每一位身处这个时代的构建者与使用者而言理解并善用 Agent已非选择题而是一道关乎效率与竞争力的必答题。最后再引用张涛在清华那场分享里说现在已经是 2025 年最后一个月了如果你还没真正用过 Agent至少要在今年学会和它共处就像几十年前学会用电脑一样。几年之后你大概率不会记得哪一篇 Agent 概念文章但你会很清楚自己是从什么时候开始把 Agent 当成日常工作的一部分的。2025 Agent 元年 只是序幕…如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2025 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询