2026/5/21 14:55:21
网站建设
项目流程
学生处网站建设工作总结,建筑企业办公系统公司,微信微网站是什么格式的,项目管理app文章深入解析了大模型的工作原理#xff08;连接主义#xff0c;基于概率预测#xff09;#xff0c;介绍了其核心能力#xff08;上下文学习、智能涌现#xff09;#xff0c;并系统阐述了四大缺陷#xff1a;幻觉、知识滞后、表现不稳定和P^n问题。针对这些缺陷…文章深入解析了大模型的工作原理连接主义基于概率预测介绍了其核心能力上下文学习、智能涌现并系统阐述了四大缺陷幻觉、知识滞后、表现不稳定和P^n问题。针对这些缺陷作者提出了相应的解决方案如工具调用、搜索增强生成、提示词工程和多智能体协作。最后作者提出AI是可能性的艺术的观点强调在使用AI时需区分确定性与不确定性采用务实灵活的方式与AI协作。导读从ChatGPT这类大语言模型文中简称大模型出现到现在已经过去三年了AI和大模型的概念已经成为大家日常工作生活绕不开的话题了这是好消息毕竟从概念到使用的普及是每个新技术必经的阶段。但现实又魔幻的是一方面大量媒体在说AI是无所不能的人人都能通过写提示词Prompt做一个智能体甚至你只要说几句话就能把软件编程工作做好Vibe Coding。另一方面很多报道又在说95%的AI项目实际上都失败了。真相到底是什么要知道真相需要来看看大模型的工作原理是什么它的能力边界在哪里如何应对大模型的本质大模型是机器学习的一种机器学习中有符号主义和连接主义而大模型属于连接主义的一种。最早的机器学习是符号主义的做法。符号主义的目标是要找确定的、可解释的解。常见手段就是找到符合要求的一个函数Yf(x)。找出已知的x和Y的对应规则比如线性、指数、正态分布等就能计算新的x对应的Y值。拿医学诊断举例。x变量是人的症状发烧、咳嗽、指标病原体、白细胞、药物等规则就是变量之间的对应关系比如发烧白细胞值病原体值 细菌感染结论Y就是推荐使用抗生素。连接主义不依赖显式规则通过数据训练让模型拟合统计规律输出近似最优的预测结果。比如猫的图片识别因为没法穷尽猫的特征规则干脆让模型自己在统计过程中找出特征效果好不好就看模型预测的总体表现。所以连接主义的本质是近似是预测。符号主义解决不了现实问题很复杂性问题毕竟问题涉及到的特征变量无法穷尽这也是为什么后来连接主义逐渐占了上风大模型就是连接主义的典型代表。也就是说大模型的回答仅仅是个近似答案哪怕你问一个事实性的问题大模型给出的回答也只是它认为最大概率的那个。举例说当你问“中国的首都是哪个城市”大模型会回答“北京”但大模型本身其实没有存储类似“中国的首都是北京”这种知识。来看一下大模型回答这个问题的大致流程1、【拆】把输入的问题确切讲是大模型收到的整段提示词拆成单个汉字或词语确切讲是token。一种可能的拆解是中国、的、首都、是、哪个、城市。2、【关联】分析每组汉字的关联程度注意力机制发现“中国”和“首都”是强关联的而模型通过训练数据学习到了“中国的首都”后面几乎都跟着“北京”这种关联关系被模型以参数的形式“记”了下来。3、【预测】基于前面的关联分析模型从第一个字开始逐个预测下一个概率最高最符合关联关系的字直到形成完整句子。所以它不是“一次性想出完整答案”而是“逐字接龙”。因此大模型生成答案的过程不是在真的思考而是基于海量数据学习得来的统计分布算出下一个token的概率分布并选出最大概率的候选token不断重复这个过程直到结束。大模型的能力大模型利用概率统计的原理生成问题答案的能力也许并不稀奇稀奇的是大模型的上下文学习能力和智能涌现。上下文学习指你的问题里不用告诉大模型示例或者给出少量示例大模型就能理解你的问题。举例说模型未训练过情感分类能力却能判断出“这部电影很精彩”为积极情感。给出两三个示例中文到英文翻译它就能完成同类翻译。我们知道大模型的大主要指模型的参数量大有时也泛指训练数据量大模型层次多随着模型参数规模的不断增大模型的表示能力和学习能力也不断增强。当参数规模达到某个临界点时模型能够捕捉到更复杂的模式和关系从而出现智能涌现的现象这在小规模参数的模型中是看不到的能力。智能涌现包括多步骤的逻辑思维推理、复杂问题求解比如多约束条件下做出方案设计、超出基础信息整合的创造性能力比如剧本创作。大模型的能力缺陷及应对正因为上下文学习能力、智能涌现能力等让大家看到了AI成为超级智能的曙光。但大家也发现大模型初用起来似乎很智能但随着你用得越多就会发现大模型也在暴露更多的短板特别是你自己擅长的领域里。这些能力缺陷归根到底是因为大模型的本质是基于输入内容来计算概率并做出预测这就意味着它没办法保证答案是100%正确的。理解这一点就容易接受理解大模型当前的缺陷以及找到对应的解决办法。拆解来说有这么几类幻觉、知识不够新、表现时好时坏、Pⁿ问题。幻觉幻觉就是大模型有时候会一本正经地胡说八道。比如捏造不存在的事实、逻辑矛盾。解决办法就是把相关知识告诉大模型通过实时联网查询或者查询企业自己的知识库。对应的技术手段就是利用大模型来调用工具Function Call、MCP和搜索增强生成RAG。知识不够新大模型训练的数据有截止日期的这意味着大模型不知道在这个日期之后的知识也就是回答不了相关的问题。解决办法就是实时联网查询信息对应的技术手段就是调用工具Function Call、MCP。表现时好时坏根据前面内容我们知道大模型生成答案的过程非常依赖输入给它的上下文信息也就是提示词的完整内容。如果提示词的内容很糟糕那大模型给的答案也不会好。比如表述模棱两可不精准让大模型预测困难上下文太长了干扰大模型看到有效信息从而牺牲大模型回答的质量没有包含历史对话失去了大模型了解你的机会等等总之大模型的表现跟输入内容的质量呈正相关。可能你会想要不我通过输入面面俱到大而全的内容给大模型这样就不会遗漏信息了。很遗憾大模型能承载的输入内容的大小有限制也就是我们常说的上下文窗口的大小有限制。这意味着你需要仔细琢磨放什么内容在上下文窗口里尽量短小而有效。而这就是早期提示词工程Prompt Engineering以及最近上下文工程Context Engineering也包括智能体Agent在解决的最核心一类问题。换句话说这个问题解决的怎么样直接决定了AI使用的效果。Pⁿ问题除了以上问题大模型还有P^n问题。即每一步的成功率是P随着连续n个步骤后最终的效果只有Pⁿ。举例说单步的成功率是95%持续经过5步后就是77.37%这个效果下降会非常快。而现实中的复杂问题往往需要拆分出多个步骤多个步骤可能都会涉及调用大模型所以可想而知最后的解决效果。这个问题的解决办法会有很多最好的办法是分析任务性质不滥用大模型。能用确定性的程序或工作流解决的就不要用大模型。需要用大模型的时候尽量让每个任务聚焦职责各司其职做到最佳。这也是多智能体Multi-Agent发展的背景之一。结语现实当中我们要解决的问题中充斥着“符号主义”追求的确定和“连接主义”追求的近似。这就给我们使用AI解决现实问题提出了高的要求一方面要全面认识AI的能力和缺陷另一方面要分析现实问题的性质以免错配了问题和能力。借用德国政治家俾斯麦说过的一句很有名的话“政治是可能性的艺术”彼时他说那句话的背景正是德国统一大业成败未卜的时刻他利用务实又灵活的策略争取到了国内的民主人士、社会主义人士最大程度汇集了各方力量。此时的AI还不是万能的甚至很多场合还不能让人放心。因此“AI是可能性的艺术”。我们使用AI也是在寻找一种可能性在等待AI基础能力更强大之前需要区分确定的和不确定的用务实又不失灵活的方式与AI并肩前行。随着大模型的持续火爆各行各业纷纷开始探索和搭建属于自己的私有化大模型这无疑将催生大量对大模型人才的需求也带来了前所未有的就业机遇。**正如雷军所说“站在风口猪都能飞起来。”**如今大模型正成为科技领域的核心风口是一个极具潜力的发展机会。能否抓住这个风口将决定你是否能在未来竞争中占据先机。那么我们该如何学习大模型呢人工智能技术的迅猛发展大模型已经成为推动行业变革的核心力量。然而面对复杂的模型结构、庞大的参数量以及多样的应用场景许多学习者常常感到无从下手。作为一名热心肠的互联网老兵我决定把宝贵的AI知识分享给大家。为此我们整理了一份全面的大模型学习路线帮助大家快速梳理知识形成自己的体系。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。一、大模型全套的学习路线大型预训练模型如GPT-3、BERT、XLNet等已经成为当今科技领域的一大热点。这些模型凭借其强大的语言理解和生成能力正在改变我们对人工智能的认识。为了跟上这一趋势越来越多的人开始学习大模型希望能在这一领域找到属于自己的机会。L1级别启航篇 | 极速破界AI新时代AI大模型的前世今生了解AI大模型的发展历程。如何让大模型2C能力分析探讨大模型在消费者市场的应用。行业案例综合分析分析不同行业的实际应用案例。大模型核心原理深入理解大模型的核心技术和工作原理。L2阶段攻坚篇 | RAG开发实战工坊RAG架构标准全流程掌握RAG架构的开发流程。RAG商业落地案例分析研究RAG技术在商业领域的成功案例。RAG商业模式规划制定RAG技术的商业化和市场策略。多模式RAG实践进行多种模式的RAG开发和测试。L3阶段跃迁篇 | Agent智能体架构设计Agent核心功能设计设计和实现Agent的核心功能。从单智能体到多智能体协作探讨多个智能体之间的协同工作。智能体交互任务拆解分解和设计智能体的交互任务。10Agent实践进行超过十个Agent的实际项目练习。L4阶段精进篇 | 模型微调与私有化部署打造您的专属服务模型定制和优化自己的服务模型。模型本地微调与私有化在本地环境中调整和私有化模型。大规模工业级项目实践参与大型工业项目的实践。模型部署与评估部署和评估模型的性能和效果。专题集特训篇全新升级模块学习最新的技术和模块更新。前沿行业热点关注和研究当前行业的热点问题。AIGC与MPC跨领域应用探索AIGC和MPC在不同领域的应用。掌握以上五个板块的内容您将能够系统地掌握AI大模型的知识体系市场上大多数岗位都是可以胜任的。然而要想达到更高的水平还需要在算法和实战方面进行深入研究和探索。AI大模型学习路线图100套AI大模型商业化落地方案100集大模型视频教程200本大模型PDF书籍LLM面试题合集AI产品经理资源合集以上的AI大模型学习路线不知道为什么发出来就有点糊高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】二、640套AI大模型报告合集这套包含640份报告的合集全面覆盖了AI大模型的理论探索、技术落地与行业实践等多个维度。无论您是从事科研工作的学者、专注于技术开发的工程师还是对AI大模型充满兴趣的爱好者这套报告都将为您带来丰富的知识储备与深刻的行业洞察助力您更深入地理解和应用大模型技术。三、大模型经典PDF籍随着人工智能技术的迅猛发展AI大模型已成为当前科技领域的核心热点。像GPT-3、BERT、XLNet等大型预训练模型凭借其卓越的语言理解与生成能力正在重新定义我们对人工智能的认知。为了帮助大家更高效地学习和掌握这些技术以下这些PDF资料将是极具价值的学习资源。四、AI大模型商业化落地方案AI大模型商业化落地方案聚焦于如何将先进的大模型技术转化为实际的商业价值。通过结合行业场景与市场需求该方案为企业提供了从技术落地到盈利模式的完整路径助力实现智能化升级与创新突破。希望以上内容能对大家学习大模型有所帮助。如有需要请微信扫描下方CSDN官方认证二维码免费领取相关资源【保证100%免费】。祝大家学习顺利抓住机遇共创美好未来