2026/4/6 9:14:31
网站建设
项目流程
html5手机网站分辩率,网络舆情管理,wordpress手机号码登录插件,建设商务网站的步骤吴恩达2023年11月推出的面向普通人的AI入门级教程 Generative AI for everyone的第八节#xff1a;AI能做什么和不能做什么以及AI的局限#xff08;What LLMs can and cannot do#xff09;。以下相关文字内容和双语字幕视频#xff08;文末#xff09;#xff1a;
『 生…吴恩达2023年11月推出的面向普通人的AI入门级教程 Generative AI for everyone的第八节AI能做什么和不能做什么以及AI的局限What LLMs can and cannot do。以下相关文字内容和双语字幕视频文末『 生成式 AI 是一项了不起的技术但它并非万能。在本视频中我们将仔细研究 LLM 能做什么和不能做什么。我们将从我常用的、对LLM能做什么的思维模型将LLM假设成一个刚毕业的大学生开始。之后我们一起来看看 LLM 的一些具体局限性。理解这些局限性可以降低你因试图将它们用于不擅长的任务而受挫的可能性。那么让我们开始吧。一、LLM能做什么一个有用的思维框架如果你想弄清楚提示 LLM 能做什么我有一个有用的思维框架我会问自己一个刚毕业的大学生仅按照提示词prompt能否完成你想要的任务例如一个刚毕业的大学生能否按照指示阅读电子邮件以确定该邮件是否为投诉我认为一个刚毕业的大学生能做到而且能做得很好。或者一个刚毕业的大学生能否阅读对餐厅的评论来判断它是客户的积极情绪还是消极情绪我想他们也能做得很好。用提示词prompt要求 LLM 完成任务也是如此。这里有另外的一个例子一个刚毕业的大学生是否可以在没有任何你公司运营信息的情况下撰写关于公司的新闻稿嗯这个刚毕业的大学生才刚毕业他们才刚认识你对你的业务一无所知。所以他们能做的最好的事情可能就是写一篇非常普通且不太令人满意的新闻稿。但另一方面如果你向他提供更多关于你的业务和运营的背景信息那么我们现在可以问鉴于基本的背景信息这个刚毕业的大学生能否撰写新闻稿我认为他们或许能够做得相当好大型语言模型也是如此。可以将LLM简单类比为一个刚毕业的大学生。将这个“刚毕业的大学生”想象成拥有大量的背景知识了解很多互联网上的常识但必须在无法访问网络搜索引擎的情况下完成这项任务并且“他”对你或你的业务一无所知。为了简单清楚起见这个思维模型就是想象一个刚毕业的大学生在没有任何培训的情况下完成任务。每次你新开一个对话窗口用提示词给LLM下指令LLM 实际上并不记得之前的对话。所以就好像你为每个任务都找到了一个不同的刚毕业的大学生。因此你无法随着时间的推移针对你的业务细节或你希望的写作风格来训练他们。询问刚毕业的大学生能做什么的这条经验法则并不完美。有些事情大学毕业生可以做而其他人做不到反之亦然。但这是思考LLM能做什么和不能做什么的一个有用的起点。虽然我们这节课将专注于此幻灯片上提示的 LLM 可以做什么但下周当我们谈论生成式 AI 项目时我们将讨论一些稍微强大的技术这些技术可能会扩展你使用生成式 AI 可以做的事情超出这个刚毕业的大学生的概念。二、LLM的局限性现在让我们看看 LLM 的一些更具体的局限性。1.首先是知识截止日期。LLM 对世界的了解在训练时就被冻结了。更准确地说在 2022 年 1 月之前在互联网数据上训练的模型将没有关于2022 年 1 月之后的任何信息。因此给定这样的模型如果你要问它 2022 年票房最高的电影是什么它会说它不知道。2023 年 7 月左右有研究实验室声称发现了一种名为 LK99 的室温超导体。你可能在一些新闻中看到过这张照片。事实证明这种说法不太正确。但是如果你要问 LLM 关于 LK99 的问题即使它在新闻中被广泛报道如果 LLM 仅从截至 2022 年 1 月的互联网文本中学习它将对此一无所知。这就是所谓的知识截止日期即 LLM 仅了解世界到某个时间点为止的事情即它接受训练的时间或上次从互联网下载的文本用于 LLM 训练的时间。2.LLM 的第二个局限性是它们有时会凭空捏造事实我们称之为幻觉。我发现如果我要求 LLM 给我一些历史名人的名言它们经常会编造这些名言。例如如果你问它给我三句莎士比亚写的关于 Beyonce 的名言。由于莎士比亚在 Beyonce 之前很久就去世了所以莎士比亚不可能说过任何关于 Beyonce 的事情。但是 LLM 会自信地回复你一些这类“名言”。或者如果你要求它列出加利福尼亚州审理的关于 AI 的法院案件它可能会给出看起来很权威的答案。但事实证明第一个案例是真实的确实有 Waymo 与 Wombra 的案件但我找不到 Incasol 与 Chevron 的案件。所以第二个案例是幻觉。有时LLM会以非常自信、权威的口吻产生幻觉或捏造事物。这可能会误导人们认为这种捏造的东西实际上可能是真实的。幻觉可能会产生严重的后果。有一位律师不幸地使用 ChatGPT 为法律案件生成文本并将其提交给法庭但他并不知道自己提交给法庭的是一份包含大量虚构案件的法律文件。在这篇《纽约时报》的头条新闻中我们看到在这个令人难堪的法庭听证会上依赖 AI 的律师说他不明白聊天机器人会误导他。这位律师因提交包含虚构内容的诉讼文件而受到制裁。因此如果你将它用于具有实际意义的文件那么了解它的局限性非常重要。3.LLM 还存在一个技术限制即输入长度即提示的长度是有限的它能生成的文本的输出长度也是有限的。许多 LLM 最多只能设置几千个单词的提示词你可以提供的上下文总量是有限的。因此如果你要求它总结一篇论文而该论文的长度远远超过此输入长度限制则 LLM 可能会拒绝处理该输入。在这种情况下你可能需要一次提供论文的一部分并要求它一次总结论文的各个部分。或者有时你也可以找到具有更长输入限制长度的 LLM。从技术上讲LLM 对所谓的上下文长度有限制。实际上上下文长度是对总输入加输出大小的限制。当我使用 LLM 时我很少让它生成如此多的输出以至于我还没遇到输出长度的限制。但是如果我的提示词内容有很多我有时会遇到输入长度的限制比方我想给它数千字的上下文。4.生成式 AI 的一个重要限制是它们目前无法很好地处理结构化数据。我所说的结构化数据是指表格数据例如你可能存储在 Excel 或 Google Sheets 电子表格中的数据。比方这是一个房价表其中包含房屋面积平方英尺和房屋价格的数据。如果你将所有这些数字输入到 LLM 中然后问它我有一栋 1,000 平方英尺的房子你认为一个好的价格是多少它不太擅长这个。相反如果你将大小称为输入 A将价格称为输出 B那么监督学习将是一种更好的技术可以用来估计价格作为大小的函数。这是结构化数据表格数据的另一个示例显示了不同的访问者可能何时访问你的网站你向他们提供了多少产品以及他们是否购买了该产品。同样监督学习将是一种比尝试将所有这些时间和价格和购买信息复制粘贴到大型语言模型的提示中更好的技术。与结构化数据相反生成式 AI 往往最适合处理非结构化数据。结构化数据是指你存储在电子表格中的表格数据而非结构化数据是指文本、图像、音频、视频。生成式 AI 适用于所有这些类型的数据尽管影响最大这就是为什么我们将主要关注本课程中的文本数据。5.最后大型语言模型可能会输出偏见并且有时会输出有毒或其他有害的言论。大型语言模型是在互联网上的文本上训练的。不幸的是互联网上的文本可以反映社会中存在的偏见。因此如果你要 LLM完成句子比方外科医生走到停车场拿出。LM 可能会输出“他的车钥匙”或者你说 护士走到停车场拿出它可能会说“她的电话”。在这种情况下LLM 假设外科医生是男性护士是女性。然而我们知道显然外科医生和护士可以是任何性别。因此如果你在应用程序中使用 LLM而这些偏见可能会造成伤害我建议在使用提示和应用 LLM 时要小心以确保我们不会助长这些不良偏见注米国的政治正确也夸张了。最后LLM偶尔也会输出有害或其他不良言论。例如LLM有时会教人们如何做一些不良的甚至是非法的行为。幸运的是所有主要的语言模型提供商都在努力提高这些模型的安全性因此随着时间的推移大多数模型都变得更加安全。如果你使用主要 LLM 提供商的网络界面实际上随着时间的推移让他们输出这些类型的有害言论变得越来越难。以上总结了提示 LLM 可以做什么和不能做什么。正如我所提到的下周我们将研究一些克服这些限制的技术使 LLM 的功能更加广泛和强大。但首先让我们看看一些关于提示 LLM 的技巧。我希望我在下一个视频中分享的技巧能立即对你使用 LLM 有所帮助。下个视频见。』如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】