2026/5/21 15:42:54
网站建设
项目流程
长沙企业网站建设分公司,如何为网站做seo体检,建设银行租房网站湖北,263企业邮箱pop3设置随着大规模语言模型#xff08;LLM#xff09;在性能、成本和应用前景上的快速发展#xff0c;越来越多的团队开始探索如何自主训练LLM模型。然而#xff0c;是否从零开始训练一个LLM#xff0c;并非每个组织都适合。本文将根据不同的需求与资源#xff0c;帮助你梳理如何…随着大规模语言模型LLM在性能、成本和应用前景上的快速发展越来越多的团队开始探索如何自主训练LLM模型。然而是否从零开始训练一个LLM并非每个组织都适合。本文将根据不同的需求与资源帮助你梳理如何在构建AI算法应用时做出合适的决策。训练LLM的三种选择https://wandb.ai/site/articles/training-llms/在构建AI算法应用时首先需要决定是使用现有的商用API还是开源模型或者选择完全自主训练一个LLM。每种选择有其独特的优势与劣势。选项一使用商用LLM API这种方法最适合缺乏深厚技术背景的团队或者希望尽快构建应用的组织。商用API的优点在于无需进行繁琐的模型训练团队可以直接使用现成的、高性能的LLM服务来执行推理任务。它还允许使用最先进的LLM技术节省了大量的开发时间与成本。通过API你只需为推理计算付费且不需要处理数据集和模型训练过程中的复杂性。然而这种方法也有明显的缺点。首先成本问题是一个关键考量高频次的推理任务或微调可能导致不小的费用。其次数据隐私和合规性也是商用API的限制之一某些行业如医疗健康、金融等可能无法将敏感数据上传至外部服务。此外商用API的定制性较差模型微调的空间有限如果需求有所变化灵活性较低。选项二使用开源LLM与商用API相比开源LLM提供了更多的定制和控制权。你可以基于开源模型进行微调或者在此基础上继续进行预训练。这种方法适合有一定技术实力的团队尤其是当项目的数据隐私要求较高时。使用开源模型你可以完全控制训练数据和模型的演化方向避免了商用API服务带来的依赖风险。然而开源LLM的性能通常落后于商用模型有时需要几个月甚至更长时间才能赶上最新的商业技术。训练和微调开源模型也需要投入较大的计算资源与专业知识因此时间和资源的成本不可忽视。选项三完全自主训练LLM当组织拥有强大的技术团队并且预算充足时完全从零开始训练一个LLM可以提供最大的灵活性。自主训练不仅可以让你定制模型架构如选择不同的tokenizer、调整模型维度、头数、层数等还可以完全控制训练数据以最大限度地减少模型偏差和毒性问题。这种方法适合那些将LLM作为核心技术和竞争优势的公司尤其是在数据和算法方面有显著创新的情况下。但与此同时完全自主训练LLM也是最昂贵且风险较高的选择。模型训练需要大量的计算资源和跨领域的技术能力若不慎可能导致训练失败尤其是在训练的后期错误难以修正。而且与开源模型相比完全从头开始训练需要更为庞大的高质量、多样化的数据集否则难以获得具备广泛能力的模型。规模法则Scaling Lawshttps://wandb.ai/site/articles/training-llms/the-scaling-laws/LLM规模的历史演变自2020年OpenAI首次提出LLM规模法则以来关于如何提高模型性能的观点经历了显著的变化。OpenAI的研究表明增加模型的规模比增加数据量更为重要。这一理论在一定时间内是成立的尤其是在模型训练初期。然而随着研究的深入尤其是2022年DeepMind提出的新见解关于模型规模和数据规模的关系发生了根本性的转变。DeepMind提出之前的LLM模型训练还远远不够它们的数据量和计算资源未能达到最佳水平。具体来说现有的LLM模型并没有在足够的数据上进行充分的训练。这一观点通过DeepMind提出的模型——Chinchilla得到了验证。Chinchilla的规模只有Gopher模型的四分之一但它的训练数据量却是Gopher的4.6倍。在这种缩小模型规模的情况下Chinchilla却取得了更好的性能超过了Gopher和其他同类模型。新的规模法则模型大小与数据量的平衡基于Chinchilla的实验结果DeepMind提出了一个新的规模法则模型大小和训练数据的大小应该按相同的比例增加才能获得最佳的模型表现。如果你的计算资源增加了10倍你应该将模型的大小增加3.1倍并且数据量也要增加3.1倍如果计算资源增加了100倍模型和数据的大小都应当增加10倍。这种方式能够更好地平衡计算资源、模型复杂度和训练数据量从而实现更优的训练效果。简而言之当前的最佳实践建议在选择训练数据集时首先要根据数据的大小来确定最适合的模型规模。DeepMind称为Chinchilla-Optimal模型的训练方法是根据训练数据量来优化模型的大小。对于数据规模和模型规模的组合最佳做法是基于训练计算预算和推理延迟需求来做出决策。过小或过大的模型何时调整在规模法则中存在着一个最优点即模型的大小和训练数据的大小之间的最佳平衡。当模型的大小太小即处于曲线的左侧时增加模型的规模并减少数据量的需求是有益的。而当模型太大处于曲线的右侧时减少模型的规模并增加数据量反而会带来更好的效果。最佳的模型通常位于曲线的最低点——即Chinchilla-Optimal点。在实际训练过程中你可能会面临以下几种情形**模型过小**如果模型规模过小而你有充足的训练数据那么扩展模型的规模并且增加数据量会提升性能。**模型过大**如果模型规模过大且数据量相对不足则缩小模型规模并增加数据量可能会带来更好的性能提升。训练FLOPs和训练tokens的最佳配置DeepMind的研究还提供了一些数据展示了不同模型规模下训练所需的计算量FLOPs和训练tokens的最优配置。这些数据为开发者提供了一个参考框架帮助他们根据实际计算资源和数据集的规模选择最适合的模型。通过这些数据你可以更清晰地理解不同大小的模型在计算资源与训练数据的需求之间的平衡。训练FLOPs每次操作所需的浮点运算数与训练tokens经过token化处理后的训练数据量之间的关系能够帮助你更好地预测训练的需求合理分配计算资源。如何应用这些Scaling Laws到训练中理解了这些理论后如何在实际训练中应用这些Scaling Laws呢以下是几个关键步骤**选择合适的数据集**首先需要明确你的应用场景和数据集。如果数据集很小可能不适合训练一个大规模的模型如果数据集庞大可以考虑训练更大规模的模型以充分利用数据的潜力。**确定模型规模**根据数据集的大小和计算预算使用Chinchilla-Optimal方法来决定模型的规模。确保你的模型规模与数据量之间保持一致避免过度或不足的训练。**计算资源预算**在决定模型规模和数据量之后你需要确保有足够的计算资源来支持训练过程。这涉及到计算能力的选择——从硬件设备如TPU或GPU到实际训练过程中的分布式计算能力。**推理延迟的考虑**如果你的应用需要低延迟推理模型的大小与推理时间之间的关系也是需要考虑的。通常大模型的推理速度较慢因此可能需要对模型进行优化或采用更小的模型。**持续监控与调优**训练过程中需要实时监控模型的性能确保在训练的各个阶段都保持最优的计算资源和数据规模配置。如果发现性能没有预期的提升可以调整模型的规模或增加数据量进行优化。高效使用硬件资源https://wandb.ai/site/articles/training-llms/hardware/数据并行Data Parallelism数据并行是处理无法装入单一计算节点的数据集时最常见的方式。具体来说数据并行将训练数据划分为多个数据分片shards并将这些分片分配到不同的计算节点上。每个节点在其本地数据上训练一个子模型然后与其他节点通信定期合并它们的结果从而获得全局模型。数据并行的参数更新可以是同步的或异步的。同步数据并行中各个节点会在每个步骤后同步梯度并将更新后的模型参数发送回所有节点。而异步数据并行则允许各个节点在不同步的情况下更新模型通常可以加速训练但也可能引入更多的不一致性导致模型收敛较慢。数据并行的优点在于它提高了计算效率并且相对容易实现。然而缺点在于反向传播时需要将整个梯度传递给所有其他GPU这会导致较大的内存开销。同时模型和优化器的复制会占用较多的内存降低内存效率。张量并行Tensor Parallelism张量并行是将大模型的张量运算分割到多个设备上进行的一种并行方式。不同于数据并行在数据维度上的划分张量并行通过分割模型的不同层或张量来并行化计算。每个GPU只计算模型的一部分例如一层神经网络或一个张量片段然后通过跨设备通信将其结果汇总。张量并行能够有效解决单个GPU内存不足以加载完整模型的问题但它的挑战在于跨设备的通信开销较大。随着模型尺寸的增加模型并行的开销也随之增加这要求更加高效的算法和硬件架构。Megatron-LM是张量并行的一个典型应用通过将模型的张量分布到多个GPU上从而能够训练大规模模型如GPT-3、PaLM等。结合数据并行和张量并行的方式模型的训练效率和规模都得到了显著提升。流水线并行Pipeline Parallelism流水线并行是一种将模型的不同阶段分布到多个设备上进行训练的策略。不同于数据并行和张量并行流水线并行将模型划分为不同的部分每个设备只处理某个阶段的任务并将输出传递给下一个阶段的设备。这样多个设备可以并行工作每个设备处理不同的任务但最终目标是加速模型的训练过程。例如如果一个模型有5个阶段流水线并行会将每个阶段分配到一个GPU上允许GPU并行工作每个GPU处理模型的一部分任务。这种方法在长时间的训练过程中非常有效尤其是在非常深的网络架构中。流水线并行的挑战在于需要有效地同步不同阶段之间的数据流而且每个设备只能在前一个设备完成计算后才开始工作这可能会带来延迟。然而通过合理设计流水线延迟可以降到最低从而提高训练效率。训练优化策略在训练LLM时除了并行化策略硬件和算法的优化同样至关重要。以下是一些重要的训练优化策略梯度累积Gradient Accumulation梯度累积是一种将训练批次分割为微批次并在每个微批次的训练过程中累积梯度直到所有微批次完成后再进行一次参数更新的技术。这种方式可以有效降低内存需求并使得大批次的训练成为可能从而加速模型训练。混合精度训练Mixed Precision Training混合精度训练使用16位和32位浮动精度的结合来训练神经网络。通过使用低精度的计算可以显著减少内存占用和计算开销同时又不会损失太多的模型精度。这种技术在处理大规模模型时尤其有用。动态学习率Dynamic Learning Rates在训练过程中根据模型的表现动态调整学习率可以提高收敛速度并减少过拟合的风险。常见的学习率调整策略包括基于训练轮次的衰减、基于梯度的自适应调整等。模型剪枝与蒸馏Model Pruning and Distillation在训练后期通过剪枝减少不必要的模型参数或者通过蒸馏技术将大模型的知识转移到小模型中从而提升推理效率。这些技术可以帮助减轻大模型部署的资源压力并加速推理。数据集收集https://wandb.ai/site/articles/training-llms/dataset-collection/“坏数据导致坏模型。” 这一点在训练大型语言模型LLM时尤为重要。高质量、具有高多样性和大规模的训练数据集不仅能提高下游任务的模型表现还能加速模型的收敛过程。数据集的多样性对于LLM尤其关键。这是因为数据的多样性能有效提升模型在跨领域的知识涵盖能力从而提高其对各种复杂任务的泛化能力。通过训练多样化的示例能够增强模型在处理各种细微任务时的表现。在数据集收集过程中一般的数据可以由非专家收集但对于特定领域的数据通常需要由专业领域的专家SMEsSubject Matter Experts来进行收集和审查。NLP工程师在这个阶段也应当深度参与原因在于他们熟悉LLM如何“学习表示数据”的过程因此能发现专家可能遗漏的数据异常或缺口。专家和NLP工程师之间的协作非常重要可以确保数据的质量和代表性。数据预处理https://wandb.ai/site/articles/training-llms/dataset-pre-processing/数据采样Data Sampling某些数据组件可以进行过采样up-sampling以获得更平衡的数据分布。例如一些研究会对低质量的数据集如未过滤的网页爬取数据进行下采样down-sampling。而其他研究则会根据模型目标对特定领域的数据进行过采样。对于预训练数据集而言其组成通常来源于高质量的科学资源例如学术论文、教科书、讲义和百科全书。数据集的质量通常非常高并且会根据任务需要进行特定的筛选比如使用任务特定的数据集来帮助模型学习如何将这些知识融入到新的任务上下文中。数据清理Data Cleaning通常在训练之前需要对数据进行清理和重新格式化。一些常见的清理步骤包括去除样板文本boilerplate text、去除HTML代码或标记。对于某些项目还需要修复拼写错误、处理跨领域的同形异义词homographs或者去除有偏见或有害的言论以提高模型的表现。非标准文本组件的处理Handling Non-Standard Textual Components在某些情况下将非标准的文本组件转换成标准文本非常重要。例如emoji表情可以转换为其对应的文本表示❄️可以转换为“snowflake”。这种转换通常可以通过编程实现。数据去重Data Deduplication一些研究者发现去重训练数据能够显著提高模型的表现。常用的去重方法包括局部敏感哈希LSH, Locality-Sensitive Hashing。通过这种方法可以识别并移除重复的训练数据从而减少模型学习到的冗余信息。预训练https://wandb.ai/site/articles/training-llms/pre-training-steps/训练一个数十亿参数的LLM大规模语言模型通常是一个高度实验性的过程充满了大量的试验与错误。通常团队会从一个较小的模型开始确保其具有潜力然后逐步扩展到更多的参数。需要注意的是随着模型规模的扩大会出现一些在训练小规模数据时不会遇到的问题。模型架构为了减少训练不稳定的风险实践者通常会选择从流行的前身模型如GPT-2或GPT-3中借鉴架构和超参数并在此基础上做出调整以提高训练效率、扩展模型的规模包括深度和宽度并增强模型的性能。正如前面提到的预训练过程通常涉及大量的实验以找到模型性能的最佳配置。实验可以涉及以下内容之一或全部权重初始化Weight Initialization位置嵌入Positional Embeddings优化器Optimizer激活函数Activation学习率Learning Rate权重衰减Weight Decay损失函数Loss Function序列长度Sequence Length层数Number of Layers注意力头数Number of Attention Heads参数数量Number of Parameters稠密与稀疏层Dense vs. Sparse Layers批量大小Batch SizeDropout等。通常人工试错与自动超参数优化HPO相结合用来找到最优的配置组合。常见的超参数包括学习率、批量大小、dropout率等。超参数搜索是一个高昂的过程尤其是对于数十亿参数的模型来说往往过于昂贵不容易在完整规模下进行。通常会根据先前的小规模实验结果和已发布的工作来选择超参数而不是从零开始。此外某些超参数在训练过程中也需要进行动态调整以平衡学习效率和训练收敛。例如**学习率Learning Rate**在训练的早期阶段可以线性增加之后再衰减。**批量大小Batch Size**通常会从较小的批量大小开始逐步增加。硬件故障与训练不稳定**硬件故障Hardware Failure**在训练过程中计算集群可能会发生硬件故障这时需要手动或自动重启训练。在手动重启时训练会暂停并进行一系列诊断测试来检测有问题的节点。标记为有问题的节点应该被隔离然后从最后保存的检查点继续训练。**训练不稳定Training Instability**训练不稳定性是一个根本性的挑战。在训练过程中超参数如学习率和权重初始化直接影响模型的稳定性。例如当损失值发散时降低学习率并从较早的检查点重新启动训练可能会帮助恢复训练并继续进行。此外模型越大训练过程中发生损失峰值loss spikes的难度也越大这些峰值可能在训练的后期出现并且不规则。尽管没有很多系统性的方法来减少这种波动但以下是一些行业中的最佳实践批量大小Batch Size通常使用GPU能够支持的最大批量大小是最好的选择。批量归一化Batch Normalization对mini-batch中的激活进行归一化可以加速收敛并提高模型性能。学习率调度Learning Rate Scheduling高学习率可能会导致损失波动或发散从而导致损失峰值。通过调整学习率的衰减逐步减小模型参数更新的幅度可以提高训练稳定性。常见的调度方式包括阶梯衰减step decay**和**指数衰减exponential decay。权重初始化Weight Initialization正确的权重初始化有助于模型更快收敛并提高性能。常见的方法包括随机初始化、高斯噪声初始化以及Transformers中的T-Fixup初始化。模型训练起点Model Training Starting Point使用在相关任务上预训练过的模型作为起点可以帮助模型更快收敛并提高性能。正则化Regularization使用dropout、权重衰减weight decay和L1/L2正则化等方法可以减少过拟合并提高模型的泛化能力。数据增强Data Augmentation通过对训练数据应用转换可以帮助模型更好地泛化减少过拟合。训练过程中热交换Hot-Swapping在训练过程中根据需要更换优化器或激活函数帮助解决出现的问题。模型评估https://wandb.ai/site/articles/training-llms/model-evaluation/通常预训练的模型会在多种语言模型数据集上进行评估以评估其在逻辑推理、翻译、自然语言推理、问答等任务中的表现。机器学习领域的实践者已经对多种标准评估基准达成共识。另一个评估步骤是n-shot学习。它是一个与任务无关的维度指的是在推理时提供给模型的监督样本示例数量。n-shot通常通过“提示prompting”技术来提供。评估通常分为以下三类零样本Zero-shot不向模型提供任何监督样本进行推理任务的评估。一-shotOne-shot类似于少样本few-shot但n1表示在推理时向模型提供一个监督样本。少样本Few-shot评估中向模型提供少量监督样本例如提供5个样本 - 5-shot。偏见与有害语言https://wandb.ai/site/articles/training-llms/bias-and-toxicity/在基于网页文本训练的大规模通用语言模型中存在潜在的风险。这是因为人类本身有偏见这些偏见会通过数据传递到模型中模型在学习这些数据时也会继承这些偏见。除了加剧或延续社会刻板印象之外我们还需要确保模型不会记住并泄露私人信息。仇恨言论检测Hate Speech Detection社会偏见检测Social Bias Detection有害语言生成Toxic Language Generation对话安全评估Dialog Safety Evaluations截至目前大多数对现有预训练模型的分析表明基于互联网训练的模型会继承互联网规模的偏见。此外预训练模型通常容易生成有害语言即使给出相对无害的提示且对抗性提示也容易找到。那么如何修复这些问题呢以下是一些在预训练过程中以及训练后缓解偏见的方法训练集过滤Training Set Filtering训练集修改Training Set Modification训练后偏见缓解方法提示工程Prompt Engineering微调Fine-tuning输出引导Output SteeringInstruction Tuning指令微调https://wandb.ai/site/articles/training-llms/instruction-tuning/假设我们现在拥有一个预训练的通用大型语言模型LLM。如果我们之前的工作做得足够好那么模型已经能够在零-shot和少量-shot的情况下执行一些特定领域的任务。然而尽管零-shot学习可以在某些情况下有效许多任务如阅读理解、问答、自然语言推理等中零-shot学习的效果通常要逊色于少量-shot学习的表现。一个可能的原因是在没有少量示例的情况下模型很难在格式与预训练数据不同的提示下取得好的表现。为了应对这个问题我们可以使用指令微调Instruction Tuning。指令微调是一种先进的微调技术它通过对预训练模型进行微调使其能更好地响应各种任务指令从而减少在提示阶段对少量示例的需求即显著提高零-shot性能。指令微调在2022年大受欢迎因为这一技术能显著提高模型性能同时不会影响其泛化能力。通常预训练的LLM会在一组语言任务上进行微调并通过在微调过程中未见过的任务来评估其泛化能力和零-shot能力。与预训练–微调和提示的比较**预训练–微调Pretrain–Finetune**在预训练模型的基础上进行特定任务的微调。模型通常在特定领域数据上进行微调能显著提升该任务的性能但对其他任务的泛化能力可能较差。**提示Prompting**使用适当的提示词prompt引导模型执行特定任务但在某些任务中如阅读理解和问答零-shot学习的效果往往较差。**指令微调**通过对模型进行全面微调使其能够更加有效地理解和执行各种任务指令从而减少了对少量示例的依赖并显著提升零-shot性能。思维链Chain-of-Thought在指令微调中的作用思维链是一种技术通过这种方式模型在执行任务时会显式地推理每一个步骤帮助模型更好地理解问题的背景并给出合理的推理过程。对于某些复杂的推理任务使用思维链的示例可以显著提高模型的推理能力并提升其在这些任务上的表现。在指令微调过程中若包含思维链示例例如步骤分解、推理过程的写作等模型会学会按照逻辑推理的步骤逐步完成任务而非直接给出答案。这对像数学推理、常识推理等复杂任务尤其有效。**提高零-shot能力**通过对预训练模型进行指令微调模型能更好地理解和执行未见过的任务提升其在零-shot任务上的表现。**泛化性强**与只针对特定任务微调的模型相比指令微调的模型具有更强的泛化能力能够适应多种下游任务。**减少对少量示例的需求**经过指令微调的模型在零-shot和少-shot任务中表现更为优秀减少了对示例输入的依赖。强化学习与人类反馈 (RLHF)https://wandb.ai/site/articles/training-llms/rlhf/RLHFReinforcement Learning with Human Feedback 是一种在指令微调的基础上通过引入人类反馈来进一步提升模型与用户期望对齐的技术。预训练的LLM大型语言模型通常会表现出一些不良行为例如编造事实、生成偏见或有毒的回复或者由于训练目标和用户目标之间的错位未能按照指令执行任务。RLHF 通过利用人类反馈来对模型的输出进行精细调整从而解决这些问题。例如OpenAI 的 InstructGPT 和 ChatGPT 就是 RLHF 的实际应用案例。InstructGPT 是在 GPT-3 上使用 RLHF 进行微调的而 ChatGPT 基于 GPT-3.5 系列这些模型在提升真实度和减少有毒输出方面取得了显著进展同时性能回归也称为“对齐税”保持在最低水平。以下是 RLHF 流程的概念图展示了三个主要步骤监督微调SFT对预训练模型进行指令微调。奖励模型RM训练通过人类反馈训练奖励模型。通过近端策略优化PPO进行强化学习使用奖励模型优化模型的行为策略。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”