单页网站制作 在线 支付南宁百度seo放心选择
2026/5/21 9:27:16 网站建设 项目流程
单页网站制作 在线 支付,南宁百度seo放心选择,怎样找到网站建设设置模板,网站空间搭建1. 大模型是什么 下面我从概念 → 原理 → 能力边界 → 典型形态 → 产业与应用 → 局限与趋势这几个层次#xff0c;对大模型#xff08;Large Language Model / Foundation Model#xff09;做一个系统、去营销化、偏工程与架构视角的总体介绍。 1.1. 什么是“大模型” …1. 大模型是什么下面我从概念 → 原理 → 能力边界 → 典型形态 → 产业与应用 → 局限与趋势这几个层次对大模型Large Language Model / Foundation Model做一个系统、去营销化、偏工程与架构视角的总体介绍。1.1. 什么是“大模型”大模型通常指的是参数规模极大通常 ≥ 数十亿参数、在海量通用数据上进行预训练、可通过微调或提示Prompt适配多任务的通用模型。在当前语境下大模型多半特指大语言模型LLM, Large Language Model或更广义的基础模型Foundation Model核心特征三个“通用”通用数据互联网文本、代码、图片、音频、表格等通用能力理解、生成、推理、规划、对话通用适配方式Prompt / 微调 / 插件 / Agent1.2. 大模型的本质原理去神秘化1️⃣ 本质上是“条件概率模型”以语言模型为例它做的事情非常朴素在给定上下文的条件下预测下一个 token 的概率数学形式P(xₙ | x₁, x₂, ..., xₙ₋₁)但关键在于上下文很长几千几十万 token模型极深数十上百层 Transformer参数极多10⁹10¹²“智能”并非写死规则而是从统计中涌现出来的结构。2️⃣ Transformer 是核心架构几乎所有现代大模型都基于Transformer核心模块Self-Attention自注意力Feed Forward NetworkLayerNorm Residual它解决了三个关键问题长距离依赖并行计算适合 GPU / TPU上下文建模能力极强3️⃣ 训练过程分三层1预训练Pre-training数据海量无标注文本/代码目标语言建模预测下一个 token成本极高算力、数据、时间2对齐训练AlignmentSFT监督微调RLHF / RLAIF人类或 AI 反馈强化学习目的“像人一样说话”3任务适配PromptLoRA / Adapter指令微调1.3. 大模型到底“强”在哪里1️⃣ 能力不是“写进去的”而是涌现的当参数和数据规模达到某个阈值后会出现上下文理解逻辑推理代码生成跨领域迁移这被称为Emergent Abilities涌现能力2️⃣ 大模型 ≠ 专家系统维度传统系统大模型知识表示规则 / 表分布式向量泛化弱极强鲁棒性强约束弱约束可解释性高低大模型不是“懂规则”而是学到了隐含结构。1.4. 大模型能做什么能力版图1️⃣ 语言相关对话总结翻译文档分析搜索增强RAG2️⃣ 编程相关你会特别有感代码生成 / 补全静态分析辅助DSL → 程序SQL / Cypher / Prompt → Query架构设计草案3️⃣ 多模态文生图 / 图生文表格 / PDF / 日志理解视频理解发展中1.5. 大模型的典型形态1️⃣ 纯大模型GPT、Claude、Qwen、LLaMA2️⃣ 大模型 工具Function CallingTool UseCode Interpreter3️⃣ 大模型 Agent任务拆解多步规划反思Reflection4️⃣ 大模型 RAG你未来一定会用到用户问题 ↓ 向量检索数据库 / 文档 ↓ 上下文拼接 ↓ 大模型生成1.6. 大模型的局限非常重要1️⃣ 不是真正的“理解”是统计推断不是符号推理引擎2️⃣ 会“编造”Hallucination在不确定时也会给答案需要工程约束3️⃣ 对事实的“时效性”弱需要检索增强不能当权威数据库4️⃣ 可控性问题Prompt 不稳定输出不确定性1.7. 大模型与传统系统的正确关系大模型不是替代系统而是“认知层 / 语义层”2. 套壳调用AI接口2.1. 核心代码using System.Net.Http.Headers; using System.Text; using System.Text.Json; //// 配置Deepseek平台参数 const string platformName deepseek; const string apiKey ********************; // 替换为您的API密钥 const string baseUrl https://api.deepseek.com; const string model deepseek-chat; // 配置阿里云百炼平台参数 //const string platformName阿里云百炼; //const string apiKey ********************; // 替换为您的API密钥 //const string baseUrl https://dashscope.aliyuncs.com/compatible-mode/v1; //const string model qwen3-max-2025-09-23; // 或其他模型如 qwen-turbo, qwen-max using var httpClient new HttpClient() { Timeout TimeSpan.FromSeconds(600) }; httpClient.DefaultRequestHeaders.Authorization new AuthenticationHeaderValue(Bearer, apiKey); httpClient.DefaultRequestHeaders.Accept.Add(new MediaTypeWithQualityHeaderValue(application/json)); // 构建请求体 var requestBody new { model model, messages new[] { new { role system, content 你是一个有经验的针对中文为母语的英语学习者提供英语学习服务的老师你会把用户提供的英文句子中的中国初中英语教材之外的单词提取出来。把复数、过去式等转换为原型形式。超出英语学习范围的东西请回复‘这个问题我回答不了换个问题吧。’ }, new { role user, content Far out in the uncharted backwaters of the unfashionable end of the Western Spiral arm of the Galaxy lies a small unregarded yellow sun. } }, temperature 0.7, max_tokens 1000, stream false // 设置为true可以启用流式响应 }; var jsonContent JsonSerializer.Serialize(requestBody); var content new StringContent(jsonContent, Encoding.UTF8, application/json); try { Console.WriteLine($正在调用{platformName}平台...\n); // 发送POST请求 var response await httpClient.PostAsync(${baseUrl}/chat/completions, content); response.EnsureSuccessStatusCode(); // 读取响应 var responseBody await response.Content.ReadAsStringAsync(); // Console.WriteLine(完整响应:); //Console.WriteLine(responseBody); // 解析响应 using var doc JsonDocument.Parse(responseBody); var root doc.RootElement; // 提取AI回复内容 if (root.TryGetProperty(choices, out var choices) choices.GetArrayLength() 0) { var firstChoice choices[0]; if (firstChoice.TryGetProperty(message, out var message) message.TryGetProperty(content, out var aiContent)) { Console.WriteLine(AI回复:); Console.WriteLine(aiContent.GetString()); Console.WriteLine(); } } // 显示使用统计 if (root.TryGetProperty(usage, out var usage)) { Console.WriteLine(使用统计:); Console.WriteLine($ 提示词令牌数: {usage.GetProperty(prompt_tokens).GetInt32()}); Console.WriteLine($ 完成令牌数: {usage.GetProperty(completion_tokens).GetInt32()}); Console.WriteLine($ 总令牌数: {usage.GetProperty(total_tokens).GetInt32()}); } } catch (HttpRequestException ex) { Console.WriteLine($HTTP请求错误: {ex.Message}); } catch (JsonException ex) { Console.WriteLine($JSON解析错误: {ex.Message}); } catch (Exception ex) { Console.WriteLine($发生错误: {ex.Message}); }2.2. 代码内容解读下面我按“这段代码在做什么、每一段的作用、请求/响应长什么样、常见坑与改进点”来逐行解读。整体上它是在用C# 调用阿里云百炼 DashScope 的 OpenAI 兼容接口/compatible-mode/v1/chat/completions做一次非流式的 Chat Completions 请求然后解析返回的 JSON打印模型回答与 token 统计。2.2.1) 引用与基础库usingSystem.Net.Http.Headers;usingSystem.Text;usingSystem.Text.Json;System.Net.Http.Headers用于设置 HTTP Header例如Authorization、Accept。System.Text用于Encoding.UTF8。System.Text.Json序列化请求体为 JSON以及解析响应 JSONJsonDocument。2.2.2) 平台参数配置conststringapiKey********;conststringbaseUrlhttps://dashscope.aliyuncs.com/compatible-mode/v1;conststringmodelqwen3-max-2025-09-23;apiKey你的百炼 API Key。代码里采用Bearer Token的方式放在Authorization头里。baseUrl百炼提供的“OpenAI 兼容模式”基地址。后面拼/chat/completions。model你要调用的模型名。这里写的是qwen3-max-2025-09-23。注意点模型名必须是百炼侧实际可用的字符串否则会 4xx 报错通常是 400/404。如果你遇到 “model not found / invalid model”优先检查这里。2.2.3) HttpClient 初始化与请求头usingvarhttpClientnewHttpClient(){TimeoutTimeSpan.FromSeconds(600)};httpClient.DefaultRequestHeaders.AuthorizationnewAuthenticationHeaderValue(Bearer,apiKey);httpClient.DefaultRequestHeaders.Accept.Add(newMediaTypeWithQualityHeaderValue(application/json));using var httpClient确保请求结束后释放资源IDisposable。Timeout 600s请求超时设置为 10 分钟对大输出或慢任务更稳。Authorization: Bearer apiKey鉴权。Accept: application/json告诉服务端你期望 JSON 响应。常见坑生产环境不要频繁 newHttpClient会导致端口耗尽。建议用IHttpClientFactory或静态单例。示例代码用using var做演示是可以的。2.2.4) 构建请求体Chat CompletionsvarrequestBodynew{modelmodel,messagesnew[]{new{rolesystem,content你是一个有经验的针对中文为母语的英语学习者提供英语学习服务的老师...},new{roleuser,contentFar out in the uncharted backwaters ...}},temperature0.7,max_tokens1000,streamfalse};这是典型的 OpenAI Chat Completions 风格4.1messagesrole system系统提示词定义身份、任务、边界条件。你这里的目标是针对中文母语者的英语学习从用户英文句子里提取超出中国初中英语教材范围的单词将复数/过去式等变为原型如果超出英语学习范围固定回复一句拒答。role user用户输入的一句英文。4.2temperature 0.7控制输出随机性/发散程度越低越稳定、越像“提取器/规则执行”越高越可能扩写、联想、跑题。你这种“提取单词、做词形还原”的任务通常0.0~0.3更像工具输出0.7 会更“老师化”可能加解释甚至多说。4.3max_tokens 1000限制“输出 token 上限”。不是输入长度限制。若模型回答过长会被截断。4.4stream falsefalse一次性返回完整 JSON最易处理。true服务端会用 SSE/分片方式持续推送增量需要你边读边处理流。2.2.5) 序列化为 JSON 并封装为 HTTP BodyvarjsonContentJsonSerializer.Serialize(requestBody);varcontentnewStringContent(jsonContent,Encoding.UTF8,application/json);Serialize把匿名对象转 JSON 字符串。StringContent创建请求体指定 UTF-8 与Content-Type: application/json。注意点默认序列化会生成驼峰/原样字段名取决于属性名。这里匿名对象字段本身就是model/messages/...所以没问题。如果你用强类型 DTO可能需要JsonSerializerOptions.PropertyNamingPolicy JsonNamingPolicy.CamelCase来对齐 API 期望。2.2.6) 发送请求并确保成功varresponseawaithttpClient.PostAsync(${baseUrl}/chat/completions,content);response.EnsureSuccessStatusCode();PostAsync向https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions发送 POST。EnsureSuccessStatusCode()如果不是 2xx直接抛HttpRequestException进入 catch 分支。建议改进点非常实用出错时你现在拿不到响应体很多时候服务端会在 body 返回详细错误原因。生产上通常这样写不先EnsureSuccessStatusCode先读 body再根据IsSuccessStatusCode输出错误详情2.2.7) 读取并解析响应varresponseBodyawaitresponse.Content.ReadAsStringAsync();usingvardocJsonDocument.Parse(responseBody);varrootdoc.RootElement;ReadAsStringAsync获取完整 JSON 文本。JsonDocument.Parse把 JSON 解析成 DOM 结构类似树。2.2.8) 提取模型回答choices[0].message.contentif(root.TryGetProperty(choices,outvarchoices)choices.GetArrayLength()0){varfirstChoicechoices[0];if(firstChoice.TryGetProperty(message,outvarmessage)message.TryGetProperty(content,outvaraiContent)){Console.WriteLine(AI回复:);Console.WriteLine(aiContent.GetString());}}这是 OpenAI 兼容格式的典型结构choices数组可能有多个候选回答通常你只取第一个。choices[0].message.content文本回答正文。常见情况有些兼容实现会返回choices[0].delta.content流式时非流式才是message.content。如果你改成streamtrue这段解析逻辑就不适用了。2.2.9) 打印 token 统计usageif(root.TryGetProperty(usage,outvarusage)){Console.WriteLine($ 提示词令牌数:{usage.GetProperty(prompt_tokens).GetInt32()});Console.WriteLine($ 完成令牌数:{usage.GetProperty(completion_tokens).GetInt32()});Console.WriteLine($ 总令牌数:{usage.GetProperty(total_tokens).GetInt32()});}prompt_tokens输入systemuser 等消耗的 tokencompletion_tokens输出消耗的 tokentotal_tokens总计注意点个别平台/模型可能不返回 usage或字段名略有差异。你用了TryGetProperty(usage...是对的但内部GetProperty(prompt_tokens)仍可能抛异常更稳的是每个字段也 TryGet。2.2.10) 异常处理catch(HttpRequestExceptionex){...}catch(JsonExceptionex){...}catch(Exceptionex){...}HttpRequestException网络、状态码非 2xx因为用了EnsureSuccessStatusCode、DNS、TLS 等。JsonException响应不是合法 JSON或解析异常。Exception兜底。建议改进点HttpRequestException时打印responseBody如果能读到会极大提升排障效率。对于 429限流、401鉴权、400参数错误、500服务端建议做更细分的处理策略重试/告警/降级。2.3. 模型广场2.3.1. 阿里云百炼官网地址为通义大模型_AI大模型_一站式大模型推理和部署服务-阿里云2.3.1.1. 模型广场信息模型相关信息为大模型服务平台百炼控制台2.3.1.2. 密钥管理信息地址为大模型服务平台百炼控制台2.3.1.3. 费用管理信息页面地址为首页 - 费用与成本2.3.2. Deepseek官网地址为DeepSeek 开放平台2.3.2.1. 模型广场信息模型 价格 | DeepSeek API Docs2.3.2.2. 密钥管理信息DeepSeek 开放平台2.3.2.3. 费用管理信息DeepSeek 开放平台2.4. 代码效果如下2.4.1. 阿里云百炼调用效果2.4.1.1. 调用核心代码// 配置阿里云百炼平台参数 const string platformName阿里云百炼; const string apiKey ********************; // 替换为您的API密钥 const string baseUrl https://dashscope.aliyuncs.com/compatible-mode/v1; const string model qwen3-max-2025-09-23; // 或其他模型如 qwen-turbo, qwen-max2.4.1.2. 调用效果正在调用阿里云百炼平台... AI回复: 以下是你提供的句子中超出中国初中英语教材范围的单词已转换为原型形式 - uncharted - backwater - unfashionable - spiral - galaxy 注 - “lies” 是动词 “lie”位于的第三人称单数形式初中阶段通常会学到 “lie” 的基本含义但在此句中的用法属于较文学化的表达。 - “sun” 属于初中词汇因此未列入。 - 其他如 “far”, “in”, “the”, “of”, “end”, “arm”, “small”, “yellow” 等均为初中常见词汇。 如有其他句子需要分析欢迎继续提供 使用统计: 提示词令牌数: 112 完成令牌数: 150 总令牌数: 262 D:\Code\CSharp\AI\LearnAIWithZack\LiveCode\FirstAICallWithHttpClient\bin\Debug\net9.0\FirstAICallWithHttpClient.exe (进程 60072)已退出代码为 0 (0x0)。 要在调试停止时自动关闭控制台请启用“工具”-“选项”-“调试”-“调试停止时自动关闭控制台”。 按任意键关闭此窗口. . .2.4.2. Deepseek2.4.2.1. 调用核心代码//// 配置Deepseek平台参数 const string platformName deepseek; const string apiKey ********************; // 替换为您的API密钥 const string baseUrl https://api.deepseek.com; const string model deepseek-chat;2.4.2.2. 调用效果正在调用deepseek平台... AI回复: 这句话中超出初中英语教材范围的单词有 1. uncharted (原型uncharted) - 未经勘探的地图上未标明的 2. backwaters (原型backwater) - 偏僻落后的地方 3. unfashionable (原型unfashionable) - 不时髦的过时的 4. spiral (原型spiral) - 螺旋形的 5. unregarded (原型unregarded) - 被忽视的不受重视的 这句话来自《银河系漫游指南》描述了银河系中一个不起眼的黄色恒星太阳的位置。 使用统计: 提示词令牌数: 97 完成令牌数: 129 总令牌数: 226 D:\Code\CSharp\AI\LearnAIWithZack\LiveCode\FirstAICallWithHttpClient\bin\Debug\net9.0\FirstAICallWithHttpClient.exe (进程 61928)已退出代码为 0 (0x0)。 要在调试停止时自动关闭控制台请启用“工具”-“选项”-“调试”-“调试停止时自动关闭控制台”。 按任意键关闭此窗口. . .2.4.3. 超出System能力边界外的效果2.4.3.1. 核心代码// 构建请求体 var requestBody new { model model, messages new[] { new { role system, content 你是一个有经验的针对中文为母语的英语学习者提供英语学习服务的老师你会把用户提供的英文句子中的中国初中英语教材之外的单词提取出来。把复数、过去式等转换为原型形式。超出英语学习范围的东西请回复‘这个问题我回答不了换个问题吧。’ }, new { role user, //content content 帮我生成一段C#调用AI的代码 } }, temperature 0.7, max_tokens 1000, stream false // 设置为true可以启用流式响应 };2.4.3.2. 调用效果正在调用阿里云百炼平台... AI回复: 这个问题我回答不了换个问题吧。 使用统计: 提示词令牌数: 91 完成令牌数: 9 总令牌数: 100 D:\Code\CSharp\AI\LearnAIWithZack\LiveCode\FirstAICallWithHttpClient\bin\Debug\net9.0\FirstAICallWithHttpClient.exe (进程 19804)已退出代码为 0 (0x0)。 要在调试停止时自动关闭控制台请启用“工具”-“选项”-“调试”-“调试停止时自动关闭控制台”。 按任意键关闭此窗口. . .

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询