重庆网站建设 cqhtwl服装公司做哪个网站-绵阳市网站建设公司-Seo优化

重庆网站建设 cqhtwl服装公司做哪个网站

2026/5/21 11:31:17 网站建设项目流程

重庆网站建设 cqhtwl,服装公司做哪个网站,手机版电子商务网站开发,开发公司工程部管理流程Music Transformer 实际数据流转示例让我通过一个具体的音乐片段来展示整个 Music Transformer 的数据流转过程。实际示例#xff1a;处理一段简单的钢琴旋律原始输入#xff1a;C大调简单旋律音符1: C4 (音高60), 时长0.5秒, 力度80 音符2: E4 (音高64), 时长0.5秒, 力度…Music Transformer 实际数据流转示例让我通过一个具体的音乐片段来展示整个 Music Transformer 的数据流转过程。实际示例处理一段简单的钢琴旋律原始输入C大调简单旋律音符1: C4 (音高60), 时长0.5秒, 力度80 音符2: E4 (音高64), 时长0.5秒, 力度80 音符3: G4 (音高67), 时长0.5秒, 力度80 音符4: C5 (音高72), 时长1.0秒, 力度90 休止符: 0.5秒音符5: G4 (音高67), 时长0.5秒, 力度75 音符6: E4 (音高64), 时长0.5秒, 力度75 音符7: C4 (音高60), 时长1.0秒, 力度85第一阶段原始 MIDI 到 NoteSequence1.1 MIDI 文件读取# 输入 MIDI 文件: simple_melody.mid # 读取后的 NoteSequence 对象: note_sequence { id: simple_melody_001 filename: simple_melody.mid # 音符信息 notes { pitch: 60 # C4 start_time: 0.0 end_time: 0.5 velocity: 80 instrument: 0 program: 0 } notes { pitch: 64 # E4 start_time: 0.5 end_time: 1.0 velocity: 80 instrument: 0 program: 0 } notes { pitch: 67 # G4 start_time: 1.0 end_time: 1.5 velocity: 80 instrument: 0 program: 0 } notes { pitch: 72 # C5 start_time: 1.5 end_time: 2.5 velocity: 90 instrument: 0 program: 0 } # ... 其余音符 # 元信息 total_time: 4.0 tempos { qpm: 120.0 } time_signatures { numerator: 4 denominator: 4 } }第二阶段数据预处理和清洗2.1 应用延音踏板效果# apply_sustain_control_changes 处理 # 假设 MIDI 中有踏板控制信息 # 处理后可能延长某些音符的结束时间 # 处理前: note.pitch60, start0.0, end0.5 # 处理后 (如果踏板被按下): note.pitch60, start0.0, end0.7 # 结束时间延长2.2 清理控制变化信息# del control_changes[:] 清理 # 移除所有控制变化信息简化数据 # 原来的 control_changes 字段被清空 # 处理前 note_sequence { notes { ... } control_changes { control_number: 64 # 延音踏板 control_value: 127 # 踩下 time: 0.0 } control_changes { control_number: 64 control_value: 0 # 抬起 time: 2.0 } } # 处理后 note_sequence { notes { # 音符已经被踏板效果处理过结束时间延长 } control_changes { } # 清空控制变化信息 }第三阶段数据增强3.1 时间拉伸 (1.05倍)# stretch_note_sequence(sequence, 1.05) # 所有时间乘以 1.05 处理前: note.pitch60, start0.0, end0.5 note.pitch64, start0.5, end1.0 处理后: note.pitch60, start0.0, end0.525 # 0.5 * 1.05 note.pitch64, start0.525, end1.05 # 1.0 * 1.053.2 音高转置 (2半音)# 在 Score2PerfMaestroLanguageUncroppedAug 中定义 property def stretch_factors(self): return [0.95, 0.975, 1.0, 1.025, 1.05] # 5种不同的拉伸因子 # 这意味着每首原始音乐会被处理成5个不同速度的版本 # 0.95倍 (加快5%) - 更急促的感觉 # 0.975倍 (加快2.5%) - 稍微加快 # 1.0倍 (原始速度) - 标准版本 # 1.025倍 (放慢2.5%) - 稍微放缓 # 1.05倍 (放慢5%) - 更从容的感觉 # transpose_note_sequence(sequence, 2) # 所有音高加2 处理前: note.pitch60 # C4 note.pitch64 # E4 note.pitch67 # G4 处理后: note.pitch62 # D4 note.pitch66 # F#4 note.pitch69 # A4第四阶段转换为性能事件序列4.1 量化处理# quantize_note_sequence_absolute(ns, steps_per_second100) # 每秒100个时间步原始时间: note.start_time0.0, end_time0.525 量化后: note.quantized_start_step0 note.quantized_end_step53 # 0.525 * 100 52.5 ≈ 534.2 转换为 Performance 对象# 创建 Performance 对象 performance Performance( quantized_sequencequantized_ns, num_velocity_bins32, max_shift_steps100 ) # Performance 事件序列: [ PerformanceEvent(event_typeNOTE_ON, event_value62), # D4 PerformanceEvent(event_typeTIME_SHIFT, event_value53), # 等待53个时间步 PerformanceEvent(event_typeNOTE_OFF, event_value62), # D4结束 PerformanceEvent(event_typeNOTE_ON, event_value66), # F#4 PerformanceEvent(event_typeTIME_SHIFT, event_value53), # 等待53个时间步 PerformanceEvent(event_typeNOTE_OFF, event_value66), # F#4结束 # ... 其余事件 ]第五阶段编码为整数序列5.1 事件编码# 使用 MidiPerformanceEncoder 编码编码映射: NOTE_ON (62) - 105 TIME_SHIFT (53) - 23 NOTE_OFF (62) - 156 NOTE_ON (66) - 78 TIME_SHIFT (53) - 201 NOTE_OFF (66) - 45 编码后的整数序列: [105, 23, 156, 78, 201, 45, 178, 92, 67, 201, 134, 78, 23, 156]5.2 n-gram 优化如果有# 假设有常用的 n-gram 模式 # 常见模式 105, 23, 156 (NOTE_ON, TIME_SHIFT, NOTE_OFF) 被替换为 1001 优化前: [105, 23, 156, 78, 201, 45, 178, 92, 67, 201, 134, 78, 23, 156] 优化后: [1001, 78, 201, 45, 178, 92, 67, 201, 134, 78, 1001] 第六阶段保存为 TFRecord6.1 TFExample 格式# generator_utils.to_example() 生成 tf_example { features { feature { key: targets value { int64_list { value: 1001 # 优化后的 n-gram value: 78 # NOTE_ON F#4 value: 201 # TIME_SHIFT value: 45 # NOTE_OFF F#4 value: 178 # NOTE_ON A4 # ... 其余值 } } } } } # 保存为文件: # data/processed/score2perf_maestro_language_uncropped_aug-train-00000-of-00001.tfrecord第七阶段模型训练中的数据使用7.1 批处理# 训练时从 TFRecord 读取数据并批处理批次数据形状: [batch_size32, sequence_length2048] batch_targets [ [1001, 78, 201, 45, 178, 92, ...], # 序列1 [156, 23, 78, 201, 45, 178, ...], # 序列2 [201, 45, 178, 92, 67, 201, ...], # 序列3 # ... 其余29个序列 ]7.2 模型输入处理# Transformer 模型处理 # 1. 嵌入层处理 embedded_targets embedding_layer(batch_targets) # [32, 2048, 384] # 2. 位置编码 position_encoded add_positional_encoding(embedded_targets) # 3. 编码器处理 encoder_output transformer_encoder(position_encoded) # 4. 解码器处理自回归 decoder_output transformer_decoder( targetsposition_encoded[:, :-1, :], # 输入去掉最后一个 encoder_outputencoder_output, targets_positionNone ) # 5. 输出投影 logits output_projection(decoder_output) # [32, 2047, vocab_size]第八阶段音乐生成8.1 自回归生成过程# 生成一个新的音乐序列 # 初始种子序列 seed [1001, 78, 201] # 我们处理过的开头部分 # 逐个生成后续事件 generated_sequence seed.copy() for step in range(100): # 生成100个事件 # 模型预测 logits model.predict(generated_sequence) # 返回最后一个位置的logits # 采样下一个事件 (temperature0.9) next_event sample_with_temperature(logits[-1], temperature0.9) # 添加到序列 generated_sequence.append(next_event) # 检查是否应该停止 if next_event 0: # 假设0是结束标记 break # 最终生成的序列可能是: # [1001, 78, 201, 45, 178, 92, 67, 201, 134, 78, 23, 156, 105, 23, ...]第九阶段解码为 MIDI9.1 整数序列解码# 解码生成的整数序列 encoded_sequence [1001, 78, 201, 45, 178, 92, 67, 201, 134, 78, 23, 156] # n-gram 解码 decoded_events [] for token in encoded_sequence: if token 1000: # n-gram 标记 ngram_events get_ngram_events(token) # [105, 23, 156] decoded_events.extend(ngram_events) else: decoded_events.append(token) # 解码后: [105, 23, 156, 78, 201, 45, 178, 92, 67, 201, 134, 78, 23, 156]9.2 转换为 Performance 事件# 解码为 Performance 事件 performance_events [] for event_id in decoded_events: event decode_event(event_id) # 根据编码映射表解码 performance_events.append(event) # performance_events: # [ # PerformanceEvent(NOTE_ON, 62), # D4 # PerformanceEvent(TIME_SHIFT, 23), # 等待23个时间步 # PerformanceEvent(NOTE_OFF, 62), # D4结束 # PerformanceEvent(NOTE_ON, 66), # F#4 # ... # ]9.3 转换为 NoteSequence# Performance 转换为 NoteSequence note_sequence performance.to_sequence() # 自动处理时间和音符匹配生成的 NoteSequence: note_sequence { notes { pitch: 62 # D4 start_time: 0.0 end_time: 0.23 # 根据量化步长计算 velocity: 80 } notes { pitch: 66 # F#4 start_time: 0.23 end_time: 0.74 velocity: 80 } # ... 其余音符 total_time: 4.5 # 根据最后音符计算 tempos { qpm: 120 } }第十阶段导出为 MIDI 文件10.1 保存 MIDI 文件# 最终输出 output_file ./generated/generated_melody_20251210_1516.mid note_seq.sequence_proto_to_midi_file(note_sequence, output_file) # 生成的 MIDI 文件内容: # - 文件大小: 约 2KB # - 音符数: 7个 # - 时长: 4.5秒 # - 包含完整的时间签名和速度信息完整数据流转总结原始概念: 简单C大调旋律 ↓ MIDI文件: simple_melody.mid ↓ NoteSequence: 包含7个音符的protobuf对象 ↓ 数据清洗: 应用踏板效果清理控制信息 ↓ 数据增强: 时间拉伸1.05倍音高转置2半音 ↓ 量化处理: 转换为每秒100步的离散时间 ↓ Performance: 事件序列 [NOTE_ON, TIME_SHIFT, NOTE_OFF, ...] ↓ 整数编码: [105, 23, 156, 78, 201, 45, ...] ↓ n-gram优化: [1001, 78, 201, 45, ...] ↓ TFRecord: 保存为训练数据文件 ↓ 模型训练: 32批次每批2048长度序列 ↓ 自回归生成: 从种子序列逐步生成新序列 ↓ 解码处理: 整数→事件→Performance→NoteSequence ↓ MIDI导出: generated_melody_20251210_1516.mid ↓ 最终产物: 可播放的音乐文件这个具体的例子展示了从一个简单的音乐概念如何通过 Music Transformer 的各个处理阶段最终变成一个可以播放的 MIDI 文件的完整过程。

标签：网站建设企业官网项目流程 UI设计前端开发

企业官网建设流程全解析

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

热门文章

安嶶省城乡建设网站wordpress翻译中文

表白网站怎样做有创意百度快照优化推广

eclipse网站开发环境搭建企业网站源码搜一品资源

如何做自己的网站系统特殊字体生成器

有自己域名如何做网站可以转app的网站怎么做

兖州网站建设公司山东省住房与建设厅网站首页

文章分类

标签云

相关文章

wordpress自动网站地址国家医疗器械查询官网

合肥网站建设哪家专业重庆专业seo

如何给网站添加cnzz轴承 网站建设 企炬

需要专业的网站建设服务？

如何给网站添加cnzz轴承网站建设企炬