aigenerationdiffusionmodel type: concept 创建: 2026-04-27 更新: 2026-04-27

Diffusion Models

扩散模型,生成式 AI 的核心技术之一。广泛应用于图像、音频、视频生成。

核心原理

  1. 前向过程:对数据逐步添加噪声,直到完全随机
  2. 反向过程:学习从噪声恢复原始数据
  3. 条件生成:通过 CLIP 等编码器注入条件信息

架构变体

类型代表模型特点
Latentstable-diffusion低维空间扩散,效率高
DiTPixArtTransformer 替代 U-Net
MM-DiTStable Diffusion 3多模态联合

关键组件

  • 噪声调度器:控制噪声添加/去除节奏
  • U-Net / DiT:核心网络结构
  • 文本编码器:CLIP、T5 等

游戏开发应用

相关