ViT、DiT、MMDiT架构解析 从 ViT 到 DiT 再到 MMDiT,分析 Transformer 模型在计算机视觉和多模态生成领域的演进脉络,利用 diffusers 库提供的相关代码探究各个架构的实现细节 2026-03-18 图像生成 #DiT #可控图像生成
用图像来引导 Stable Diffusion 用图像来引导文本生成图像的Stable Diffusion进行可控生成 2026-03-14 图像生成 #可控图像生成 #Stable Diffusion