多模态

扩散模型

Diffusion Model

画图 AI 的看家本领：先给画布撒满雪花噪点，再一步步'擦掉噪点、显出图像'，像照片从模糊慢慢对焦清晰。

先打个比方

你有没有过这种经历：电视没信号时，满屏都是雪花点，乱成一团。现在反过来想象一下——如果有人能盯着这堆雪花点，一点点把多余的噪点擦掉，最后竟然擦出一只活灵活现的猫，你会不会觉得有点神奇？

扩散模型干的就是这件事。它不是凭空"画"出一张图，而是先从一团乱七八糟的随机噪点出发，然后一步一步把不像猫的地方修掉，越擦越清晰，直到一只猫从噪声里"浮"出来。🐱

这里有个聪明的训练思路：既然"从噪点擦出图"太难，那就先反过来教它"怎么把好图弄脏"。

工程师拿来海量清晰图片，一点点往上加噪点，直到糊成雪花。模型在旁边全程围观，把"加脏"的每一步都记下来。等它学透了"图是怎么一步步变脏的"，再倒着走这个过程，就成了"把脏图一步步变干净"。说白了，它学的是去脏的本事，反着用就成了创作。

你刷到的那些 AI 画作、AI 短视频、一句话生成的头像和海报，背后大多就是这套思路在撑着。理解了"撒噪点—再擦干净"，你就摸到了当下最火的画图 AI 的命门，看那些作品时心里也更有数。

下次用画图工具时不妨多试几句不同的描述——你给的提示词，正是在告诉它该往哪个方向"擦"。

本文为 AI 整理的科普解读，可能有误，仅供入门参考。

没看懂？让 AI 再讲一遍：

延伸阅读：可在公众号「数字生命卡兹克」「Datawhale」搜同名概念的科普文章。