kylearn
多模态

扩散模型

Diffusion Model

画图 AI 的看家本领:先给画布撒满雪花噪点,再一步步'擦掉噪点、显出图像',像照片从模糊慢慢对焦清晰。

先打个比方

你有没有过这种经历:电视没信号时,满屏都是雪花点,乱成一团。现在反过来想象一下——如果有人能盯着这堆雪花点,一点点把多余的噪点擦掉,最后竟然擦出一只活灵活现的猫,你会不会觉得有点神奇?

扩散模型干的就是这件事。它不是凭空"画"出一张图,而是先从一团乱七八糟的随机噪点出发,然后一步一步把不像猫的地方修掉,越擦越清晰,直到一只猫从噪声里"浮"出来。🐱

它到底是怎么学会的

这里有个聪明的训练思路:既然"从噪点擦出图"太难,那就先反过来教它"怎么把好图弄脏"。

工程师拿来海量清晰图片,一点点往上加噪点,直到糊成雪花。模型在旁边全程围观,把"加脏"的每一步都记下来。等它学透了"图是怎么一步步变脏的",再倒着走这个过程,就成了"把脏图一步步变干净"。说白了,它学的是去脏的本事,反着用就成了创作。

为什么和你有关

你刷到的那些 AI 画作、AI 短视频、一句话生成的头像和海报,背后大多就是这套思路在撑着。理解了"撒噪点—再擦干净",你就摸到了当下最火的画图 AI 的命门,看那些作品时心里也更有数。

下次用画图工具时不妨多试几句不同的描述——你给的提示词,正是在告诉它该往哪个方向"擦"。

本文为 AI 整理的科普解读,可能有误,仅供入门参考。

没看懂?让 AI 再讲一遍:

延伸阅读:可在公众号「数字生命卡兹克」「Datawhale」搜同名概念的科普文章。

相关概念