天天看点

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

AI“Stable Diffusion”只需输入提示就能生成高精度图像,但由于Stable Diffusion基本上是基于使用NVIDIA制造GPU而设计的,所以执行速度会因使用的不同GPU而变化。因此,在技术媒体Tom’s Hardware担任撰稿人的Jarred Walton就“哪个GPU最快能运行Stable Diffusion?”进行了调查。

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

Stable Diffusion Benchmarked: Which GPU Runs AI Fastest (Updated) | Tom's Hardware

https://www.tomshardware.com/news/stable-diffusion-gpu-benchmarks

创建训练复杂的 AI 需要具有大量硬件的服务器,但如果您使用的是经过培训的 AI,则消费类 PC 上的通用 GPU 也是可能的。 虽然这基本上是指的使用NVIDIA制造的GPU的Stable Diffusion,但Walton指出,“这并不意味着除了 NVIDIA 之外,其他 GPU 无法执行Stable Diffusion。”

目前,已经公开了在Intel制造的GPU“Intel Arc”中和在搭载M1·M2芯片的Mac上运行Stable Diffusion的方法。

GitHub - rahulunair/stable_diffusion_arc: Stable Difussion inference on Intel Arc dGPUs

https://github.com/rahulunair/stable_diffusion_arc

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

Run Stable Diffusion on your M1 Mac’s GPU - Replicate – Replicate

https://replicate.com/blog/run-stable-diffusion-on-m1-mac

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

Walton测试了在各种 GPU 上运行Stable Diffusion的速度,在NVIDIA制GPU的测试中使用了“AUTOMATIC1111版Stable Diffusion web UI”,为了测试AMD的GPU使用了“Nod.ai's Shark version”,在Intel制GPU的Intel Arc的测试中使用了“Stable Diffusion OpenVINO”。

测试参数对于所有GPU都是相同的,基准测试是生成 512×512 像素图像 10 次,每个 GPU 每秒迭代一次 ,图表采用以下平均数量。 NVIDIA RTX 30/40 系列以绿色显示,AMD RX 30/7000 系列显示为红色,英特尔 Arc 系列以蓝色显示,NVIDIA GPU 具有常规计算模型版本和库“xFormers”,可实现更快的图像生成 包含使用 的版本的结果。 总体而言,正如预期的那样,英伟达的GPU与AMD或Intel的任何产品相比,都能提供卓越的性,使用 xFormers 可以提高数几十%的性能。

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

在这项研究中,NVIDIA的RTX40系列带来了最快的结果,其次是AMD7900系列,NVIDIA的RTX30系列,与这些相比,Intel Arc相当慢。但是,适当的优化充分保留了AMD和Intel GPU上的Stable Diffusion运行速度更快的可能性,Walton认为出现在AMD和Intel GPU上表现更好的版本只是时间问题。

另外,以下的图表排列了作为各GPU的性能指标的FLOPS的理论上的最大性能。该图表也突出了NVIDIA的GPU,但实际运行Stable Diffusion时,性能差比理论上的性能差小。另外,Intel Arc在理论上也是拥有与NVIDIA制造的GPU匹敌的性能,但遗憾的是在实际的基准测试上拉开了很大的差距。

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

Walton还发布了2048×1152像素高分辨率图像的生成和测试结果。 通过查看下图,您可以看到 xFormers 对高分辨率图像的影响更大。 此外,由于 AMD GPU 无法运行,因此没有对其进行测试。

哪些 GPU 能以最快的速度运行图像生成 AI“Stable Diffusion”?

另外,提供机器学习训练用系统的云企业的MosaicML报告说,关于从零开始训练Stable Diffusion的时间和成本,使用本公司系统的话13天不到16万美元就可以进行训练。另外,该成本比Stable Diffusion的开发企业StabilityAI报告的低了了2.5倍。

Training Stable Diffusion from Scratch Costs <$160k

https://www.mosaicml.com/blog/training-stable-diffusion-from-scratch-costs-160k

GitHub - mosaicml/diffusion-benchmark

https://github.com/mosaicml/diffusion-benchmark