关于我们

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻公共列表

ROCM加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

发布时间:2024-04-15 22:43:35

一、ROCm加持图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

ROCm:一种可移植、高性能的产品GPU计算平台

随着人工智能时代的到来,显卡的作用不再局限于游戏,尤其是在Stable Diffusion火爆全网之后,越来越多的玩家将显卡视为AIGC生产力工具。

只不过,Stable 早期版本的Diffusion对AMD显卡的支持不是很友好,给人一种只有N卡才适合玩AI的错觉。

也许很多学生不知道的是AMDRadeon GPU也可以做到深度学习是的,性能还不错。

去年12月,AMD推出ROCM 6.0开发平台进一步优化RX 7000系列显卡的AI性能,特别是Stable Diffusion的绘图效率翻了一番。

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

让我们先解释一下什么是AMD ROCm!

ROCm (Radeon Open Compute Platform )是 AMD 以开源项目为基础 GPU计算生态系统与 NVIDIA 的 CUDA。

ROCm 为加快科学计算、自动驾驶、人工智能和机器学习等领域的应用,支持多种编程语言、编译器、库和工具。

ROCM还支持各种加速器制造商和架构,提供开放的可移植性和可操作性。

目前,Python通常用于深度学习和开发,大数据平台通常部署在Linux操作系统上。因此,AMD 目前ROCM主要集中在Linux系统上,Windows端还有待完善。

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

由于流处理器单元的双发射设计,RX 7900 XT仅凭5376个流处理器就达到了55.4TFOPS的单精度浮点操作性能,而RTX拥有10240个流处理器 4080 Super浮点性能也是55TFOPS。

至于RX 7900 XTX,其单精度浮点性能接近60TFOPS。

Stable Diffusion主要依赖于GPU的单精度浮点性能、显存容量和带宽 7900 XT不亚于RTX 4080 SUPER,甚至显存容量也更大。

现在有了AMD ROCm 6.0的祝福终于可以发挥出来了顶级人工智能计算能力强的显卡。

二、Stable 对比Diffusion的出图速度:Linux系统的出图效率几乎翻了一番

测试平台如下:

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

这次我们主要比较RX 7900 XT/XTX在Ubuntu和windows系统下的绘图效率,看AMD ROCM能带来多大的提升。

1、RX 7900 XT对比测试

首先是Windows 11系统打开Stable 在Diffusion之后,我们设置了DPN 2M Karras采样,迭代步数50、Euler A采样,1024x768分辨率,CFG7、总批10,单批1。

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

在Windows系统下,RX 7900 基于DirectML加速模式,XT生成10张图片需要9分51秒,即591秒。

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

进入Ubuntu 22.04.3 设置ROCM后,LTS系统只需要5分05秒,即305秒就可以生成相同的参数和模型。

相比之下,Ubuntuntunt 22.04.3 在LTS系统下,RX 7900 与Windows系统相比,XT的出图效率高94%。

2、RX 7900 XTX对比测试

使用相同的参数测试RX 7900 XTX显卡。

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

在Windows系统下,RX 7900 基于DirectML加速模式,XTX生成10张图片总共需要9分18秒,即558秒。

进入Ubuntu 22.04.3 设置ROCM后,LTS系统只需要4分45秒,即285秒,就可以生成相同的参数和模型。

Ubuntu 22.04.3 在LTS系统下,RX 7900 与Windows系统相比,XTX的出图效率领先96%,即性能提升几乎翻了一番。

三、总结:AIGC显卡性价比高

目前是非公RX 7900 XT价格在5299元左右,对位非公RTX 4080 Super的价格是8599元,N卡的价格是60%。事实上,这两张显卡在游戏性能上并没有太大的差别。

现在AMD也意识到AI应用对GPU的重要性,增加了AMD 经过不断更新,ROCM平台的投资现在是AMD ROCm 6.0人工智能计算能力的提高已经超出了大多数玩家的预期。

在我们的测试中,RX 7900 在Linux系统中使用XTStable Diffusion ROCm 在6.0版中,其出图效率几乎是Windows系统的两倍。再加上55TFOPS的单精度浮点操作性能和20GB 对于专业AIGC应用需求较高的专业用户,GDDR6X超大容量显存,预算有限,RX 7900 XT可以说是一个非常合适的选择。

当然,我们也希望AMD能继续优化Windows系统下ROCM的性能,让更多的AMD用户拥有自己高性价比的AIGC显卡。


/template/Home/Zkeys/PC/Static