本站4月18日消息,NVIDIA AI之強(qiáng)大,不僅僅在于硬件性能好,更離不開生態(tài)優(yōu)化適配,可以發(fā)揮最佳效率,AMD相比之下就差了很多,但也在努力追趕。
現(xiàn)在,Stability AI發(fā)布了ONNX框架優(yōu)化的Stable Diffusion模型,在兼容的AMD Radeon顯卡、銳龍集顯上最多可以提速達(dá)3.8倍。
AMD表示,過(guò)去一年來(lái),一直在與OSV、OEM、ISV廠商合作,優(yōu)化AMD硬件上的AI應(yīng)用,包括硬件設(shè)計(jì)、驅(qū)動(dòng)程序、編譯器、機(jī)器學(xué)習(xí)模型等等。
根據(jù)官方公布的數(shù)據(jù),經(jīng)過(guò)優(yōu)化之后,SDXL 1.0、SDXL Turbo在AMD硬件上的推理性能,對(duì)比基礎(chǔ)的PyTroch模型最高提升3.8倍,SD3.5則可提升最多2.6倍。
實(shí)際圖片、視頻生成應(yīng)用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT顯卡上的效率分別提升了3.1倍、1.5倍、3.3倍、2.1倍。
SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在銳龍AI MAX 395上的效率,則分別提升了1.4倍、3.3倍、3.0倍。
AMD硬件優(yōu)化版的Stable Diffusion模型有一個(gè)特殊的“_amdgpu”后綴標(biāo)記(比如stable-diffusion-3.5-large_amdgpu),現(xiàn)在已經(jīng)可以在Stability AI或者Hugging Face上下載了。
你也可以使用AMD、TensorStack AI聯(lián)合打造的最新版Amuse 3.0。
注意,AMD GPU驅(qū)動(dòng)版本不要低于24.30.31.05預(yù)覽版,或者等待即將發(fā)布的25.4.1正式版。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。