从Stable Diffusion这一AI应用出现之后,在极短时间内就迅速走红,成为众多玩家口口相传的“最美小姐姐”生成工具。不过这一AI计算画图工具在Stable Diffusion官方推出之初,无论是WEB UI的部署还是模型的训练生成,都基本是基于NVIDIA CUDA加速的算法,因此A卡最初并不被Stable Diffusion官方支持。不过好在Stable Diffusion算是一个开源的产品,在众多社区聚集玩家的支持下,也出现了许多支持A卡GPU加速计算的分支,比如我们今天要测试的基于DirectML的部署,就能实现AMD Radeon显卡的Stable Diffusion AI计算硬件加速。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
如果要自己在本地部署基于DirectML的Stable Diffusion话,相比便捷的基于CUDA的WEB UI部署要相对复杂一些,不过现在网上已经有比较成熟的整合包供玩家适用,玩家们只需要下载相应的整合包,就能一键实现在本地的傻瓜式安装部署,可以为大家节省相当多的时间。
▲我们选择用于测试的这个整合包安装完毕之后,自动进入AMD GPU加速计算模式,在本地开启http://127.0.0.1:7860即可打开本地Stable Diffusion的AI画图界面。
▲在本地WEB UI界面上可以自由设置相关的AI艺术图生成参数,点击“生成”即可开始画图。具体请参考线上相关教程,在此我们不赘述。
那么,基于DirectML的Stable Diffusion部署分支能不能实现对AMD显卡的硬件计算加速支持呢?它的效率到底如何?在此前A卡玩家经常只能在Linux系统下运行Stable Diffusion,通过ROCM(Radeon Open Compute)模拟CUDA加速,如今在Windows系统下直接实现A卡的AI加速计算,能否达到我们的预期目标呢?为此,我们选择了AMD Radeon RX 5000系、RX 6000系以及RX 7000系的数款显卡,进行了一番详细的体验。
体验平台
显卡:AMD Radeon RX 5500XT(8GB)、RX 5700(8GB)、RX 6500XT 4GB、RX 6600(8GB)、RX 6700XT(12GB)、RX 6750XT(12GB)、RX 6800(16GB)、RX 6900XT(16GB)、RX 7900 XT(20GB)、RX 7900 XTX(24GB)
CPU:英特尔酷睿i9-13900K
主板:英特尔Z790
内存:DDR5 6000 16GB×2
SSD:AORUS NVMe PCIe SSD 2TB
操作系统:Windows 11 Pro 22H2
驱动程序:AMD Software Adrenalin Edition 23.4.3
通过测试,我们想知道:
AMD Radeon 5000系、6000系和7000系之间,在Stable Diffusion的AI画图算力上有多大差别?
相比传统的CPU AI计算加速,AMD GPU加速性能到底如何?
▲我们所采用的网络开源共享的部署方案可以正确实现AMD显卡的硬件加速计算,可以看到在图片生成的过程中GPU的占用率一直保持在100%。
模型为Novel AI
Final-runed(CKPT)
在第一部分的测试中,我们通过关键词生成一个大眼的时尚|美女|小姐姐,还要有一定的照片感。关键词设置如下(部分引用自网络开源共享关键词):
lora:koreanDollLikeness_v15:0.6> , best quality, ultra high res, (photorealistic:1.4), 1woman, sleeveless white button shirt, black skirt, black choker, cute, (Kpop idol), (aegyo sal:1), (platinum blonde hair:1), ((puffy eyes)), looking at viewer, full body, facing front,fashion,premium
分辨率设置:512×512
采样步进:20
提示词引导系数:7
生成批次-每批数量:1-1、4-1
在测试中由于绝大部分显卡都拥有8GB以上的显存,因此我们在运行参数上基本设置了正常的高显存默认模式,只有4GB显存版的RX 6500XT运行时采用了添加了--lowvram的低显存运行模式(否则就无法运行)。从整体测试结果来看,AMD从Radeon RX 5000系到RX 7000系的显卡几乎都很好地实现了Stable Diffusion应用的AI计算加速性能,尤其是Radeon RX 7000系显卡性能相比RX 6000系显卡有了巨大的提升。比如RX 6900XT在该设置与模型算法下的图片生成率约为8.87张/秒,而RX 7900 XT则可以达到15.76张/秒,性能提升接近100%。
而相比CPU来说,全系AMD显卡都占有非常明显的优势,RX 7900 XT的性能达到了酷睿i9-13900K的30倍左右,即使前两代的入门级显卡RX 5500XT,性能上也几乎接近酷睿i9-13900K的5倍。
唯一有点异常的是RX 6500XT,按照核心规格来看,它应该是要强于RX 5500XT的,不过由于显存配置仅为4GB,因此在测试中开启了低显存运行模式之后,其图片上生成速度受到了极大影响,远低于GPU加速的正常表现,仅能达到略高于CPU计算的水准。
在接下来的测试中,我们用一系列相对复杂的关键词来生成一座位于水边的别墅,同时还伴有阳光、波纹、倒影等效果要求。关键词如下:
‘beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k,’
分辨率设置:512×512
采样步进:50
提示词引导系数:7.5
生成批次-每批数量:1-1、2-1、4-1
这部分的测试结果与前一测试基本保持了一致性。仍然是RX 7000系显卡在性能上独占鳌头,相对于RX 6000系显卡的对位提升在100%左右,与CPU的计算性能相比,GPU加速计算的性能提升仍然非常显著,RX 7900 XT的性能达到了酷睿i9-13900K的30倍左右,入门级显卡RX 5500XT,性能上也几乎接近酷睿i9-13900K的5倍。
4GB显存配置RX 6500XT由于仅能在低显存模式下运行,因此图片上生成速度还是受到了极大影响,远低于GPU加速的正常表现,大致与酷睿i9-13900K相当。
这是一次简单但却比较有趣的测试,通过这次体验,我们认为有几点参考意见可以总结给玩家们参考:
1.当前AMD显卡已经可以通过开源的部署方案实现在Windows系统下的Stable Diffusion AI计算加速,而且网上也有许多的傻瓜式整合包,感兴趣的玩家完全可以一试;
2.从测试结果来看,AMD显卡在Stable Diffusion的AI图片生成计算中能够发挥出远胜于CPU计算的性能增幅,使用GPU加速计算能带来事倍功半的效果;
3.从测试情况来看,测试中当渲染分辨率设置超过512时(如768×768),就会出现爆显存的情况,这与部署方案和模型有一定关系,但也反映了在正常模式下运行时,8GB显存几乎是Stable Diffusion的硬性入门要求。如果显存低于8GB,即使在512×512分辨率下渲染,也会出现显存不足的情况,此时就不得不采用--lowvram的低显存运行方案,但会极大地拖累计算速度,如测试中的RX 6500XT 4GB。所以要想畅玩Stable Diffusion,我们建议显卡的显存为8GB或更高为佳;
4.从整体结果来看,我们认为AMD GPU还有极大的算法优化空间,凭不可靠经验判断,从RX 7900 XTX到酷睿i9-13900K的性能差距还不足够大。这和我们部署的算法方案以及模型都有一定关系,也希望各社区的程序员们能开发出更多更优秀的针对AMD显卡的计算加速方案。
不管如何,AMD显卡对Stable Diffusion的硬件加速计算性能已经得到了展现,效果也比较明显,对AMD显卡用户来说毫无疑问是利好的福音消息,剩下的就是玩家与AMD需要坚持的继续优化之路了。
# windows
# 算法
# stable diffusion
# http
# linux
# ui
# 关键词
# 显存
# 开源
# 有一定
# 步进
# 测试中
# 英特尔
# 这一
# 就能
# 达到了
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
颠覆工作方式:2025年必备的9款强大AI工具
GitHub Copilot终极指南:提升代码效率与质量
ChatGPT一键生成PPT怎么加内容_ChatGPTPPT内容添加【方法】
OpenAI Sora 2:AI视频生成新纪元
2025年AI图像生成指南:Google Gemini Nano Banana教程
微信AI数字人能否识别语音消息_微信AI数字人语音识别与回复设置【教程】
兔展AI排版如何批量生成多尺寸图_兔展AI排版多尺寸批量生成步骤【实操】
Mootion AI视频生成器:一键创作动画故事!
Pictory AI视频制作平台深度评测:功能、价格与使用指南
揭秘颜值真相:社交实验的背后,你是几分?
创客贴AI排版如何批量处理图文_创客贴AI排版批量操作与效率提升【方法】
律师视角下的生成式AI:信息爆炸时代的法律实践与未来展望
Google Gemini 对复杂物理解题过程的逐步解析
eGain AI Knowledge Hub:助力 Specialized 成熟运营和卓越 CX
如何用 ChatGPT 批量处理 Excel 复杂公式
tofai网页版官方入口 tofai官网登录网址
Gemini怎样写精准提示词_Gemini提示词编写方法【步骤】
AI网站构建指南:Duda平台免费创建教程
怎么用ai进行用户画像分析 AI消费行为与兴趣标签提炼【详解】
tofai登录入口官网 tofai网页版地址链接
利用 DeepSeek 提高敏捷开发中的 Sprint 规划效率
如何用AI帮你分析用户评论?3步挖掘用户真实需求
AI加持:2025年最佳人工智能潜在客户生成工具
百度输入法ai写作怎么关 百度输入法ai帮写禁用
利用AI自动化回复Google Voice短信:终极指南
MetaGPT:AI驱动的软件开发团队,颠覆传统编码模式
Base44 AI应用构建器深度评测:Wix 8000万美元收购的秘密
批改网AI检测工具怎样优化检测精度_批改网AI检测工具精度调节与模型选择【实操】
Shopify着陆页:用AI工具快速提升营销效果
简历没回改:利用AI润色让你的文字更专业
途牛旅游AI怎样设置抢票提醒_途牛AI抢票提醒时间与频率设置【方法】
Artist.ly AI Image Designer: 终极指南
LogMeIn Resolve:IT 运维知识库的 AI 赋能实践
AI如何一键生成PPT大纲_利用AI工具制作演示文稿方法【教程】
如何用ChatGPT模拟面试并优化你的求职文书?
AI Vibe Coding: 快速打造落地页,低代码平台实战教程
AI赋能:五款颠覆性工具助你在线赚钱
百度ai助手任务栏怎么关 百度ai助手任务栏图标隐藏
通义千问网页版怎么切换账号_通义千问账号切换步骤【指南】
Avokaado AI:简化合同管理和法律流程的终极指南
文心一言辅助进行行业深度研究报告撰写
百度浏览器侧边栏ai怎么关 百度浏览器ai侧边栏隐藏
Claude怎样写指令型提示词_Claude指令提示词写法【方法】
AI视频工具:加速内容创作,提升效率的终极指南
PixianAI抠图如何导出PSD_PixianAI分层导出与PSD保存设置【实操】
Azure AI 文本分类指南:自定义模型,提高文本分析精度
Gemini怎样写描述型提示词_Gemini描述提示词编写【攻略】
AI婴儿播客视频制作终极指南:免费工具与步骤
Sora 2 API 全面解析:功能、应用与 Lovable 集成指南
斑马AI怎样设置专注模式_斑马AI专注时段与干扰屏蔽【指南】
2023-05-30
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。