AMD Radeon RX 5700 / RX5700XT 登场

2021-02-04 11:20:06


AMD 新一代「Radeon RX 5700 / RX 5700XT」绘图卡登场,採用全新「RDNA」GPU 微架构在同时脉下性能较上代提升约 25%,受惠于全新 TSMC 7nm 制程令 GPU 核心时脉更高,相较上代性能功耗比提升 50%,究竟今代 Radeon 新卡能否为 NVIDIA 带来威胁,HKEPC编辑部找来 AMD Radeon RX 5700 / RX 5700 XT 与 NVIDIA RTX Super 新卡作对比测试。



TMSC 7nm、AMD Navi 10 绘图核心

终于等到 GNC 微架构「寿终正寝」啦 !! AMD 全新 Radeon RX 5700 系列、代号「NAVI 10」绘图卡晶片正式登场,它是 AMD 首款採用全新「RDNA」GPU 微架构产品,相较旧有 「GCN」 微架构着重惊人的运算吞吐量,设计偏重 GPGPU 运算却严重忽略了游戏工作负载能力,执行游戏时经常出现单元闲置。

全新「RDNA」微架构设计将重回正轨,设计偏重游戏能性以提升 IPC 及资源使用率为目标,创造真正为 Gaming 而生的 GPU 产品,加上全新 TSMC 7nm 令时脉进一步,将为 NVIDIA 带来重大威胁。

5700X

▲ AMD Navi 10 绘图核心

定价方面,虽然 NVIDIA 特别推出了全新「RTX Super」系列迎战,但没想到在距发布前四天 AMD 宣布降低,全新 Radeon RX 5700 官方定价为 US$349 美元、对手变成了 GeForce RTX 2060,Radeon RX 5700 XT 官方定价为 US$399 美元,对手变成了 GeForce RTX 2060 Super,只能说这招真绝啊。

所谓有竞争才有进步,这次 AMD 苏妈终于逼出 NVIDIA 老黄新刀法,无论谁胜谁负、赢的都是玩家们,只是刚买了 RTX 2060 / RTX 2070 的玩家就不怎样开心了 。

全新 RDNA GPU 微架构

NAVI

▲ AMD 「Navi 10 」GPU Block Diagram

全新「RDNA」针对 Compute Unit 作出重新设计,「Navi 10」绘图核心拥有 2 个 Shader 引擎共享前端、每个 Shader 引擎拥有 2 组 Graphics Array 运算群,每个 GA 运算群内含 5 个 Dual Compute Unit (DCU) 并共享 L1 Cache、Rasterizer、ROP、Prim Unit 等资源,总计整颗晶片合共有 40 个 CU 单元。

今代 RDNA 採用了 Dual Compute Unit (DCU) 设计,将 2 个 CU 结合在一起并共用 Scalar Data Cache、Sahder Instruction Cache 及 Local Data Share,DCU 设计可以让 Shader Processor 之间有更佳的并行运算能力,同时让 CU 在执行绘图运算时延迟进一步降低。

5700

▲ RDNA 微架构 改用了 Dual Compute Unit 设计

相较旧 GCN 5 微架构的 CU 设计,全新 RDNA 的 CU 单元新增多 1 个 Scheduler 及 1 个 Scalar Unit,此项改动可以让 CU 单元更切合绘图运算的需求,执行游戏时让指令吞吐图上升了 1 倍。

5700

RDNA 微架构改为 SIMD32 设计

另一个重要改良是 IPC 运算能力,上代 GCN 5 微架构的 CU 设计採用 4 个 SIMD 16 单元,这一设计非常适合进行複杂的科学运算,但却不利于游戏运算,全因这些 SIMD 16 单元是 4 Cycle Issue 设计,它们并无法在单一週期完成 1 条指令。RDNA 微架构的 CU 设计改为 2 个 SIMD 32 单元,具备 1 Cycle Issue 执行能力,能有效减低出现单元运算闲置性能,这个改动对游戏运算性能有明显的改善。

5700

CU 单一週期可完成 1 笔 Wave 64 指令

举例当执行一个 Wave 64 指令,旧有的 GCN 5 的 CU 单元只能填充 1 组 SIMD 16 单元并需 4 个週期才能完成 ,其他 SIMD 都会被闲置,新一代 RDNA 微架构可以将 Wave 64 指令分拆,并填充 CU 单元内的 2 组 SIMD 64 单元,只需 1 个期就能执行完成。

全新 Multi-Level Cache 层级

5700

▲ 全新的 Cache Hierarchy 架构

全新 RDNA 微架构的另一个重大改良是 Cache Hierarchy架构,每个 Graphics Array 新增 1 组 L1 Cache 缓存,容量为 128KB、16-Way 关联性,整颗 Navi 10 绘图核心合共拥有 512KB L1 Cache容量,每组 L1 Cache缓均设有 4 个 512bit L2/L1 Fabric 连结至 L2 Cache,L2 Cache 缓存拥有 16 个 256KB 分割,每个分割拥有一组 1 个 128bit Infinity Fabric 链结至 Memory Controller,更大的 L1 Cache 意味着全新 RDNA 能大幅降低内部存取延迟,提升运算效降及减低单元闲置。

5700

▲ 新增 4 组 128KB L1 Cache

每个 CU 各自拥有自已一组 L0 Cache,容量为 16KB、32-Way 关联性,每个 DCU 则共享 1 组 32KB、4-Way 关联性的 Instruction Cache 及 16KB、4-Way 关联性的 Scalar Data Cache,为了增取运算并行性,RDNA 微架构 将 L0 Cache 与 ALU 的Load Bandwidth 倍增。

据 AMD 指出全新 Cache 架构令延迟有大幅改善,L0 增加 Load Bandwidth 降低了 21%、全新的 L1 + L2 架构降低 24%,改用 GDDR6 记忆体再降低7%。

追加 Delta Color Compression 技术

5700X

除了改良了 Cache Subsystem 及增加 L0 Load Bandwidth 外,全新 RDNA 微架构追加了 Delta Color 色彩压缩技术,利用无损储存压缩方式来降低对记忆体、Rasterizer& RB单元、 L1/L2 Cache 及Display Engine 频宽的需求量,以提升资料的压缩比进一步节省频宽所需,内部有效频宽在使用后提升了约 5~7%。

AMD Radeon RX 5700 Family Specifications

Radeon
RX Vega 64Radeon
VIIRadeon RX
5700Radeon RX
5700 XTArchitectureGCN 5GCN 5RDNARDNAManufacturing ProcessGF 14nmTSMC 7nmTSMC 7nmTSMC 7nmTransistor Count12.5 Billion13.2 Billion10.3 Billion10.3 BillionDie Size495 mm²331 mm²251 mm²251 mm²Compute Units64603640Stream Processors4096384023042560Base Clock1274MHz1400MHz1465MHz1605MHzBoost Clock1546MHZ1750MHZ1625MHZ1755MHZMemory TypeHBM2HBM2GDDR6GDDR6Memory Size8GB16GB8GB8GBMemory Interface2048bit4096bit256bit256bitMemory Clock945MHz1000MHz1750MHz1750MHzMemory Bandwidth483.8GB/s1TB/s448GB/s448GB/sROP64646464Texture Units256240144160TDP295W300W180W225W

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。