世博体育app下载堪称出动端最强 NPU-万博官方网站(官方)手机APP下载IOS/安卓/网页通用版入口
发布日期:2024-07-12 07:58    点击次数:75

机器之心报说念世博体育app下载

作家:杜伟、亚鹂

你方唱罢我登场。

一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台,其中当属和 AMD 最为亮眼。英伟达现场拿出了量产版 Blackwell 芯片,还公布了过去三年的居品道路,包括下一代 Rubin AI 平台。

AMD 固然也不甘安定,CEO 苏姿丰亮出了旗下的 CPU、GPU 居品及道路图,包括全新 Zen 5 架构的桌面端 Ryzen 9000系列 CPU、AI PC 芯片、数据中心芯片和 GPU。

苏姿丰

全新 Zen 5 架构

锐龙 9000 桌面系列芯片初次亮相

苏姿丰在演讲中扫视先容了基于 Zen 5 架构的全新桌面端 Ryzen CPU,它们流程优化不错通过神经收集贬责器来加快 AI 责任负载。

下图为下一代高性能 CPU 中枢 Zen 5 的各项规格,它不仅是刻下 Ryzen 9000 系列贬责器的中枢,也将成为本年下半年推出的 Turin Epyc 霄龙做事器 CPU 的中枢。

苏姿丰暗示,Zen 5 是 AMD 迄今假想的性能和能效均最高的中枢,而且它是从新运转假想的。其中,该中枢领有一个新的并行双管说念前端,旨在提高分支预测准确性并减少延长,并粗疏在每个时钟周期提供更高的性能。

此外,Zen 5 具有更宽的 CPU 引擎教唆窗口,不错并走时行更多教唆,以达成开端的狡计微辞量和效果。与 Zen 4 比拟,Zen 5 的教唆带宽增多了一倍,缓存和浮点单位之间的数据带宽增多了一倍,AI 性能增多了一倍,同期具有完满的 AVX 512 微辞量。

苏姿丰现场初次展示了秉承 Zen 5 架构的 Ryzen 9 9950X。

Ryzen 9 9950X 领有 16 个中枢和 32 个线程,加快后运行速率不错高达 5.67 GHz。Zen 5 的平均每个中枢教唆比之前的 Ryzen 芯片以及「Genoa」Epyc 9000 系列贬责器中使用的 Zen 4 中枢多 16%。此外,TDP 为 170W,L2+L3 缓存为 80MB。

下图为 Ryzen 9000 全系列 CPU,包括了 Ryzen 9 9950X、Ryzen 9 9900X、Ryzen 7 9700X、Ryzen 5 9600X 以及规格比较。这些居品预测本年 7 月上市。

AMD 给出的里面游戏测试数据傲气,Ryzen 9 9950X 对游戏性能的擢升幅度不一。比如在《无主之地 3》中的发达仅比英特尔 Core i9-14900K 高出 4%,在《杀手 3》中高出 6%,在《赛博一又克 2077》中高出 13%。此外,Ryzen 9 9950X 在《F1 2023》中的发达较英特尔擢升了 16%,在《DOTA 2》中擢升了 17%,在《地平线零之晨曦》中擢升了 23%。

50TOPS

AMD 最强出动端 NPU 算力

苏姿丰展示了下一代 AI PC 芯片 —— 锐龙 AI 300 系列 APU(第三代)。

下图为锐龙 AI 300系列芯片实拍。

锐龙 AI 300 系列芯片旨在提供下一代 AI PC 体验,因而条款 NPU、CPU 和 GPU 均要达到最好。

锐龙 AI 300 系列首发提供了两款型号,锐龙 AI 9 HX 370 和锐龙 AI 9 365。下图为锐龙 AI 9 HX 370 的参数规格。

锐龙 AI 300 系列秉承了XDNA AI NPU,堪称出动端最强 NPU,算力达 50TOPS,不仅达到了微软对新一代 AI PC「NPU 算力 40TOPS 以上」的尺度,还高出了高通骁龙 X Elite 的 45TOPS、英特尔 Lunar Lake 的 40-45TOPS。

AMD 暗示,搭载锐龙 AI 300 系列的条记本将于本年 7 月起不时上市。

最高 192 中枢 384 线程

第五代 EPYC 霄龙问鼎数据中心芯片

苏姿丰现场也展示了第五代「Turin」EPYC 霄龙芯片,它堪称人人最强数据中心 CPU。

下图为第五代 AMD 霄龙 Turin 芯片的参数规格。当今莫得线路太多细节,从基础信息参数来看,Turin 具有 192 个 Zen 5 中枢和 384 个线程,秉承与 Genoa Epyc 9004s 相易的 SP5 插槽适配。

Turin 芯片可能会被定名为 「Epyc 9005s」。不错期待的是, 在 IPC 方面,它与 Ryzen Zen 5 芯片周边。相较于 Zen 4 中枢,IPC 雠校可能在 15% 到 20% 之间。苏姿丰展示了 Turin 芯片的一些早期基准测试数据。

如下图所示,图上为具有 128 个中枢的 Turin 芯片在 NAMD 分子能源学哄骗时局中运行 STMV 基准测试的性能。Turin 芯片模拟了 2000 万个原子,并狡计了狡计引擎在 24 小时内不错贬责几许纳秒的分子相互作用。不错看到,128 中枢的 Turin 芯片是 64 中枢英特尔「Emerald Rapids」Xeon SP-8592 + 责任量的约 3.1 倍。

图下为基于 Meta Llama 2 7B 模子的 AI 微辞量基准测试,该模子以 INT4 数据时局贬责,推理 token 生成建造为 50 毫秒。128 中枢的 Turin 芯片是英特尔竞品 CPU 性能的 2.5 倍到 5.4 倍之间,具体数值取决于责任负载。

对标英伟达

AMD 的 Instinct GPU 也一年一更

讲完毕 CPU,接下来的重头戏便是 Instinct GPU 了,它将是 AMD 过去居品计谋的一个进攻持手。

苏姿丰暗示,「Antares」MI300 系列是 AMD 历史上增长最快的居品,在 HPC 和 AI 责任负载方面的可用性看起来有点像英伟达 GPU,不外其所提供的性能上风以及 HBM 内存容量、带宽上风较为杰出。

比如在推理责任负载方面,通过对 Llama 3(具有 700 亿参数)进行推理考试性能的截至来看,一台配备 8 个 MI300X GPU 的做事器性能约为一台配备 8 个 H100 GPU 加快器的英伟达 HGX 性能的 1.3 倍。而在 Mistral 7B 模子上,单个 MI300X 的性能则是英伟达 H100 GPU 的约 1.2 倍。

随后,苏姿丰公布了2024-2026 年的 Instinct GPU 道路图,本年推出 MI325X,2025 年推出 MI350,2026 年推出 MI400。

MI325X 将具有更大的算力范围,并转向 HBM3E 内存。下图为 MI325X 的基础性能规格,内存增多了 2 倍,最高可达 288GB;带宽增多了 30%,达到了 6TB / 秒。

下图为 MI325X 的数据传输速率与英伟达 H200(141GB 内存)比较的截至。值得一提的是,1 万亿参数的模子将适配一台配有八个 MI325X 的系统主板,每个 GPU 齐有 288GB 的 HBM3E 内存容量。

据悉,MI325X 最快将在本年第四季度推出。不外到其时,英伟达将在该领域中凭借 B100 占据一隅之地,并将大范围量产 H200。因此,AMD 感受到了危境,况兼飞速作为。

这亦然为什么 AMD 提前推出 MI350X 的原因,它秉承了全新 CDNA 4 架构、台积电 3 纳米工艺、288 GB 的 HBM3E 内存以及 FP6、FP4 数据类型。MI350X 也将成为 AMD Instinct MI350 系列的第一款居品。

在推感性能方面,CDNA 4 架构是 CDNA 3 的 35 倍。

MI350 的内存容量将是英伟达 2025 年推出的 B200(Blackwell Ultra 架构)芯片的 1.5 倍,AI 狡计智商是后者的 1.2 倍。

AMD 这波便是奔着英伟达去的,到时分有好戏看了。

https://www.nextplatform.com/2024/06/03/amd-previews-turin-epyc-cpus-expands-instinct-gpu-roadmap/

https://www.anandtech.com/show/21415/amd-unveils-ryzen-9000-cpus-for-desktop-zen-5-takes-center-stage-at-computex-2024



 
 


Powered by 万博官方网站(官方)手机APP下载IOS/安卓/网页通用版入口 @2013-2022 RSS地图 HTML地图