4.7
深览指数
科技腾讯新闻··AI 生成

AMD和Intel联手,发力AI

AMD与Intel联合发布了面向x86架构的AI计算扩展(ACE)最新规范,旨在通过硬件原语加速矩阵乘法,提升AI工作负载效能。该规范整合了ACE寄存器、数据处理与移动操作,是对现有AVX10等SIMD扩展的针对性补充。文章为技术规范编译报道,适合对x86指令集演进和AI加速硬件感兴趣的读者,但缺乏独立分析与行业影响判断。原文 ↗

核心观点
  • AMD与Intel联合定义的ACE扩展将重点解决当前x86架构在AI矩阵乘法上的性能瓶颈,通过硬件原语提升计算密度与能效。
  1. 01ACE扩展定义了新的寄存器状态(图块、块缩放寄存器)、数据处理操作(消耗AVX输入、操作图块寄存器)和数据移动操作,实现AVX向量与瓦片寄存器的紧密集成。
  2. 02当前SIMD扩展(如AVX10)虽能进行矩阵乘法,但其可扩展性与计算密度有限,ACE旨在同时加速矩阵乘法并提供更高灵活性。
  3. 03ACE规范支持多种数据格式,包括对矩阵乘法的原生格式、OCP MX风格缩放支持、累加格式及格式转换操作。
  4. 04ACE是x86生态咨询小组(EAG)工作的一部分,该小组还涉及APX(高级性能扩展)等其他关键改进。
反方 / 局限
  • 文章仅为官方技术规范编译,未提及ACE与其他厂商(如ARM的SVE/SME、RISC-V的V扩展)在AI加速路线上的竞争或劣势,也缺乏对实际产品落地时间表的预期。
ACEAVX10APXAMDIntelx86生态系统咨询小组SIMD矩阵乘法OCP MX
3 分钟 · 5 卡片 · 13 资料
读原文 →

概念锚点

前置背景

平行视角

未来推演

延伸追问