6.4
深览指数
科技腾讯新闻·芯东西··AI 生成
单颗CPU跑1000个智能体,英特尔在数据中心摊牌了!腾讯云金山云抢先落子
英特尔在数据中心创新日上提出,智能体时代需要算力、存力、连接力、保障力四种支撑力,并宣布其至强6+处理器单颗可支持超过1000个智能体部署。文章详细拆解了英特尔围绕至强6/6+构建的从CPU、GPU、存储到网络的完整智算方案,并公布了与腾讯云、金山云、新华三、阿里云、火山引擎等中国生态伙伴的合作进展与具体性能数据。对于关注AI基础设施选型、x86生态走向及数据中心TCO优化的从业者,本文提供了详细的路线图与实测参考。原文 ↗
核心观点
- ▍进入智能体时代,CPU正重回数据中心算力基建的焦点,其核心作用在于统筹编排、调度协调,而非仅作通用计算;英特尔认为构建高性能集群需要算力、存力、连接力、保障力四种支撑力。
- ▍英特尔至强6+(288个能效核)和至强6(性能核)形成差异化定位:能效核适用于高密度、低单核性能要求的智能体并发运行场景(单核可跑3-4个智能体,单颗支持超1000个),性能核则适用于智能体触发的重负载任务(如数据库、SAP)。
- 01英特尔新一代数据中心GPU(Crescent Island)基于Xe3P架构,采用LPDDR5x内存(最高480GB),350W TDP,8张卡可在FP8精度下运行1.6万亿参数的DeepSeek-V4。
- 02至强6+与第二代至强相比可实现9:1的服务器整合率;与竞品相比,平均每线程性能提升30%,平均每瓦性能提升55%。
- 03Intel QAT硬件压缩引擎可将KV Cache压缩比达到至少50%,相比纯软件方式带来4倍的首Token延迟性能提升;Intel IAA技术可将Sandbox Snapshot冷启动速度提升30%,降低I/O延迟高达60%。
- 04基于Falcon协议的以太网方案,仅用标准以太网交换机即可达到与专用网络接近的带宽与低延时性能,避免了被特定厂商(如英伟达的InfiniBand)绑定,集群尾部延迟降低约40%。
- 05腾讯云基于至强6+的288核大规格虚机实例即将上线;金山云高效型SE10实例已内测上线,单Socket性能提升138%,单vCPU性能提升30%。
- 06阿里云在至强6平台上使用新QAT引擎替换软件压缩后,压缩带宽提升400%,同时减少75%的通用CPU核数。
- 07第三机构调查显示,CPU与GPU部署比例从去年的1:8、1:4变成现在的1:2,CPU比例在提升;一家国内头部大模型厂商对CPU的需求一年内涨了5倍。
- 08英特尔CEO陈立武已宣布超线程等功能会加回来,陈葆立将此定义为另一种维度的“弹性”,允许客户在虚拟核数翻倍与更高单核性能之间选择。
反方 / 局限
- — 作者承认当智能体数量增加、单个处理器核心被切分运行3-4个智能体时,单个智能体的算力性能会有所递减,更适合处理相对初级、简单的工作(如市场调研、查询机票),而调数据库、跑SAP等重负载仍需调用性能核。
英特尔至强6英特尔至强6+Intel 18AFoveros Direct 3D封装Intel QAT (Quick Assist Technology)Intel IAA (In-Memory Analytics Accelerator)TDX (Trust Domain Extensions)Falcon协议Xe3P架构DeepSeek-V4腾讯云金山云新华三阿里云火山引擎陈葆立Brett Hannath高宇
19 分钟 · 4 卡片 · 11 资料
读原文 →