2026“端侧AI战事”升级，苹果谷歌们在拼什么？

7.2

深览指数

科技腾讯新闻·5小时前·AI 生成

2026“端侧AI战事”升级，苹果谷歌们在拼什么？

文章指出，2026年端侧大模型竞争已从单纯的模型参数压缩，转向模型、芯片、系统与应用间的软硬协同。苹果通过AFM3系列的稀疏架构和约200亿参数大模型切入，谷歌走蒸馏路线，国内面壁智能则押注极致量化和与国产芯片适配。文章通过对话面壁智能CEO李大海，揭示了端侧模型落地的核心瓶颈在于模型与芯片的软硬结合，并预判端云协同将成为主流，更多Agent任务将从云端前移至本地。适合关注AI硬件落地、端侧智能体趋势的从业者与投资者。原文 ↗原文 ↗

核心观点

▍端侧大模型竞争已从比拼参数规模和压缩比例，转向模型、芯片、系统、应用之间的整体配合，软硬协同决定最终体验。
▍端侧AI并非要取代云端，而是走向端云协同：高频、实时、隐私敏感任务在端侧完成，复杂重任务交给云端。

01苹果WWDC2026发布AFM3系列端侧大模型，主力模型约200亿参数，采用稀疏架构仅激活部分参数，以省算力。
02谷歌Gemini Nano由更大模型蒸馏而来，直接跑在Pixel、三星Galaxy等安卓手机本地。
03面壁智能联合清华、OpenBMB发布BitCPM-CANN，在华为昇腾平台验证1.58-bit三值大模型训练方案，将模型压缩到接近物理极限。
04面壁智能CEO李大海表示，其训练工作正逐步转移到国产芯片和集群，并参与智源研究院牵头的FlagOS国产AI软件生态。
05面壁端侧模型已在吉利银河M9等汽车场景实现量产，用户主动开启比例高；同时进入手机、无人机、潜水器等终端。
06不同终端对模型要求差异大：手机关注功耗和系统体验，汽车关注稳定性与交互安全，智能硬件看重体积、成本和本地响应。

反方 / 局限

— 苹果端云协同战略在2024年6月公布，2026年才逐步落地，某种程度上晚于行业预期，说明端侧大模型是系统性工程而非单一模型问题。
— 训练迁移到国产芯片比推理更复杂，需要验证数值精度、稳定性和长时间运行能力，国产芯片软件栈不统一是最大挑战。
— 1.58bit可能已接近模型量化极限，继续压缩空间小，核心挑战在于高压缩比下保持能力不出现明显损失。

AFM3系列稀疏架构Gemini Nano1.58-bit三值大模型QAT量化感知训练面壁智能苹果谷歌高通华为昇腾FlagOS李大海端云协同吉利银河M9

13 分钟 · 5 卡片 · 15 资料

读原文 →

2026“端侧AI战事”升级，苹果谷歌们在拼什么？

概念锚点

前置背景

平行视角

未来推演

延伸追问