科技腾讯新闻··AI 生成
2026“端侧AI战事”升级,苹果谷歌们在拼什么?
文章指出,2026年端侧大模型竞争已从单纯的模型参数压缩,转向模型、芯片、系统与应用间的软硬协同。苹果通过AFM3系列的稀疏架构和约200亿参数大模型切入,谷歌走蒸馏路线,国内面壁智能则押注极致量化和与国产芯片适配。文章通过对话面壁智能CEO李大海,揭示了端侧模型落地的核心瓶颈在于模型与芯片的软硬结合,并预判端云协同将成为主流,更多Agent任务将从云端前移至本地。适合关注AI硬件落地、端侧智能体趋势的从业者与投资者。原文 ↗原文 ↗
核心观点
- ▍端侧大模型竞争已从比拼参数规模和压缩比例,转向模型、芯片、系统、应用之间的整体配合,软硬协同决定最终体验。
- ▍端侧AI并非要取代云端,而是走向端云协同:高频、实时、隐私敏感任务在端侧完成,复杂重任务交给云端。
- 01苹果WWDC2026发布AFM3系列端侧大模型,主力模型约200亿参数,采用稀疏架构仅激活部分参数,以省算力。
- 02谷歌Gemini Nano由更大模型蒸馏而来,直接跑在Pixel、三星Galaxy等安卓手机本地。
- 03面壁智能联合清华、OpenBMB发布BitCPM-CANN,在华为昇腾平台验证1.58-bit三值大模型训练方案,将模型压缩到接近物理极限。
- 04面壁智能CEO李大海表示,其训练工作正逐步转移到国产芯片和集群,并参与智源研究院牵头的FlagOS国产AI软件生态。
- 05面壁端侧模型已在吉利银河M9等汽车场景实现量产,用户主动开启比例高;同时进入手机、无人机、潜水器等终端。
- 06不同终端对模型要求差异大:手机关注功耗和系统体验,汽车关注稳定性与交互安全,智能硬件看重体积、成本和本地响应。
反方 / 局限
- — 苹果端云协同战略在2024年6月公布,2026年才逐步落地,某种程度上晚于行业预期,说明端侧大模型是系统性工程而非单一模型问题。
- — 训练迁移到国产芯片比推理更复杂,需要验证数值精度、稳定性和长时间运行能力,国产芯片软件栈不统一是最大挑战。
- — 1.58bit可能已接近模型量化极限,继续压缩空间小,核心挑战在于高压缩比下保持能力不出现明显损失。
AFM3系列稀疏架构Gemini Nano1.58-bit三值大模型QAT量化感知训练面壁智能苹果谷歌高通华为昇腾FlagOS李大海端云协同吉利银河M9
13 分钟 · 5 卡片 · 15 资料
读原文 →概念锚点
前置背景
平行视角
未来推演
延伸追问