别骂国产大模型了，老外们正用得不亦乐乎

7.7

深览指数

科技腾讯新闻·硅星人Pro·4小时前·AI 生成

别骂国产大模型了，老外们正用得不亦乐乎

本文基于一系列案例（巴西市政府套壳中国开源模型、美国开发者对开源模型的选用偏好等）和最新评测数据，论证了一个核心反直觉判断：中国开源模型（如 DeepSeek、MiniMax M3、Qwen 等）已在海外开发者生态中占据主导地位，成为全球开源生态的底座供给方。作者指出，国内对国产模型的负面评价（盯着榜单 SOTA 吐槽、抱怨定价策略）与海外实际使用情况存在显著割裂。适合关注 AI 产业格局、开源生态演变、以及技术产品化视角的读者。原文 ↗原文 ↗

核心观点

▍中国开源模型已在全球开发者生态中占据主导地位，成为海外公司构建产品时的首选底座，这与国内普遍存在的对国产模型的负面评价形成显著割裂。
▍对开发者而言，模型的性价比、可控性（开源可部署可修改）和供应确定性，比追求单一 SOTA 指标更重要。

01巴西里约市政府下属 IT 公司发布的 Rio 3.5 模型，被发现六成权重来自国产模型 Nex-N2-Pro，四成来自阿里 Qwen，是彻头彻尾的套壳。
02Artificial Analysis 最新评测中，MiniMax M3 在开源模型里排第一（44 分），远超大多数模型；但跑同一任务，Claude Opus 4.8 成本（1.78 美元）是 M3（0.18 美元）的十倍。
03全球新增的开源衍生模型中基于 Qwen 的占比约七成，Llama 从两年前的 40% 跌至 10%。
04OpenRouter 等第三方调用平台周用量榜前几名几乎被中国模型包揽，包括 DeepSeek、MiniMax M3、腾讯混元等。
05Airbnb 公开表示大量使用中国开源模型运行客服 Agent。

反方 / 局限

— 作者暗示国内对国产模型的负面评价，部分源于将模型能力、产品定价和公司声誉三个层面混为一谈，以及将其视为「中国 AI 原创性」的标尺而非实际工具。
— 美国闭源模型（如 Claude Opus 4.8）在能力上限上仍领先中国开源模型（评测得分差十几分），对于追求极致性能的场景，闭源模型仍有不可替代性。

DeepSeek MiniMax Qwen GLM Rio 3.5 Rakuten AI OpenRouter Anthropic Airbnb Llama SOTA Artificial Analysis

10 分钟 · 4 卡片 · 12 资料

读原文 →

别骂国产大模型了，老外们正用得不亦乐乎

前置背景

平行视角

未来推演

延伸追问