7.7
深览指数
科技腾讯新闻·硅星人Pro··AI 生成

别骂国产大模型了,老外们正用得不亦乐乎

本文基于一系列案例(巴西市政府套壳中国开源模型、美国开发者对开源模型的选用偏好等)和最新评测数据,论证了一个核心反直觉判断:中国开源模型(如 DeepSeek、MiniMax M3、Qwen 等)已在海外开发者生态中占据主导地位,成为全球开源生态的底座供给方。作者指出,国内对国产模型的负面评价(盯着榜单 SOTA 吐槽、抱怨定价策略)与海外实际使用情况存在显著割裂。适合关注 AI 产业格局、开源生态演变、以及技术产品化视角的读者。原文 ↗

核心观点
  • 中国开源模型已在全球开发者生态中占据主导地位,成为海外公司构建产品时的首选底座,这与国内普遍存在的对国产模型的负面评价形成显著割裂。
  • 对开发者而言,模型的性价比、可控性(开源可部署可修改)和供应确定性,比追求单一 SOTA 指标更重要。
  1. 01巴西里约市政府下属 IT 公司发布的 Rio 3.5 模型,被发现六成权重来自国产模型 Nex-N2-Pro,四成来自阿里 Qwen,是彻头彻尾的套壳。
  2. 02Artificial Analysis 最新评测中,MiniMax M3 在开源模型里排第一(44 分),远超大多数模型;但跑同一任务,Claude Opus 4.8 成本(1.78 美元)是 M3(0.18 美元)的十倍。
  3. 03全球新增的开源衍生模型中基于 Qwen 的占比约七成,Llama 从两年前的 40% 跌至 10%。
  4. 04OpenRouter 等第三方调用平台周用量榜前几名几乎被中国模型包揽,包括 DeepSeek、MiniMax M3、腾讯混元等。
  5. 05Airbnb 公开表示大量使用中国开源模型运行客服 Agent。
反方 / 局限
  • 作者暗示国内对国产模型的负面评价,部分源于将模型能力、产品定价和公司声誉三个层面混为一谈,以及将其视为「中国 AI 原创性」的标尺而非实际工具。
  • 美国闭源模型(如 Claude Opus 4.8)在能力上限上仍领先中国开源模型(评测得分差十几分),对于追求极致性能的场景,闭源模型仍有不可替代性。
10 分钟 · 4 卡片 · 12 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问