科技 腾讯新闻 · 硅星人Pro · 4小时前 · AI 生成
别骂国产大模型了,老外们正用得不亦乐乎 本文基于一系列案例(巴西市政府套壳中国开源模型、美国开发者对开源模型的选用偏好等)和最新评测数据,论证了一个核心反直觉判断:中国开源模型(如 DeepSeek、MiniMax M3、Qwen 等)已在海外开发者生态中占据主导地位,成为全球开源生态的底座供给方。作者指出,国内对国产模型的负面评价(盯着榜单 SOTA 吐槽、抱怨定价策略)与海外实际使用情况存在显著割裂。适合关注 AI 产业格局、开源生态演变、以及技术产品化视角的读者。原文 ↗ 原文 ↗
核心观点
▍ 中国开源模型已在全球开发者生态中占据主导地位,成为海外公司构建产品时的首选底座,这与国内普遍存在的对国产模型的负面评价形成显著割裂。 ▍ 对开发者而言,模型的性价比、可控性(开源可部署可修改)和供应确定性,比追求单一 SOTA 指标更重要。 01 巴西里约市政府下属 IT 公司发布的 Rio 3.5 模型,被发现六成权重来自国产模型 Nex-N2-Pro,四成来自阿里 Qwen,是彻头彻尾的套壳。 02 Artificial Analysis 最新评测中,MiniMax M3 在开源模型里排第一(44 分),远超大多数模型;但跑同一任务,Claude Opus 4.8 成本(1.78 美元)是 M3(0.18 美元)的十倍。 03 全球新增的开源衍生模型中基于 Qwen 的占比约七成,Llama 从两年前的 40% 跌至 10%。 04 OpenRouter 等第三方调用平台周用量榜前几名几乎被中国模型包揽,包括 DeepSeek、MiniMax M3、腾讯混元等。 05 Airbnb 公开表示大量使用中国开源模型运行客服 Agent。 反方 / 局限
— 作者暗示国内对国产模型的负面评价,部分源于将模型能力、产品定价和公司声誉三个层面混为一谈,以及将其视为「中国 AI 原创性」的标尺而非实际工具。 — 美国闭源模型(如 Claude Opus 4.8)在能力上限上仍领先中国开源模型(评测得分差十几分),对于追求极致性能的场景,闭源模型仍有不可替代性。 10 分钟 · 4 卡片 · 12 资料
读原文 →
前置背景 两年从1%飙到41%的底层逻辑
国产开源模型的全球份额从2024年的不到1%跃升至2026年的41%,只用了不到两年。核心推力有三个:一是DeepSeek-R1在2025年初用600万美元成本引爆了性价比革命;二是Meta的Llama迭代放缓、Behemoth转向闭源,直接让出第一梯队生态位;三是中国团队在MoE架构、稀疏注意力上的工程创新,把推理成本压缩到闭源模型的1/10-1/20。这波不只是降价,是供给侧的重新锚点——全球开发者发现‘够用且可控’比‘SOTA’更值钱。
▸ 3 条关联资料
▼
平行视角 SOTA执念vs.产品账本
同一个MiniMax M3,海外在算账:AA榜单开源第一,44分,跑一个任务只要0.18美元,是Claude Opus 4.8(1.78美元)的十分之一;国内在吵套餐价格、骂老用户权益缩水。盯榜单的人看到差十几分就判输赢,做产品的人问的是‘这十几分值不值几十倍成本’。Vercel CEO实测称M3紧随Opus和GPT-5却便宜十倍,可这种声音在国内讨论里几乎被价格战和‘是不是蒸馏’的质疑淹没。两边的评价体系已彻底脱节。
▸ 3 条关联资料
▼
未来推演 开源‘印钞机’怎么造
DeepSeek 700亿融资揭示了开源商业化的核心矛盾:API收入可能被本地推理引擎(如ds4.c)侵蚀,而万亿参数迭代成本已突破1亿美元。DeepSeek的解法是分层变现——基础模型MIT协议开源维持信任,企业级API定价仅为竞品1/10,靠金融、工业定制方案盈利,同时60%融资砸向国产算力基建摆脱英伟达依赖。但摩根大通警告其盈利窗口仅剩6-12个月。能否跑通‘生态反哺研发’的飞轮,是2026-2027年最大的变量。
▸ 3 条关联资料
▼
延伸追问 闭源厂商为何集体倒向闭源
当中国团队用开源模型撑起全球七成衍生模型时,美国最前沿的几家却在收缩开源:Anthropic根本不开放权重,OpenAI六年才发一次又没了下文,连一度是开源旗手的Meta都被报道打算放弃Behemoth转向闭源。为什么不是‘强者越强越敢开源’?一个关键变量是商业化压力——Meta在AI上每年投入数百亿美元,需要清晰的盈利路径,而开源带来的生态价值在财报上却难以量化。更值得追问的是:如果最大玩家都退出了,中国团队能否独自维持开源生态的可持续迭代?
▸ 3 条关联资料
▼