6.2
深览指数
科技虎嗅·夕小瑶科技说©··AI 生成

GLM5.2、Kimi2.7、DeepSeek V4、MiniMax M3最佳搭配清单,你可以直接抄

作者基于自身作为AI博主在日常写稿、拆产品需求、写代码、处理多模态资料等真实工作流中的体感,给出了GLM 5.2、Kimi 2.7 Code、DeepSeek V4、MiniMax M3四款国产大模型的选型搭配建议。核心结论是按场景分:代码主力用GLM 5.2(但难抢),替补用Kimi 2.7 Code;多模态资料处理优先MiniMax M3;批量低成本任务用DeepSeek V4。文章深入分析了各模型的“信任余额”问题,指出当前国产模型与闭源海外模型的核心差距不在能力而在用户隐性的信任积累。适合正在为不同AI任务选择性价比方案的深度AI使用者。原文 ↗

核心观点
  • 当前国产大模型(GLM 5.2、Kimi 2.7 Code、DeepSeek V4、MiniMax M3)各有明确的长短板与适用场景,没有全能冠军,用户应按任务类型而非榜单排名选择模型组合。
  1. 01作者将用户分为不写代码(文案类)和写代码两类:文案首选DeepSeek V4 Pro网页版;处理截图、PDF、音视频等多模态资料的人优先考虑MiniMax M3(原生多模态强、1M长上下文)。
  2. 02编程任务中,GLM 5.2被作者视为编程能力最强且已信任到用于协助删库,但需每天早上十点抢购Coding plan且并发量低;Kimi 2.7 Code作为编程替补,速度稳定但模型能力稍逊于GLM 5.2。
  3. 03批量内容生产、数据清洗等对并发要求高的任务,作者推荐使用DeepSeek V4 Flash和MiniMax M3的API,因其价格更低。处理500份长文档约花费一元钱。
  4. 04作者个人体验,DeepSeek在短任务上表现灵活、便宜,但长任务上表现不稳定,存在“表演”风险;Kimi 2.7 Code被部分社区风评认为像是“小号Gemini”。
  5. 05MiniMax M3是作者最感意外的模型,原生多模态能力强,但早期速度慢,近期已有改善并实行永久半价策略。
  6. 06作者购买的四种中档Coding plan套餐约每月400多元,用于维护三五个小项目完全够用。
反方 / 局限
  • 作者坦诚承认,虽然国产模型在能力上正快速追赶,但用户对国产模型存在隐性的「信任余额」不足:当Claude或OpenAI出错时,用户会自动为其找补,而国产模型出错则被直接归类为不靠谱。
  • 文章暗示,作者对GLM 5.2和MiniMax M3的正面评价可能受限于个人体验而非广泛共识;同时,这些模型在长任务上的可靠性和幻觉率仍是潜在问题。
  • 文章未深入讨论这些模型在数学、推理等非编程任务上的真实表现,也未涉及与海外头部模型(如GPT-4o、Claude 3.5 Sonnet)在同场景下的直接对比。
GLM 5.2Kimi 2.7 CodeDeepSeek V4MiniMax M3智谱AI月之暗面DeepSeekMiniMaxClaude CodeCoding plan
10 分钟 · 4 卡片 · 10 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问