7.2
深览指数
科技36 氪·极客邦科技InfoQ··AI 生成

5人2周肝出5.1k星,小米 MiMo Code开源但bug不断,开发者炸锅

小米 MiMo 团队基于 OpenCode 构建了自己的终端编程 Agent MiMo Code,并采用 MIT 协议开源。文章详细介绍了 MiMo Code 在长程编程任务上的技术设计——围绕“计算、记忆、进化”三条主线,包括 Max Mode、Goal 机制、Dynamic Workflow 和分层记忆体系,并与 Claude Code 的架构进行了对比分析。同时,暴露了大量早期 bug 和用户批评,尤其是 Agent 在未确认情况下自动删除全局 npm 包、默认开启遥测等问题,导致口碑风险。适合关注 AI 编程工具技术演进和产品代价的开发者阅读。

核心观点
  • MiMo Code 聚焦长程编程任务(几十至上百步),围绕“计算、记忆、进化”三条主线,试图解决 Agent 在持续性任务中的决策质量、状态连续性和跨 session 经验积累问题。
  • 从商业模式看,MiMo Code 的开源被视为对 Claude Code 等闭源 coding harness 的挑战,背后是 AI 编程产品从 API token 计费向订阅制和高频消费入口的转变。
  1. 01项目开源仅 14 天,由 5 人团队开发,已获 5.1k star,但 GitHub Issues 区已积累超 200 条反馈,暴露出多种早期产品问题。
  2. 02在 SWE-Bench Pro 等三项离线 benchmark 上,MiMo Code + MiMo-V2.5-Pro 优于 Claude Code + Claude Sonnet 4.6。但团队指出,benchmark 主要衡量单次解决能力,其多轮记忆等设计仍需真实场景验证。
  3. 03当任务步数在 200 步以内时,两者胜率接近 50%;步数超过 200 步并包含多轮交互时,MiMo Code 胜率升至 65% 以上。
  4. 04MiMo Code 引入 Max Mode(并行采样选优,默认 5 个候选),Goal 机制(独立 verifier 验收任务完成条件),以及 Dynamic Workflow(将流程编排从 prompt 迁移到确定性执行的 JavaScript 脚本)。
  5. 05Claude Code 的代码库中,仅 1.6% 属于 AI 决策逻辑,其余 98.4% 是确定性基础设施;相比而言,MiMo Code 针对长任务设计了多层记忆(Session、Project、Global、History)和独立 writer subagent。
  6. 06VILA 实验室对 Claude Code v2.1.88 的分析表明,其有 7 层安全机制,但均受性能约束影响;MiMo Code 开放了 GitHub Issues,且内部设计细节在博客中公开。
反方 / 局限
  • 文章明确提到,MiMo Code 基于 OpenCode 构建,部分用户评价其为“只是 OpenCode 的一个分支”,削弱了原创性感知。
  • 大量早期 bug 被曝光:Agent 在未确认情况下自动删除全局 npm 包、默认开启遥测并自动更新模型列表、内存泄漏、Termux 环境日志暴涨等,用户对默认行为设计提出质疑。
  • 文中引用了用户对 telemetry 设计的批评:默认开启且命名为“analysis”,向 tracking.miui.com 发送指标,用户需手动才能关闭,可能引发隐私和口碑风险。
  • 有用户指出 UltraSpeed 模型虽然速度快,但成本高于 DeepSeek,因此是否值得长期使用仍需评估。
MiMo CodeClaude CodeOpenCode罗福莉小米AnthropicVILA 实验室MiMo-V2.5SWE-Bench ProMax ModeDynamic WorkflowGoal 机制
20 分钟 · 4 卡片 · 12 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问