6.5
深览指数
产品量子位··AI 生成
刚刚,豆包2.1发布!Agent自己跑18个小时搞定芯片设计代码
字节跳动发布Seed 2.1系列大模型(含Pro和Turbo两个版本),并在芯片设计RTL环节展示了连续运行近18小时、9轮迭代,完成1303行代码的Agent能力。本文通过实测展示了其在3D WebGL开发、PPT生成、数据分析、截图转PRD等任务中的表现,并指出其核心变化是从“聊天能力”转向“生产级可用”。文章同时披露了豆包日均Token使用量已突破180万亿。适合关注国产大模型进展和AI Agent应用落地的从业者阅读。原文 ↗
核心观点
- ▍字节Seed 2.1系列的核心变化不是榜单分数上涨,而是从‘聊天能力’转向‘生产级可用’,其输出可以进入真实工作流。
- ▍字节的优势在于将同一个模型底座(Seed 2.1 Pro)同时接入火山方舟、豆包、TRAE、扣子等多个高频产品入口,这比单一模型发布更有战略意义。
- 01Seed 2.1 Pro在芯片设计RTL环节,连续运行近18小时,经历9轮迭代,完成了6个核心模块、1303行RTL代码,而这项工作通常需要3-5名人类工程师数周完成。
- 02在Terminal Bench 2.1评测中,Seed 2.1 Pro与Claude Opus 4.7持平;在SciCode科学计算评测上,超过Opus 4.7和GPT-5.5。
- 03Seed 2.1 Pro价格仅为Opus 4.6-4.8的1/4,每百万Token输入6元、输出30元,缓存命中仅需1.2元。
- 04豆包日均Token使用量已突破180万亿。
- 05实测中,Seed 2.1 Pro能一次性生成包含目录、10页内容、SVG图表和讲稿完整PPT,以及带排版的Word分析报告和整理好的Excel数据。
- 06Seed 2.1 Pro已同步进入TRAE、TRAE WORK、扣子等字节系产品,并上线豆包‘办公任务’模式。
- 07Seedance视频生成模型升级至2.5版本,可单次直出30秒视频,预计7月初上线。
反方 / 局限
- — 从实测看,Seed 2.1 Pro的输出还不能完全脱离人工审核:数据分析会出现细节不一致,PPT里的行业数据需要核验,代码项目离生产系统还有工程距离。
- — 作者承认Seed 2.1 Pro目前最适合的位置是‘第一生产力助手’——完成70%粗活后,仍需人类做最后30%的判断、校验和润色。
21 分钟 · 3 卡片 · 6 资料
读原文 →