6.0
深览指数
科技腾讯新闻·华尔街见闻··AI 生成
Token调用量增长超10倍!豆包大模型2.1上线,Seedance 2.5预计7月初正式上线
火山引擎发布了豆包大模型2.1系列,包含Pro和Turbo版本,并披露其日均Token调用量已达180万亿,市占率位居中国MaaS市场第一。文章的核心价值在于提供了豆包2.1 Pro在多项国际基准测试(如SWE-Pro、NL2Repo-Bench、SciCode)上对标甚至超越GPT-5.5和Claude Opus 4.7的具体数据与案例,展现了其在Coding、Agent任务和多模态理解上的能力跃升。同时,文章也介绍了Seedance 2.5视频生成模型和音频模型1.0的进展,以及极具竞争力的定价策略。适合关注大模型产业竞争、技术迭代及企业AI采购决策的深度读者阅读,用于评估国内模型与国际顶尖模型的实际差距和商业可行性。原文 ↗
核心观点
- ▍火山引擎通过密集的产品迭代(豆包2.1、Seedance 2.5、音频模型1.0)、极具攻击性的定价策略和快速的商业化落地,展现出在中国生产级AI市场全面领先的态势,其模型能力在多维度已逼近或超越国际顶尖模型。
- 01截至今年6月,豆包大模型日均Token调用量突破180万亿,较去年增长超10倍;火山引擎在中国公有云MaaS服务市场以49.5%的份额位居第一。
- 02豆包大模型2.1 Pro在长程软件开发基准SWE-Pro上表现接近GPT-5.5;在科学计算代码评测SciCode上以59.8分超过Claude Opus 4.7和GPT-5.5。
- 03在通用Agent能力方面,豆包大模型2.1 Pro在OpenAI发布的GDPval基准上获得最高分;在刚发布的Agents' Last Exam评测上超越Claude Opus 4.7。
- 04豆包大模型2.1 Pro在代码生成上有真实生产级案例:连续运行近18小时,经9轮迭代,生成1303行RTL代码并通过完整工程验证。
- 05豆包大模型2.1 Pro在MCP-Atlas评测集和桌面端GUI Agent能力上全面超越或接近Claude Opus 4.7与GPT-5.5。
- 06豆包大模型2.1 Pro的售价极具竞争力,在Coding和Agent场景下综合成本仅每百万Tokens 1.96元。
- 07视频生成模型Seedance 2.5预计7月初发布,支持30秒视频生成和50个全模态素材联合输入;音频生成模型1.0同步开启邀测。
反方 / 局限
- — 文章的基准测试数据(如与GPT-5.5、Claude Opus 4.7的对比)主要来自火山引擎的单方面披露,缺乏第三方独立验证机构的复现,其真实性能水平在学术界和企业实际部署中仍需进一步检验。
7 分钟 · 4 卡片 · 8 资料
读原文 →