5.7
深览指数
科技智东西··AI 生成
时隔4个月,谷歌Nano Banana再发新模型
谷歌于7月1日发布两款新模型:图像生成模型Nano Banana 2 Lite和视频生成编辑模型Gemini Omni Flash。Nano Banana 2 Lite主打近实时、低成本(每张约0.23元人民币,延迟约4秒),作为初代Nano Banana的替代品;Gemini Omni Flash首次开放开发者预览,支持文本、图像、视频输入的多轮视频编辑,目前支持10秒生成,输出价格每秒0.68元人民币,在评测中整体偏好和指令遵循得分领先竞品。此次更新展示了谷歌将快速图像生成与可编辑视频生成串联的工作流,但Gemini Omni Flash在时长、场景切换时的角色一致性上仍有明显限制。适合关注AI领域模型能力迭代和应用落地的读者。原文 ↗
核心观点
- ▍谷歌通过发布Nano Banana 2 Lite和Gemini Omni Flash,将快速低成本图像生成与可编辑视频生成串联,加速构建从静态到动态的生成式媒体工作流。
- 01Nano Banana 2 Lite是推荐替代初代Nano Banana的模型,主打近实时、较高质量图像生成,生成1K分辨率图像延迟约4秒,价格0.034美元起。
- 02Gemini Omni Flash首次面向开发者公开预览,支持文本、图像、视频输入和自然语言多轮视频编辑,目前支持10秒视频生成,输出价格为每秒0.10美元。
- 03评测显示,Gemini Omni Flash在视频编辑模型中整体偏好得分1087、指令遵循得分1082,均排名第一,领先HappyHorse、Kling v3 Pro、Seedance 2.0等模型。
- 04Nano Banana 2 Lite的图像生成Elo分数为1251,略低于Nano Banana 2的1270,但速度更快,成本更低。
- 05谷歌推出了Anywhere、Space Lift、Omni Product Studio等演示应用,展示从自拍换地标、室内设计预览到电商视频生成的图像到视频工作流。
反方 / 局限
- — Gemini Omni Flash当前仅支持最长10秒视频生成,且API暂不支持上传音频参考和场景扩展。
- — Gemini Omni Flash在切换场景或平移动作时,角色一致性仍有局限。
13 分钟 · 4 卡片 · 9 资料
读原文 →