7.5
深览指数
科技Bestblogs·美团 · 技术团队··AI 生成
美团海报生成 AIGC 技术创新与实践
美团技术团队系统介绍了其构建的「生成-编辑-评判」闭环海报生成 AIGC 技术体系,包含 PosterCraft、PosterOmni、PosterReward 三项核心工作,并已全部开源。文章详细阐述了百万中小商家在海报生成中面临的精准文字渲染、和谐版式布局、美学风格统一等五大技术挑战,以及团队如何通过四阶段级联训练、任务蒸馏与统一奖励模型等策略来逐一攻克。与行业常见的论文综述或产品宣发不同,作者从工程落地的视角,坦诚分享了合成数据质量控制、多任务冲突缓解等关键瓶颈的解决思路,对从事图像生成、多模态或多任务学习的工程师与研究者的有很强的参考价值。文章最后也指出了更强的可控性和更广场景覆盖等未来方向。原文 ↗
核心观点
- ▍构建「生成-编辑-评判」技术闭环是解决商业海报生产困境的系统性方案,PosterCraft、PosterOmni、PosterReward 三项工作相互支撑、协同进化。
- ▍端到端模型(PosterCraft)优于模块化流水线,能通过统一框架协同优化文字、视觉和版式,从而更好地保证美学一致性与文字渲染准确率。
- 01PosterCraft(ICLR 2026)采用四阶段级联训练策略,在文字渲染准确率上已接近闭源商业系统。
- 02PosterOmni(CVPR 2026)通过先分开训练局部编辑和全局创作专家,再通过任务蒸馏整合为统一学生模型,有效缓解了局部精修与全局重组之间的任务冲突。
- 03PosterReward(CVPR 2026)是首个面向海报质量评估的奖励模型,在专项评测基准上准确率达到了 86%。
- 04PosterOmni 实现了单一模型覆盖扩图、补全、比例调整、风格迁移等六类设计任务。
- 05营销海报图像结构化评估方案可从排版构图、色系搭配、氛围感风格等多维度进行解析,其积累的维度定义经验为 PosterReward 提供了领域知识参照。
- 06合成数据质量控制方面,PosterOmni 和 PosterReward 均设计了分层过滤与多模型共识机制,以降低合成数据的噪声。
反方 / 局限
- — 文章在最后指出当前工作仍面临「更强的可控性」和「更广的场景覆盖」等挑战,如对光线、材质、摄影风格的精细控制能力仍有不足。
- — 尽管在文字渲染上已接近闭源系统,但PosterCraft 在复杂版式下,特别是透明或纹理背景上叠加艺术字样时的稳定性仍是待解问题。
4 分钟 · 3 卡片 · 6 资料
读原文 →