6.1
深览指数
科技腾讯新闻·赛博浮世绘··AI 生成

影视飓风视频中,让AI抛硬币,正反面概率居然不是50%?

影视飓风团队发现,不同AI视频模型生成抛硬币视频时,正反面出现概率显著偏离50/50。文章从训练数据集差异、CFG采样参数、文本编码器和RLHF四个技术维度解释了这一现象的原理,指出数据偏见被模型放大是根本原因。适合对AI生成原理稍有了解、想理解AI偏见成因的读者。原文 ↗

核心观点
  • AI视频模型生成抛硬币时正反面概率非随机(约70%正面或75%反面),根本原因是训练集、采样参数和人类偏好对齐共同导致的系统性偏见放大。
  1. 01影视飓风团队尝试数百次文生视频,发现用Seedance 2.0模型约70%概率生成正面(数字面),而Happy Horse模型反面对应概率为75%。
  2. 02互联网上抛硬币相关视频中,展示人头面(正面)的数量远多于数字面,AI从这类不平衡数据中学习后继承统计概率。
  3. 03无分类器引导(CFG)会将训练集统计偏见指数级放大,当正面基础概率为55%、CFG权重w=7时,最终正面概率被放大约至92%。
  4. 04文本编码器(如CLIP)对“硬币”一词的语义理解侧重点不同:更关注“图案”则偏向生成清晰正面,更关注“动作”则偏向生成翻转过程。
  5. 05RLHF过程中人类测试员倾向给“能看清硬币数字”的视频打高分,倒逼模型修改输出分布以提高出现清晰正面(数字面)的概率。
反方 / 局限
  • 文章未讨论可能存在的其他因素(如模型架构差异、训练数据时间窗口、具体超参数配置),仅列出四个主要因素并承认“可能考虑不全面”。
影视飓风Seedance 2.0Happy Horse无分类器引导(CFG)CLIPRLHF
6 分钟 · 3 卡片 · 9 资料
读原文 →

前置背景

平行视角

延伸追问