影视飓风视频中,让AI抛硬币,正反面概率居然不是50%？ - 深览

6.1

深览指数

科技腾讯新闻·赛博浮世绘·3小时前·AI 生成

影视飓风视频中,让AI抛硬币,正反面概率居然不是50%？

影视飓风团队发现，不同AI视频模型生成抛硬币视频时，正反面出现概率显著偏离50/50。文章从训练数据集差异、CFG采样参数、文本编码器和RLHF四个技术维度解释了这一现象的原理，指出数据偏见被模型放大是根本原因。适合对AI生成原理稍有了解、想理解AI偏见成因的读者。原文 ↗原文 ↗

核心观点

▍AI视频模型生成抛硬币时正反面概率非随机（约70%正面或75%反面），根本原因是训练集、采样参数和人类偏好对齐共同导致的系统性偏见放大。

01影视飓风团队尝试数百次文生视频，发现用Seedance 2.0模型约70%概率生成正面（数字面），而Happy Horse模型反面对应概率为75%。
02互联网上抛硬币相关视频中，展示人头面（正面）的数量远多于数字面，AI从这类不平衡数据中学习后继承统计概率。
03无分类器引导（CFG）会将训练集统计偏见指数级放大，当正面基础概率为55%、CFG权重w=7时，最终正面概率被放大约至92%。
04文本编码器（如CLIP）对“硬币”一词的语义理解侧重点不同：更关注“图案”则偏向生成清晰正面，更关注“动作”则偏向生成翻转过程。
05RLHF过程中人类测试员倾向给“能看清硬币数字”的视频打高分，倒逼模型修改输出分布以提高出现清晰正面（数字面）的概率。

反方 / 局限

— 文章未讨论可能存在的其他因素（如模型架构差异、训练数据时间窗口、具体超参数配置），仅列出四个主要因素并承认“可能考虑不全面”。

影视飓风Seedance 2.0Happy Horse无分类器引导（CFG）CLIPRLHF

6 分钟 · 3 卡片 · 9 资料

前置背景

平行视角

延伸追问