央视报道揭示了当前毕业论文 AI 检测的底层逻辑与核心困境:AI 检测本质上是一种基于概率的分类,而非确定性判断。文章通过学生案例(AI 率越改越高)和专家解读,指出了用 AI 查 AI 的技术瓶颈、中文语言歧义导致的误判,以及当前“AI 率红线”设定的随意性。适合关心教育评估技术、AI 应用伦理的学生、教师及科技从业者阅读,用以理解 AI 检测的局限性,而非将其视为金科玉律。原文 ↗原文 ↗
核心观点
▍当前毕业论文 AI 检测的核心技术瓶颈在于「用 AI 查 AI」,这决定了其本质上是一种基于概率的分类,而非基于证据的确定性判断,因此无法做到 100% 准确。
▍文章认为,应对 AI 写作的正确路径应是建立「透明可回溯的 AI 使用标注制度」与「人工评议为主、AI 检测为辅」的「人机共判」模式,而非简单划定 AI 率红线。
01有学生案例显示,一篇 AI 率 62% 的论文,在要求大模型「改得像人写的」后,AI 率反而升至 94%。
02首都师范大学教育学院副院长蔡海龙指出,查重是确定性判断(对比语料库),而 AI 检测是概率性分类(检测文本在语言风格上与 AI 生成内容的重叠)。
03中文语言语义丰富、表达方式多样,导致 AI 检测系统在分析时易产生歧义,增加误判概率。
04当前 AI 检测的主流方法基于「困惑度」与「突发性」等特征:AI 文本通常更平滑、可预测;人类文本波动更大,充满意外表达。