科技腾讯新闻·一只小茄墩··AI 生成
百度把 DeepSeek 的人挖过来了?
文章基于百度新开源的 Unlimited OCR 模型的技术细节和作者名单,推测百度可能挖角了 DeepSeek 的 OCR 核心研发人员。核心证据是技术路线高度相似 DeepSeek OCR,且论文作者中仅技术总监以缩写「YY」署名,疑似 DeepSeek V4 技术报告中标注已离职的成员。文章技术分析部分扎实,但人事猜测部分缺乏直接证实。适合对 AI 模型技术演进及行业人才流动感兴趣的读者。原文 ↗原文 ↗
核心观点
- ▍百度新开源的 Unlimited OCR 模型,其技术路线和团队背景强烈暗示挖角了 DeepSeek 的 OCR 核心研发人员。
- 01Unlimited OCR 在 DeepSeek OCR 基础上改进,主要解决长文档解析中 KV 缓存膨胀问题。
- 02Unlimited OCR 提出的方案是 R-SWA(参考滑动窗口注意力),让每个 token 能看完整图像,但只回看最近的 128 个输出 token,确保 KV 缓存大小恒定。
- 03该模型在 OmniDocBench v1.5 上总分 93.23%,比 DeepSeek OCR 高 6 个多点;40+ 页长文档可一次推理完成,编辑距离仅 0.107。
- 04模型参数仅 3B(MoE 架构,激活量 500M),在输出 6000 token 时推理速度比 DeepSeek OCR 快 35%,且差距会随输出长度扩大。
- 05论文作者名单中,核心贡献者三人:Youyang Yin、Huanhuan Liu(项目负责人)、YY(技术总监)。两人用全名,技术总监仅用缩写「YY」。
- 06DeepSeek V4 技术报告中有 10 个名字标注已离职,目前已知郭达雅、罗福莉等已有去向。
- 07Unlimited OCR 的 GitHub 致谢栏优先感谢了 DeepSeek-OCR 和 DeepSeek-OCR-2。
反方 / 局限
- — 作者对「YY 是否是 DeepSeek 某位被挖员工」的结论并非直接证实,而是基于缩写的猜测和线索关联(GitHub 致谢、人才流动背景)。
概念锚点
前置背景
平行视角
未来推演
延伸追问