7.0
深览指数
科技腾讯新闻·一只小茄墩··AI 生成

百度把 DeepSeek 的人挖过来了?

文章基于百度新开源的 Unlimited OCR 模型的技术细节和作者名单,推测百度可能挖角了 DeepSeek 的 OCR 核心研发人员。核心证据是技术路线高度相似 DeepSeek OCR,且论文作者中仅技术总监以缩写「YY」署名,疑似 DeepSeek V4 技术报告中标注已离职的成员。文章技术分析部分扎实,但人事猜测部分缺乏直接证实。适合对 AI 模型技术演进及行业人才流动感兴趣的读者。原文 ↗

核心观点
  • 百度新开源的 Unlimited OCR 模型,其技术路线和团队背景强烈暗示挖角了 DeepSeek 的 OCR 核心研发人员。
  1. 01Unlimited OCR 在 DeepSeek OCR 基础上改进,主要解决长文档解析中 KV 缓存膨胀问题。
  2. 02Unlimited OCR 提出的方案是 R-SWA(参考滑动窗口注意力),让每个 token 能看完整图像,但只回看最近的 128 个输出 token,确保 KV 缓存大小恒定。
  3. 03该模型在 OmniDocBench v1.5 上总分 93.23%,比 DeepSeek OCR 高 6 个多点;40+ 页长文档可一次推理完成,编辑距离仅 0.107。
  4. 04模型参数仅 3B(MoE 架构,激活量 500M),在输出 6000 token 时推理速度比 DeepSeek OCR 快 35%,且差距会随输出长度扩大。
  5. 05论文作者名单中,核心贡献者三人:Youyang Yin、Huanhuan Liu(项目负责人)、YY(技术总监)。两人用全名,技术总监仅用缩写「YY」。
  6. 06DeepSeek V4 技术报告中有 10 个名字标注已离职,目前已知郭达雅、罗福莉等已有去向。
  7. 07Unlimited OCR 的 GitHub 致谢栏优先感谢了 DeepSeek-OCR 和 DeepSeek-OCR-2。
反方 / 局限
  • 作者对「YY 是否是 DeepSeek 某位被挖员工」的结论并非直接证实,而是基于缩写的猜测和线索关联(GitHub 致谢、人才流动背景)。
4 分钟 · 5 卡片 · 9 资料
读原文 →

概念锚点

前置背景

平行视角

未来推演

延伸追问