百度把 DeepSeek 的人挖过来了？

7.0

深览指数

科技腾讯新闻·一只小茄墩·昨天 17:31·AI 生成

百度把 DeepSeek 的人挖过来了？

文章基于百度新开源的 Unlimited OCR 模型的技术细节和作者名单，推测百度可能挖角了 DeepSeek 的 OCR 核心研发人员。核心证据是技术路线高度相似 DeepSeek OCR，且论文作者中仅技术总监以缩写「YY」署名，疑似 DeepSeek V4 技术报告中标注已离职的成员。文章技术分析部分扎实，但人事猜测部分缺乏直接证实。适合对 AI 模型技术演进及行业人才流动感兴趣的读者。原文 ↗原文 ↗

核心观点

▍百度新开源的 Unlimited OCR 模型，其技术路线和团队背景强烈暗示挖角了 DeepSeek 的 OCR 核心研发人员。

01Unlimited OCR 在 DeepSeek OCR 基础上改进，主要解决长文档解析中 KV 缓存膨胀问题。
02Unlimited OCR 提出的方案是 R-SWA（参考滑动窗口注意力），让每个 token 能看完整图像，但只回看最近的 128 个输出 token，确保 KV 缓存大小恒定。
03该模型在 OmniDocBench v1.5 上总分 93.23%，比 DeepSeek OCR 高 6 个多点；40+ 页长文档可一次推理完成，编辑距离仅 0.107。
04模型参数仅 3B（MoE 架构，激活量 500M），在输出 6000 token 时推理速度比 DeepSeek OCR 快 35%，且差距会随输出长度扩大。
05论文作者名单中，核心贡献者三人：Youyang Yin、Huanhuan Liu（项目负责人）、YY（技术总监）。两人用全名，技术总监仅用缩写「YY」。
06DeepSeek V4 技术报告中有 10 个名字标注已离职，目前已知郭达雅、罗福莉等已有去向。
07Unlimited OCR 的 GitHub 致谢栏优先感谢了 DeepSeek-OCR 和 DeepSeek-OCR-2。

反方 / 局限

— 作者对「YY 是否是 DeepSeek 某位被挖员工」的结论并非直接证实，而是基于缩写的猜测和线索关联（GitHub 致谢、人才流动背景）。

百度 DeepSeek Unlimited OCR R-SWA KV 缓存滑动窗口注意力 OmniDocBench Youyang Yin YY (技术总监)Huanhuan Liu DeepSeek V4 郭达雅罗福莉

4 分钟 · 5 卡片 · 9 资料

读原文 →

百度把 DeepSeek 的人挖过来了？

概念锚点

前置背景

平行视角

未来推演

延伸追问