5.7
深览指数
科技微博·极客公园··AI 生成
当所有 AI 都在理解世界,这家公司在理解你
本文专访了 AI 创业公司 Clipto 的创始人康洪文。核心论点在于,当前 AI 基础设施缺失了一层关键的「记忆层」(Memory Layer),导致 AI 能理解世界却无法理解具体用户。Clipto 推出的端侧产品试图通过本地多模态大模型,将用户的个人数据(视频、音频、文档等)转化为结构化的个人记忆系统。文章追溯了康洪文从微软亚研、卡内基梅隆大学到创办智影(后被腾讯收购)的二十年技术轨迹,认为 AI 的下一个竞争方向将从生成能力转向记忆与组织能力。适合关注 AI 基础设施、端侧智能、个人数据生态的读者,能提供一种与主流“云端大模型”叙事不同的视角。原文 ↗
核心观点
- ▍当前 AI 基础设施缺失了关键的「记忆层」(Memory Layer),导致 AI 能理解世界(拥有世界模型)却无法理解具体用户(缺少用户模型);未来 Agent 的成熟必须依赖一个统一的、运行在本地的个人记忆系统。
- ▍AI 的下一个重要竞争方向将从生成能力转向记忆与组织能力,形成云端的 Intelligence Layer 与端侧的 Memory Layer 两层基础设施并存的架构。
- 01Clipto 推出的端侧产品登上 Product Hunt 全球榜首,其核心是运行在本地的多模态记忆构建逻辑,能将用户设备内的视频、音频、文档等数据转化为带认知图谱的个人记忆系统。
- 02创始人康洪文背景:曾就读于卡内基梅隆大学,师从计算机视觉学者 Takeo Kanade,后创办 AI 视频生成公司智影,并被腾讯收购。他的技术关注点从视频理解、视频生成演变到今天的组织内容。
- 03作者判断:随着 Agent 普及,未来数百万个 Agent 需要共享同一套用户上下文,独立构建不现实,因此需要一个独立的底层记忆系统,类似互联网时代的操作系统。
- 04技术案例:用户可通过自然语言在数 TB 的本地视频、音频中搜索特定人物或事件,且所有处理均在本地完成,解决了数据隐私和高 Token 成本问题。
反方 / 局限
- — 文章对「记忆层」的商业模式(如何变现)、技术壁垒(大公司如 Apple/Google 做类似方向的竞争优势)、以及本地算力瓶颈(TB级数据的处理效率)等潜在问题缺乏深入讨论。
- — 全文本质上是一篇创业公司创始人访谈,带有较强的价值主张和产品推广色彩,缺乏独立的第三方评价或与主流观点的辩论。
9 分钟 · 4 卡片 · 10 资料
读原文 →