5.5
深览指数
产品36 氪·时氪分享··AI 生成

斩获PH全球榜首|Clipto.AI:端侧多模态架构,补齐AI核心记忆层

这是一篇对AI创业公司Clipto.AI的详细介绍与案例报道。文章核心论点是:Clipto通过构建端侧多模态处理能力和本地AI记忆层,解决了个人设备上海量非结构化数据(视频、录音、文档)难以被AI理解与检索的痛点,并已在产品上验证(获Product Hunt日榜第一、ARR超1500万美元)。文章详细介绍了其技术路线(自研端侧多模态模型、芯片级优化)、商业化进展及创始人背景。适合对AI落地、端侧智能、个人知识管理产品感兴趣的读者,需注意本文带有明显的商业宣传色彩,非独立第三方分析。

核心观点
  • Clipto定位为连接个人本地数据与上层AI智能体的“记忆层”,解决个人设备上海量多模态数据(视频、音频、文档)无法被AI持续理解和调用的核心痛点,而不仅仅是搜索问题。
  1. 01Clipto在Product Hunt发布Mac端产品,获当日全球第一名(Product of the Day),社区150多条高赞评论集中于“本地记忆系统”和“端侧多模态处理”两点。
  2. 02Clipto自建端侧技术栈,整合超过10个自研端侧模型(涵盖大语言、语音、视觉、多模态嵌入),针对Apple M系列和NVIDIA RTX架构完成数百项优化,实现模型压缩与协同加速。
  3. 03在一台MacBook Pro M5上,Clipto可在24小时内处理2TB视频素材,本地模型输出近亿Token,按主流云端模型定价估值近400美元,突显成本优势。
  4. 04Clipto全系列产品已进入全球150多个国家和地区,注册用户超千万,ARR突破1500万美元并实现盈利。2025年连续完成三轮Pre-A轮融资,投后估值超2.5亿美元。
  5. 05创始人兼CEO康洪文(Henry Kang)毕业于卡内基梅隆大学机器人研究所,研究方向为机器记忆系统。2017年创办智影(文字生成视频平台),2020年出售给腾讯后曾担任腾讯AIGC负责人。
  6. 06投资方包括红杉中国、高瓴创投、EnvisionX Capital、Palm Drive Capital等知名机构。
反方 / 局限
  • 文章本身是公司宣传稿(源自36氪,但更像是企业PR稿的转载或改写),缺乏独立、批判性的第三方视角。例如,未讨论其端侧模型与主流云端模型(如GPT-4、Claude)在复杂任务理解上的性能对比;也未说明“记忆层”的核心算法(如知识图谱构建、向量化索引)是否有技术壁垒,还是通用方案的工程化封装。
  • 用户端的实际价值是否真正适用“TB级数据”的高频场景存疑。对于绝大多数用户,在本地设备上有高达TB级且需要被“记忆”且频繁检索的多模态数据并非普遍需求。其核心价值可能仅限于特定专业群体(影视创作者、律师、科研人员),而非文中所称的“数十亿知识工作者”。
Clipto.AIProduct Hunt康洪文(Henry Kang)AI记忆层端侧多模态智影红杉中国高瓴创投Apple M5 MaxNVIDIA RTX Spark
7 分钟 · 5 卡片 · 12 资料
读原文 →

前置背景

论证骨架

平行视角

未来推演

延伸追问