7.8
深览指数
科技量子位··AI 生成

抱抱脸模型TOP榜,我现在只服yuxinlu1

个人开发者逯雨鑫(yuxinlu1)发布的Gemma4-12B蒸馏模型,在Hugging Face Trending榜上力压智谱GLM-5.2、百度无限OCR等大厂模型,累计下载超70万。文章详细介绍了其模型技术路径(蒸馏Fable 5的代码推理能力、agentic微调)、个人开发故事(自费、全栈自学背景、ADHD特质),并探讨了个人开发者在大厂夹缝中突围的根本原因:无品牌包袱、专注具体痛点、真诚与坚持。适合关注开源模型生态、AI个人开发者、模型蒸馏技术的读者。原文 ↗

核心观点
  • 个人开发者逯雨鑫(yuxinlu1)凭借蒸馏自Fable 5的Gemma4-12B GGUF模型,在Hugging Face Trending榜上超过大厂明星模型,核心原因是:个人开发者无品牌包袱,可以更专注地解决‘本地离线、隐私免费、消费级显卡可运行’这一具体痛点。
  • 真正关键的不是数据量,而是数据质量、筛选和验证——整个微调数据集仅约1万条examples。
  1. 01截至报道,作者的V1模型下载量20.7万,V2模型53.6万,总和超70万,一度霸榜Hugging Face Trending榜榜首。
  2. 02V1模型(编程推理版)通过蒸馏Cursor Composer 2.5和Fable 5的代码推理链构建可验证数据,每条思维链对应的代码必须通过实际测试才被保留;Fable 5下线后,作者改用Claude Opus 4.8重新生成并逐条修复缺失的推理链。
  3. 03V2模型(agentic版)在tau2-bench telecom子集上得分55%,而基座Gemma-4-12B仅15%,性能提升约3.5倍,但作者承认这是20个任务的本地自测相对值。
  4. 04模型采用GGUF量化格式,最小Q2_K版本仅4.5GB,8GB统一内存的Mac用户即可本地运行,推荐甜点位Q4_K_M约6.87GB。
  5. 05逯雨鑫为美国在读AI方向研究生,本科数据与商业分析,中途补过全栈开发;所有项目为自费,V2耗时40多小时,烧掉一个Claude Max套餐,使用RTX 5090(32GB VRAM)+约96GB本地SSD,可调动资源约128GB。
  6. 06作者患有ADHD,认为AI时代快速切换兴趣的hyperfocus能力反而成为优势。
反方 / 局限
  • 作者承认模型与frontier大模型仍有不小差距,benchmark结果为单一领域、20个任务的本地自测相对值,不可与官方榜单直接比较。
  • V2模型在tau2-bench telecom上存在‘过度尝试、反复retry’的问题,V3将在更多训练中改进;V2的最小可靠版本从Q3_K_M开始,未发布Q2_K版本。
  • 作者坦承重建的Fable 5推理链‘可能和原版有出入’,并指出中文网文LoRA方向并不热门,用户关注度远低于coding和agentic模型。
  • 大厂为何不做同类产品:大厂发布开源小模型通常承担品牌宣传和API引流目标,而个人开发者没有这些包袱,可以更专注地解决单一痛点。
14 分钟 · 3 卡片 · 7 资料
读原文 →

前置背景

平行视角

延伸追问