抱抱脸模型TOP榜，我现在只服yuxinlu1

7.8

深览指数

科技量子位·11小时前·AI 生成

抱抱脸模型TOP榜，我现在只服yuxinlu1

个人开发者逯雨鑫（yuxinlu1）发布的Gemma4-12B蒸馏模型，在Hugging Face Trending榜上力压智谱GLM-5.2、百度无限OCR等大厂模型，累计下载超70万。文章详细介绍了其模型技术路径（蒸馏Fable 5的代码推理能力、agentic微调）、个人开发故事（自费、全栈自学背景、ADHD特质），并探讨了个人开发者在大厂夹缝中突围的根本原因：无品牌包袱、专注具体痛点、真诚与坚持。适合关注开源模型生态、AI个人开发者、模型蒸馏技术的读者。原文 ↗原文 ↗

核心观点

▍个人开发者逯雨鑫（yuxinlu1）凭借蒸馏自Fable 5的Gemma4-12B GGUF模型，在Hugging Face Trending榜上超过大厂明星模型，核心原因是：个人开发者无品牌包袱，可以更专注地解决‘本地离线、隐私免费、消费级显卡可运行’这一具体痛点。
▍真正关键的不是数据量，而是数据质量、筛选和验证——整个微调数据集仅约1万条examples。

01截至报道，作者的V1模型下载量20.7万，V2模型53.6万，总和超70万，一度霸榜Hugging Face Trending榜榜首。
02V1模型（编程推理版）通过蒸馏Cursor Composer 2.5和Fable 5的代码推理链构建可验证数据，每条思维链对应的代码必须通过实际测试才被保留；Fable 5下线后，作者改用Claude Opus 4.8重新生成并逐条修复缺失的推理链。
03V2模型（agentic版）在tau2-bench telecom子集上得分55%，而基座Gemma-4-12B仅15%，性能提升约3.5倍，但作者承认这是20个任务的本地自测相对值。
04模型采用GGUF量化格式，最小Q2_K版本仅4.5GB，8GB统一内存的Mac用户即可本地运行，推荐甜点位Q4_K_M约6.87GB。
05逯雨鑫为美国在读AI方向研究生，本科数据与商业分析，中途补过全栈开发；所有项目为自费，V2耗时40多小时，烧掉一个Claude Max套餐，使用RTX 5090（32GB VRAM）+约96GB本地SSD，可调动资源约128GB。
06作者患有ADHD，认为AI时代快速切换兴趣的hyperfocus能力反而成为优势。

反方 / 局限

— 作者承认模型与frontier大模型仍有不小差距，benchmark结果为单一领域、20个任务的本地自测相对值，不可与官方榜单直接比较。
— V2模型在tau2-bench telecom上存在‘过度尝试、反复retry’的问题，V3将在更多训练中改进；V2的最小可靠版本从Q3_K_M开始，未发布Q2_K版本。
— 作者坦承重建的Fable 5推理链‘可能和原版有出入’，并指出中文网文LoRA方向并不热门，用户关注度远低于coding和agentic模型。
— 大厂为何不做同类产品：大厂发布开源小模型通常承担品牌宣传和API引流目标，而个人开发者没有这些包袱，可以更专注地解决单一痛点。

yuxinlu1 (逯雨鑫)Hugging Face Models Trending榜 Gemma4-12B GGUF Fable 5 Cursor Composer 2.5 Claude Opus 4.8 GLM-5.2 百度无限OCR Qwen3.6-27B RTX 5090 tau2-bench ADHD 智谱 (Zhipu AI)百度 (Baidu)NVIDIA

14 分钟 · 3 卡片 · 7 资料

读原文 →

抱抱脸模型TOP榜，我现在只服yuxinlu1

前置背景

平行视角

延伸追问