科技腾讯新闻··AI 生成
马斯克预判被打脸:国外机构评测网页设计智谱GLM5.2已反超Fable5
本文基于公开的Design Arena评测数据,论证智谱GLM-5.2在特定网页设计任务中已超越Claude Fable 5。智谱创始人唐杰与马斯克就能力对比产生分歧,文章通过技术拆解支撑"反超"结论:GLM-5.2凭借优质基础模板、规避高频错误、生成高复杂度内容三大特征获胜,但在游戏开发、3D设计等领域仍处弱势。文章数据详实,但分析框架来自单一外部测评机构,缺乏对Fable 5优势维度的对称分析。适合关注大模型落地能力、开源模型与闭源模型对比的高技术水位读者。原文 ↗原文 ↗
核心观点
- ▍智谱GLM-5.2在Design Arena网页设计单项评测中已超越Claude Fable 5,成为该领域首个开源榜首模型。
- ▍GLM-5.2的胜利路径是通过优质模板化输出、规避常见编码错误、以及生成更高复杂度与细节度的内容实现的,而非全面能力碾压。
- 01GLM-5.2在Design Arena单轮HTML网页设计测评总榜登顶,得分1360,击败了Claude Fable 5、Opus 4.6与Opus 4.7。
- 02GLM-5.2采用MIT开源协议,拥有7440亿参数,而与其差距最小的竞品参数量推测最高为其6.7倍。
- 03在成本方面,GLM-5.2每百万代币定价为1.40美元/4.40美元,而Claude Fable 5为10美元/50美元。
- 04GLM-5.2在91%的测试样本中使用TailwindCSS,51%调用font-awesome,提升了页面精细度与用户偏好度。
- 05GLM-5.2生成网页的平均时长为304.7秒,是Claude Fable 5的两倍,字符与代码行数多出25%。
- 06GLM-5.2对chart.js、three.js等依赖库的调用可靠性高,使其在数据面板、3D设计类目表现突出。
反方 / 局限
- — GLM-5.2并非全品类任务领先:在游戏开发、数据可视化、3D设计榜单位列第二,UI组件榜单排名第四。
- — GLM-5.2生成内容存在较强的模板化倾向,而Fable 5风格跨度更大,通用性更强,可产出更多元的内容。
- — GLM-5.2的胜利是以牺牲生成速度为代价的,其速度远慢于Fable 5,且输出长度存在边际递减效应。
智谱GLM-5.2Claude Fable 5Design Arena马斯克唐杰智谱AI (Z.ai)AnthropicOpus 4.6TailwindCSSBridgebench BS
概念锚点
前置背景
平行视角
未来推演
延伸追问