7.7
深览指数
科技虎嗅·少数派sspai··AI 生成

为什么在AI 时代,最古老的交互形式反而卷土重来?

文章解释了在AI Agent时代,命令行界面(CLI)相对于图形界面(GUI)对AI更友好的根本原因。作者从工程逻辑出发,论证了CLI在可组合性、可预测性和可审计性上对AI Agent的巨大优势,并指出工具调用(function call)本质上就是CLI。这篇文章适合对AI Agent技术原理、人机交互历史或软件工程感兴趣的读者,能提供一个反常识但逻辑自洽的分析视角。原文 ↗

核心观点
  • AI时代,命令行界面(CLI)卷土重来的根本原因不是情怀,而是工程逻辑:CLI在设计上比GUI更适合作为AI Agent与系统交互的接口。
  1. 01GUI是为人类视觉导航设计的,其交互范式(按钮、弹窗、拖拽)建立在人类的视觉直觉上,而大语言模型的'思考'发生在语言空间,而非像素空间。
  2. 02AI操控GUI需要跨越巨大鸿沟:理解成本高(需借助计算机视觉或Accessibility Tree)、状态隐式且不可预测、操作不可组合、难以测试和验证。
  3. 03CLI的每个特性都像为AI设计:可组合性(Unix哲学,命令可管道连接)、可预测性(显式参数,心智模型可靠)、可审计性(所有操作都是可记录的文本序列)。
  4. 04Anthropic、OpenAI和Google相继发布了Claude Code、Codex CLI和Gemini CLI等CLI形态的AI Agent工具。
  5. 05Claude Code优先发布CLI形态而非IDE插件,是因为CLI工具不依赖宿主环境,可在任何终端运行,能被任何Agent调用。
  6. 06AI Agent调用工具的机制(function call/tool use)从语义上就是CLI:给定名称和参数,返回结果。
反方 / 局限
  • GUI的地位不会受到太大影响,它仍是人类直接操作计算机的最佳界面。
大语言模型命令行界面图形用户界面Agent工具AnthropicOpenAIGoogleClaude CodeCodex CLIGemini CLIUnix哲学工具调用
5 分钟 · 4 卡片 · 12 资料
读原文 →

概念锚点

前置背景

平行视角

延伸追问