产品腾讯新闻·AI寒武纪··AI 生成
千问成了我的新嘴替,一场只用语音完成的线上发布会
作者设计了一场极端实验:全程不使用键盘鼠标,仅通过阿里千问电脑端的语音输入和语音指令功能,完成从策划方案、演讲稿、PPT到海报文案的全流程工作。实验量化结果显示,四项目标平均耗时仅36分钟,而传统方式预估需300分钟,效率提升显著。文章复盘了语音转写自动去口水词、中英混合识别、结构化排版等核心体验,同时坦诚指出了PPT页数不足、长时间使用偶发等待、文档内容丢失等实际翻车点。核心结论并非“语音比打字快”,而是“说话降低了prompt的措辞过滤成本,让AI输出更接近真实意图”。适合关注AI生产力工具实际落地效果、语音交互产品体验的报告阅读者。原文 ↗原文 ↗
核心观点
- ▍语音交互的核心优势不是比打字快,而是降低了人与AI之间的'措辞过滤'成本——说话时的prompt更长、更具体、更接近真实意图,AI的输出质量反而更好。
- 01实验四个任务总耗时36分钟,传统方式预估300分钟,效率提升约8倍;其中PPT生成环节从2小时降至几十秒,提升最显著。
- 02语音转写自动过滤了'呃''那个''就是'等口水词,并正确识别了'QA''AI工具'等中英混合专业词汇。
- 03在口述策划方案时,千问自动将'首先/其次/然后/最后'转为一级编号,将'第一部分/第二部分'转为大标题,并自动检验了各环节时间之和是否等于总时长。
- 04第二轮补充嘉宾分工时,三人的条目被自动拆分为独立子条目,'第一阶段/第二阶段'被正确识别为嵌套二级编号。
- 05语音指令生成开场演讲稿后,作者认为其语言节奏比自己打字生成的更自然、更有起伏。
- 06海报文案生成一次完成,作者评价95%可用,但指出高创意型文案仍需人工判断。
反方 / 局限
- — 翻车记录:PPT第一版不足10页,需补充指令才能完整生成;长时间连续使用后偶有处理等待;测试中遇到过一次文档生成内容被删除的bug。
- — 作者承认,在安静的开放办公室对着电脑说话存在社交尴尬,这是语音输入本身的物理限制,与工具无关。
- — 作者明确表示不会完全放弃键盘:精确调整格式、核实数据、处理敏感信息时打字仍是更优选择。
千问阿里云计算有限公司YAR师AI工具 2026年中盘点语音输入法PPT
13 分钟 · 5 卡片 · 13 资料
读原文 →概念锚点
前置背景
平行视角
未来推演
延伸追问