7.2
深览指数
产品虎嗅·AI唱反调··AI 生成

我们让AI当了一天采购员,结果差点拿着假报价去砍价

作者通过实测百度AI助手DuMate在制造业采购场景中的表现,发现其在BOM整理、数据清洗等机械性任务上效率很高(如5分钟完成人工需数小时的Excel对齐),但在关键环节暴露出致命缺陷:实时查价时,将0.92元的电容报成0.038元,库存数据严重失真。文章核心结论是AI能当优秀的“实习生助理”,但绝不能直接信任其输出的价格和决策信息。适合对AI在垂直行业落地感兴趣的读者,尤其是关注AI可靠性边界与业务风险的人。原文 ↗

核心观点
  • AI助手在数据整理等机械性任务上效率极高,但在涉及实时价格、市场行情和经验判断的关键环节,会产生严重失真的幻觉,不适合直接拍板使用。
  1. 01BOM整理任务中,DuMate 5分钟完成了Excel对齐,能识别C1(10uF/±20%/0603)和C2(10μF 20% 1605)为同一颗料,并将10KR转为10kΩ,空交期标为“待确认”。
  2. 02三源比价任务中,DuMate能从一个损坏的.xlsx文件中提取出电容报价并纳入比价表,但错误地将同一颗MCU的两种来源(U1和U2)拆分为两行展示,破坏了比价逻辑。
  3. 03认证核对任务中,DuMate发现RoHS声明只覆盖了3种封装(8.3%覆盖率),且签署栏为空白,建议“补签后归档”,展现了超越预设的细粒度洞察。
  4. 04实时查价任务中,DuMate从立创商城抓取的风华0603 10μF电容报0.038元/颗,但实际立创页面显示为0.92元/颗,价格偏差近20倍;库存数据也全部虚假。
  5. 05风险评估报告耗时22分钟,但仍出现了自行推断填充“硬件组”“采购部”等框架性内容,以及“7月3日”“6月30日”等截止日期的问题。
反方 / 局限
  • 文章未明确讨论,但隐含一个局限:测试中的README.txt提供了“汇率按1:7”“1605是陷阱”等提示,这可能高估了AI在完全无辅助真实场景下的表现。
  • 文章指出DuMate在无工作区模式下对1605封装的判断与工作区模式相反,说明同一AI在不同交互方式下结果不一致,可靠性存疑。
19 分钟 · 4 卡片 · 11 资料
读原文 →

概念锚点

前置背景

平行视角

延伸追问