科技人人都是产品经理·潮生··AI 生成
数据产品的 AI 实践1:在不确定中寻找确定
作者亲测AI生成SQL指标代码,发现尽管前端开发AI覆盖率达80%,但数据部门仍多手搓代码。文章分享了从准备指标字典、元数据到与Claude协作验证的完整流程,核心结论是:AI并非替代人力,而是通过倒逼数据基建规范化,实现边际成本递减。适合正在探索AI辅助数据开发的从业者参考。原文 ↗原文 ↗
核心观点
- ▍AI生成SQL指标代码的核心价值不在于替代数仓人员手搓代码,而在于倒逼企业数据基建的规范化与标准化,实现边际成本递减。
- 01作者公司前端开发AI编码覆盖率最高超过80%,但数据部门仍坚持手搓建表、开发指标。
- 02作者选择口径复杂的指标为切入点,通过对比AI生成与数仓手搓的SQL执行结果来验证准确性。
- 03首次生成时,Claude的SQL由于受元数据中'值说明'字段的干扰,额外增加了三个WHERE条件,调整提示词后修复。
- 04AI生成与手搓的SQL在计算结果上存在小数位偏差:手搓按SKU单独算天数取整,AI先汇总再统一算天数,经人工校验AI逻辑更准确。
- 05作者整理出基于大模型的SQL代码自动化生成方案,已在部门内应用,并建议将有效执行过程保存为skills或文件以备复用。
反方 / 局限
- — 作者承认,准备指标字典、元数据、表血缘等信息花费大量精力,对于数仓人员而言,与AI对话的时间可能比直接手写SQL更长,因此初期会抗拒。
AI生成SQLClaude豆包指标字典元数据数据基建
前置背景
应用场景
平行视角
延伸追问