科技腾讯新闻·DeepTech深科技··AI 生成
AI破解2000年前庞贝古卷!烧成灰烬的草纸内容,首次被机器学习完整破译
研究人员借助机器学习与高分辨率微型CT扫描,首次以非侵入方式完整虚拟展开并阅读了一卷近2000年前、在维苏威火山爆发中碳化的赫库兰尼姆古卷。他们识别出约20列文字,总长约1.5米,内容涉及伦理、艺术和人类行为,并补充了哲学家Philodemus《论神》的新章节。这项突破源于“维苏威挑战赛”,但当前扫描成本高昂(一周机时25万美元),仅完成了约10%的卷轴扫描。适合对考古、古典学、计算机视觉交叉领域感兴趣的深度读者阅读。原文 ↗原文 ↗
核心观点
- ▍机器学习与高分辨率CT扫描的结合,首次实现了对碳化古卷的完整虚拟展开与文本读取,标志着此类研究从技术验证进入了实质性的文本分析阶段。
- 01研究人员使用钻石光源和欧洲同步辐射装置(ESRF)产生的高分辨率X射线进行成像,单个像素约为2微米,成功重建了卷轴的三维数字模型。
- 02被选中的赫库兰尼姆卷轴1,667号(PHerc.1,667)因结构相对规整(圆柱形且未被过度压缩)而优先处理,其宽约2厘米,高约8厘米。
- 03团队共识别出约20列文字,虚拟展开后总长约1.5米,内容包括探讨伦理、艺术和人类行为,以及哲学家Philodemus《论神》的多个新章节。
- 04“维苏威挑战赛”于2023年启动,累计颁发180万美元奖金,将学术难题转化为全球竞赛。
- 05扫描一个卷轴需要约20到24小时,同步辐射装置一周的机时成本高达25万美元,目前仅完成约10%的卷轴扫描。
反方 / 局限
- — 技术成本极高,现阶段难以大规模应用,且仅约10%的卷轴被扫描,剩余600多卷尚未阅读。
- — 纸莎草纸内容存在“残缺不全”、“单词之间无空格”、“标点符号有限”等难题,文本解读依赖于专家的语言学和哲学知识。
概念锚点
前置背景
技术原理
平行视角
未来推演