
-
生物通官微
陪你抓住生命科技
跳动的脉搏
生成式神经网络赋能古代文本语境重构:Aeneas模型在拉丁铭文修复与历史溯源中的突破
【字体: 大 中 小 】 时间:2025年07月25日 来源:Nature 50
编辑推荐:
研究人员针对古代铭文研究中文本修复、地理溯源和年代判定三大难题,开发了多模态生成神经网络Aeneas。该模型整合视觉与文本特征,首创任意长度缺失文本修复技术,在176,861份拉丁铭文数据集上实现13年误差的精确断代,地理溯源准确率达72.3%。与历史学家协作评估显示,90%案例中模型检索的平行文本能有效支撑研究,人机协同任务表现超越单独作业44%。
在探索古罗马文明的过程中,铭文作为最原始的书写载体,承载着跨越两千年的历史记忆。然而岁月侵蚀使得大量铭文出现残缺,传统修复方法依赖专家人工比对,效率低下且受限于个人知识储备。更棘手的是,铭文中广泛使用的缩写符号、跨区域流动的书写习惯,以及缺乏明确纪年的特点,使得文本修复、地理溯源和年代判定成为困扰学界的三大难题。
Google DeepMind与牛津大学等机构的研究团队在《Nature》发表突破性成果,开发出名为Aeneas的多模态生成神经网络。该模型通过整合视觉特征与文本语义,不仅能自动修复未知长度的缺失文本,还能精准追溯铭文的时空起源。研究人员构建了包含176,861份拉丁铭文的LED数据集(Latin Epigraphic Dataset),涵盖从公元前7世纪到公元8世纪的跨地域文本。模型采用改进的T5 transformer架构,创新性地引入旋转位置嵌入和任务特异性头部设计,在修复任务中字符错误率较前代模型降低15%,地理溯源top-1准确率达72.3%,年代判定平均误差仅13年。
关键技术包括:1)构建跨数据库标准化的LED数据集,包含16M字符和8,112张铭文图像;2)设计支持任意长度修复的双符号标记系统("-"表确定长度,"#"表不确定长度);3)开发历史语境嵌入算法,通过余弦相似度检索相关平行文本;4)采用多任务联合训练策略,平衡修复、断代和地理溯源损失函数。
模型架构与性能
Aeneas采用视觉-文本双通道输入,文本处理使用16层T5解码器(嵌入维度384),图像处理采用ResNet-8。在修复任务中,模型对已知缺失长度的10字符段落CER(字符错误率)为40.5%,对未知长度段落CER增加15个百分点。地理溯源任务中,整合视觉特征使top-3准确率提升至83.9%,显著高于纯文本模态(75.3%)。
历史学家-AI协同评估
23位铭文学家参与的盲测显示:当提供Aeneas检索的平行文本时,研究者新增1.5条有效参考(中位数),修复准确率提升23%;结合模型预测后,地理溯源top-1准确率跃升至68.3%(单独作业仅27%)。90%的专家认为模型输出可作为研究起点,典型评价称:"Aeneas发现的平行文本完全改变了我的历史聚焦点,传统方法需数日的工作现可在15分钟内完成"。
典型案例分析
1)《神圣奥古斯都功业录》(RGDA)研究中,模型通过识别古体拼写(如aheneis→aeneis)和特定历史事件(如元老院授予"青年领袖"头衔的公元前5年纪年),准确捕捉文本的历时性特征;
2)对美因茨还愿祭坛(CIL XIII,6665)的分析中,模型不仅正确判定其属于上日耳曼行省(211CE),还发现了112年前的同地点祭坛(EDCS-71100087)作为关键平行文本,揭示了军事祭祀传统的延续性。
这项研究标志着人工智能与古代史学研究的深度融合。Aeneas模型突破传统文本匹配的局限,通过语境化机制揭示跨时空的铭文关联,为重建古代社会网络提供量化工具。尤其值得注意的是,模型对边缘群体(如奴隶、退伍军人)铭文的解析能力,为"自下而上"的历史研究开辟新径。该成果已转化为高中课程模块,通过"预测过去"教育平台(predictingthepast.com)推动数字人文的普及应用。未来发展方向包括整合对话式交互界面、优化宽泛年代范围的概率表示,以及扩展至纸草文书等其他古代载体。
生物通微信公众号
知名企业招聘