InfoQ ·

谷歌DeepMind开源Aeneas，一个用于分析古代文本的AI模型

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

谷歌DeepMind开源了Aeneas，一个用于理解古代铭文的生成AI模型。Aeneas能够处理文本和图像输入，优于其他模型，能恢复损坏铭文中的缺失字符，帮助历史学家自动化铭文研究的关键任务，如年代和来源地区识别及部分铭文重建。该模型基于多模态变换器架构，在多个铭文任务中表现优异，DeepMind希望提供互动版本供研究者和学生使用。

🎯

关键要点

谷歌DeepMind开源了Aeneas，一个用于理解古代铭文的生成AI模型。
Aeneas能够处理文本和图像输入，优于其他模型，能恢复损坏铭文中的缺失字符。
该模型帮助历史学家自动化铭文研究的关键任务，如年代和来源地区识别及部分铭文重建。
Aeneas基于多模态变换器架构，在多个铭文任务中表现优异。
DeepMind希望提供互动版本供研究者和学生使用。
Aeneas在DeepMind的Ithaca项目基础上开发，增加了对图像输入的支持。
DeepMind组建了拉丁铭文数据集（LED），包含176,861个铭文。
Aeneas在研究工具的有效性评估中表现出色，专家们在时间限制下使用该工具。
Aeneas帮助历史学家更快找到铭文的相似之处，节省了研究时间。
Aeneas的代码可在GitHub上获取，还有互动演示网站。

🔎

延伸解读

Aeneas的多模态能力

Aeneas模型的多模态能力使其能够同时处理文本和图像输入，这在古代铭文研究中尤为重要。通过结合不同类型的数据，Aeneas能够更全面地恢复损坏铭文中的缺失字符，提升了研究的准确性和效率。

对历史研究的影响

Aeneas的开源为历史学家提供了一个强大的工具，能够自动化关键任务，如铭文的年代识别和部分重建。这不仅节省了研究时间，还可能改变研究者的历史视角，促使他们发现新的关联和解读。

数据集的构建与挑战

DeepMind构建的拉丁铭文数据集（LED）包含大量铭文，涵盖了从公元前7世纪到公元8世纪的广泛历史。然而，数据的质量和完整性仍然是一个挑战，研究者在使用Aeneas时需注意这些潜在的局限性。

❓

延伸问答

Aeneas模型的主要功能是什么？

Aeneas模型主要用于理解古代铭文，能够处理文本和图像输入，恢复损坏铭文中的缺失字符。

DeepMind为什么开源Aeneas？

DeepMind希望通过开源Aeneas，使研究者、学生和教育工作者能够免费使用这一工具，促进古代铭文研究。

Aeneas如何帮助历史学家进行铭文研究？

Aeneas帮助历史学家自动化关键任务，如铭文的年代识别、来源地区识别和部分铭文重建。

Aeneas的训练数据集包含哪些内容？

Aeneas的训练数据集是拉丁铭文数据集（LED），包含176,861个铭文，涵盖从公元前7世纪到公元8世纪的铭文。

Aeneas与DeepMind的Ithaca项目有什么区别？

Aeneas在Ithaca项目的基础上增加了对图像输入的支持，并能恢复未知数量的缺失字符。

使用Aeneas进行铭文研究的效果如何？

使用Aeneas的历史学家在时间限制下的研究中表现出色，能够更快找到铭文的相似之处，节省了研究时间。

🏷️