谷歌DeepMind开源Aeneas,一个用于分析古代文本的AI模型

谷歌DeepMind开源Aeneas,一个用于分析古代文本的AI模型

💡 原文英文,约600词,阅读约需2分钟。
📝

内容提要

谷歌DeepMind开源了Aeneas,一个用于理解古代铭文的生成AI模型。Aeneas能够处理文本和图像输入,优于其他模型,能恢复损坏铭文中的缺失字符,帮助历史学家自动化铭文研究的关键任务,如年代和来源地区识别及部分铭文重建。该模型基于多模态变换器架构,在多个铭文任务中表现优异,DeepMind希望提供互动版本供研究者和学生使用。

🎯

关键要点

  • 谷歌DeepMind开源了Aeneas,一个用于理解古代铭文的生成AI模型。
  • Aeneas能够处理文本和图像输入,优于其他模型,能恢复损坏铭文中的缺失字符。
  • 该模型帮助历史学家自动化铭文研究的关键任务,如年代和来源地区识别及部分铭文重建。
  • Aeneas基于多模态变换器架构,在多个铭文任务中表现优异。
  • DeepMind希望提供互动版本供研究者和学生使用。
  • Aeneas在DeepMind的Ithaca项目基础上开发,增加了对图像输入的支持。
  • DeepMind组建了拉丁铭文数据集(LED),包含176,861个铭文。
  • Aeneas在研究工具的有效性评估中表现出色,专家们在时间限制下使用该工具。
  • Aeneas帮助历史学家更快找到铭文的相似之处,节省了研究时间。
  • Aeneas的代码可在GitHub上获取,还有互动演示网站。

延伸问答

Aeneas模型的主要功能是什么?

Aeneas模型主要用于理解古代铭文,能够处理文本和图像输入,恢复损坏铭文中的缺失字符。

DeepMind为什么开源Aeneas?

DeepMind希望通过开源Aeneas,使研究者、学生和教育工作者能够免费使用这一工具,促进古代铭文研究。

Aeneas如何帮助历史学家进行铭文研究?

Aeneas帮助历史学家自动化关键任务,如铭文的年代识别、来源地区识别和部分铭文重建。

Aeneas的训练数据集包含哪些内容?

Aeneas的训练数据集是拉丁铭文数据集(LED),包含176,861个铭文,涵盖从公元前7世纪到公元8世纪的铭文。

Aeneas与DeepMind的Ithaca项目有什么区别?

Aeneas在Ithaca项目的基础上增加了对图像输入的支持,并能恢复未知数量的缺失字符。

使用Aeneas进行铭文研究的效果如何?

使用Aeneas的历史学家在时间限制下的研究中表现出色,能够更快找到铭文的相似之处,节省了研究时间。

➡️

继续阅读