TOMG-Bench:评估大语言模型在基于文本的开放分子生成中的表现

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本文提出了首个评估大语言模型在开放领域分子生成能力的基准——TOMG-Bench,涵盖分子编辑、优化和定制生成等任务,并提供自动评估系统。评测结果显示,25个模型在文本引导的分子发现方面存在局限性。

🎯

关键要点

  • 本文提出了首个用于评估大语言模型开放领域分子生成能力的基准——TOMG-Bench。
  • TOMG-Bench解决了当前缺乏有效评估工具的问题。
  • 该基准涵盖了分子编辑、分子优化和定制分子生成等三大任务及其子任务。
  • 提供了一套自动评估系统。
  • 对25个大语言模型的综合评测显示,它们在文本引导的分子发现上存在局限性。
  • 指出了改进的潜力。
➡️

继续阅读