TOMG-Bench:评估大语言模型在基于文本的开放分子生成中的表现
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文提出了首个评估大语言模型在开放领域分子生成能力的基准——TOMG-Bench,涵盖分子编辑、优化和定制生成等任务,并提供自动评估系统。评测结果显示,25个模型在文本引导的分子发现方面存在局限性。
🎯
关键要点
- 本文提出了首个用于评估大语言模型开放领域分子生成能力的基准——TOMG-Bench。
- TOMG-Bench解决了当前缺乏有效评估工具的问题。
- 该基准涵盖了分子编辑、分子优化和定制分子生成等三大任务及其子任务。
- 提供了一套自动评估系统。
- 对25个大语言模型的综合评测显示,它们在文本引导的分子发现上存在局限性。
- 指出了改进的潜力。
🏷️
标签
➡️