机器之心 ·

TOMG-Bench：大语言模型开放域分子生成新基准

💡 原文中文，约6100字，阅读约需15分钟。

📝

内容提要

科学家提出了新的基准测试TOMG-Bench，用于评估大型语言模型（LLM）在分子领域的生成能力。该基准涵盖分子编辑、优化和定制生成三个主要任务，旨在克服传统分子发现方法的局限性，推动LLM在该领域的应用。实验结果表明，开源模型在分子生成任务中表现优异，TOMG-Bench为评估LLM提供了新的视角。

🎯

关键要点

科学家提出了新的基准测试TOMG-Bench，用于评估大型语言模型（LLM）在分子领域的生成能力。
TOMG-Bench涵盖分子编辑、优化和定制生成三个主要任务，旨在克服传统分子发现方法的局限性。
现有的分子-文本对齐面临数据集不足、翻译任务局限性和无法生成新分子结构等挑战。
TOMG-Bench的任务是开放域的，允许LLM生成满足特定要求的分子结构，体现其泛化能力和创造力。
每个主要任务下有三个子任务，涵盖分子发现的多个关键环节，每个子任务包含5000个测试样本。
OpenMolIns是为TOMG-Bench开发的指令微调数据集，帮助LLM更好地理解和执行开放域分子生成任务。
实验结果显示，开放域分子生成任务具有挑战性，开源模型在分子生成任务中表现优异。
数据规模对LLM在TOMG-Bench上的性能有显著影响，较大的数据集可以提升模型性能。
TOMG-Bench可以反映LLM的领域泛化能力，帮助发现现有模型的不足之处。
TOMG-Bench是第一个用于评估LLM开放域分子生成能力的基准，提供了改进的思路和方向。

🏷️

继续阅读

上下文衰退如何影响企业AI和大型语言模型（LLM）的结果，以及如何解决这一问题
上下文衰退影响企业AI和大型语言模型（LLM）的表现。旧数据未被清除，导致信息混乱和推理能力下降。企业需监控关键数据指标，清除过时数据，以提升AI的准确性和效率。
Intention Is All You Need
文章《AI 是一种编程框架》强调了意图在软件开发中的重要性。随着大型语言模型（LLM）的出现，开发者可以直接将意图转化为软件，简化了开发流程，程序员只需表...
Windows 11日历集成还未推出微软称需要继续优化体验(可能放弃WebView?)
#系统资讯 Windows 11 通知中心的日历集成还未推出，微软称需要继续优化体验，确保提供可靠和高质量的功能。在去年 12 月微软在 Windows ...
华为发布五大创新解决方案，推动交通运输行业智能化转型
（全球TMT2026年3月10日讯）在MWC 2026巴塞罗那期间的主题论坛上，华为与客户和伙伴共同探讨交通运 […]
TDK在印度设立亚太区域总部，启用双城行政管理架构
（全球TMT2026年3月10日讯）TDK Corporation宣布在印度班加罗尔设立亚太区域总部（APAC […]
Qt Group与高通合作，简化工业AI设备开发流程
Qt Group与高通合作，优化Qt框架以支持高通物联网处理器，简化边缘AI设备的开发。开发者可通过Qt Edge AI API轻松实现复杂应用，无需深入...

TOMG-Bench：大语言模型开放域分子生成新基准

内容提要

关键要点

标签

继续阅读