小红花·文摘

本研究开发了ChemAgent，探讨其在化学问题解决中的作用。结果表明，尽管工具能提升特定任务的表现，但在一般化问题中，化学知识的推理能力更为重要，工具的增强效果并不总是有效。

工具还是不工具？工具对化学问题解决的语言代理的影响

BriefGPT - AI 论文速递 ·

分子100%有效，从头设计配体，湖南大学提出基于片段的分子表征框架

机器之心 ·

本文介绍了新的基准数据集JEEBench，用于评估大型语言模型（LLMs）在数学、物理和化学问题解决能力上的表现。研究发现，尽管采用多种提示策略，GPT-4的表现仍不足40%。此外，SciBench数据集的引入旨在系统检验复杂科学问题的推理能力，结果显示当前LLMs的综合得分仅为35.80%。研究希望推动LLMs的推理能力发展，以促进科学研究。

PECC：问题提取与编码挑战

BriefGPT - AI 论文速递 ·