小红花·文摘

大语言模型在科研领域应用普及，但缺乏对其在实际科学任务中性能的评估。FutureHouse Inc.推出语言Agent生物学基准数据集，用于评估AI系统在生物学研究中的表现。研究人员发现不同模型在不同任务中表现差异大，尤其在信息检索任务中存在问题。模型在处理DNA和蛋白质序列的任务上表现不佳，人类表现优于模型。

全新生物学基准数据集LAB-Bench震撼开源！覆盖8大任务，超2.4K选择题

HyperAI超神经 ·

人工智能在科研领域具有巨大潜力与争议，可以提高研究效率、减少误差、挖掘更深层次的知识。近百篇前沿论文已被HyperAI超神经解读，提供数据集资源和机器学习教程。「AI技术在化学与材料科学科研中应用研讨会」聚焦AI技术在化学与材料科学中的应用，包括工具软件、应用实例和成果。会议分为专家报告、青年科学家报告和AI专场研修班三个部分。

HyperAI超神经 x DT新材料丨AI技术在化学与材料科学科研中应用研讨会开启报名

HyperAI超神经 ·