大语言模型在科研领域应用普及,但缺乏对其在实际科学任务中性能的评估。FutureHouse Inc.推出语言Agent生物学基准数据集,用于评估AI系统在生物学研究中的表现。研究人员发现不同模型在不同任务中表现差异大,尤其在信息检索任务中存在问题。模型在处理DNA和蛋白质序列的任务上表现不佳,人类表现优于模型。
人工智能在科研领域具有巨大潜力与争议,可以提高研究效率、减少误差、挖掘更深层次的知识。近百篇前沿论文已被HyperAI超神经解读,提供数据集资源和机器学习教程。「AI技术在化学与材料科学科研中应用研讨会」聚焦AI技术在化学与材料科学中的应用,包括工具软件、应用实例和成果。会议分为专家报告、青年科学家报告和AI专场研修班三个部分。
完成下面两步后,将自动完成登录并继续当前操作。