机器之心 ·

中国科大、科大讯飞团队开发ChemEval：化学大模型多层次多维度能力评估的新基准

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

中国科学技术大学陈恩红团队与科大讯飞研究院发布了ChemEval框架，用于评估大语言模型在化学领域的能力。研究显示，化学领域模型在深层知识任务上优于通用模型，但在文献理解上稍逊。ChemEval为模型优化提供了指导。

🎯

🏷️

大模型推理资源需求计算及使用场景示例
博客自2016年成立以来，逐步接入CDN并添加功能，如音乐墙、动态和时光，至2021年更新了站点地图。
《战地6》团队遭遇裁员，尽管称为系列最大发布
《战地6》去年十月发布，初期销量达到700万，但未能满足预期。尽管EA称其为系列最大发布，游戏仍面临激烈竞争和挑战，另一个EA工作室也遭遇裁员。
组织高效的平台团队
平台工程不仅涉及技术，还涉及组织管理。平台团队需在复杂的组织中简化流程，成为“复杂性汇聚点”。根据Conway定律，系统结构反映组织沟通，团队应优化沟通而...
打败GPT-5.2，嵌入真实工业生产，这个大模型什么来头？
思谋科技的IndustryGPT在工业场景中表现优异，超越了GPT-5.2等通用大模型。通过三场考试，IndustryGPT展示了其在工业知识、工程决策能...
AReaL x 昇腾，加速大模型全异步RL训练创新
AReaL框架通过全异步强化学习训练，简化大模型开发，提升训练效率和系统可靠性。其核心优势在于解耦式Agentic RL和Single Controlle...
提高人工智能模型解释其预测能力
麻省理工学院研究人员开发了一种新方法，利用深度学习模型提取概念，以提高计算机视觉模型的准确性和可解释性。该方法通过限制使用的概念数量，确保选择最相关的概念...