覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4

💡 原文中文,约4700字,阅读约需11分钟。
📝

内容提要

上海人工智能实验室发布了化学大语言模型ChemLLM,能够通过对话交互执行化学学科任务,性能与GPT-4相当。ChemLLM为化学研究开辟新道路,融入结构化化学知识,树立了新的大语言模型标准。

🎯

关键要点

  • 上海人工智能实验室发布了化学大语言模型ChemLLM,性能与GPT-4相当。
  • ChemLLM能够通过对话交互执行化学学科任务,为化学研究开辟新道路。
  • ChemLLM面临三大挑战:化学知识的结构化存储、特殊符号表示的理解、任务种类繁多的训练流程设计。
  • ChemLLM的研究成果已开源,并提供免费商用。
  • 创建并开源大规模化学数据集ChemData,涵盖700万条问答数据。
  • ChemLLM模型架构基于InternLM2-Base-7B,通过两个阶段的指令微调训练得到。
  • ChemBench基准测试构建了9项化学任务,减少语言模型输出风格对评估结果的影响。
  • ChemLLM在化学能力评估中明显优于类似规模的一般LLMs,并在通用能力评估中表现出色。
  • ChemLLM已完成升级,接入RAG功能,支持深度挖掘化学文献和联网搜索。
  • HyperAI超神经官网上线了一键部署ChemLLM-7B-chat的教程。
➡️

继续阅读