覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4
💡
原文中文,约4700字,阅读约需11分钟。
📝
内容提要
上海人工智能实验室发布了化学大语言模型ChemLLM,能够通过对话交互执行化学学科任务,性能与GPT-4相当。ChemLLM为化学研究开辟新道路,融入结构化化学知识,树立了新的大语言模型标准。
🎯
关键要点
- 上海人工智能实验室发布了化学大语言模型ChemLLM,性能与GPT-4相当。
- ChemLLM能够通过对话交互执行化学学科任务,为化学研究开辟新道路。
- ChemLLM面临三大挑战:化学知识的结构化存储、特殊符号表示的理解、任务种类繁多的训练流程设计。
- ChemLLM的研究成果已开源,并提供免费商用。
- 创建并开源大规模化学数据集ChemData,涵盖700万条问答数据。
- ChemLLM模型架构基于InternLM2-Base-7B,通过两个阶段的指令微调训练得到。
- ChemBench基准测试构建了9项化学任务,减少语言模型输出风格对评估结果的影响。
- ChemLLM在化学能力评估中明显优于类似规模的一般LLMs,并在通用能力评估中表现出色。
- ChemLLM已完成升级,接入RAG功能,支持深度挖掘化学文献和联网搜索。
- HyperAI超神经官网上线了一键部署ChemLLM-7B-chat的教程。
➡️