HyperAI超神经 ·

覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4

💡 原文中文，约4700字，阅读约需11分钟。

📝

内容提要

上海人工智能实验室发布了化学大语言模型ChemLLM，能够通过对话交互执行化学学科任务，性能与GPT-4相当。ChemLLM为化学研究开辟新道路，融入结构化化学知识，树立了新的大语言模型标准。

🎯

关键要点

上海人工智能实验室发布了化学大语言模型ChemLLM，性能与GPT-4相当。
ChemLLM能够通过对话交互执行化学学科任务，为化学研究开辟新道路。
ChemLLM面临三大挑战：化学知识的结构化存储、特殊符号表示的理解、任务种类繁多的训练流程设计。
ChemLLM的研究成果已开源，并提供免费商用。
创建并开源大规模化学数据集ChemData，涵盖700万条问答数据。
ChemLLM模型架构基于InternLM2-Base-7B，通过两个阶段的指令微调训练得到。
ChemBench基准测试构建了9项化学任务，减少语言模型输出风格对评估结果的影响。
ChemLLM在化学能力评估中明显优于类似规模的一般LLMs，并在通用能力评估中表现出色。
ChemLLM已完成升级，接入RAG功能，支持深度挖掘化学文献和联网搜索。
HyperAI超神经官网上线了一键部署ChemLLM-7B-chat的教程。

❓

延伸问答

ChemLLM的主要功能是什么？

ChemLLM能够通过对话交互执行化学学科任务，性能与GPT-4相当。

ChemLLM面临哪些主要挑战？

ChemLLM面临化学知识的结构化存储、特殊符号表示的理解和任务种类繁多的训练流程设计三大挑战。

ChemData数据集包含多少条问答数据？

ChemData数据集涵盖700万条问答数据。

ChemLLM的模型架构基于什么？

ChemLLM的模型架构基于InternLM2-Base-7B，通过两个阶段的指令微调训练得到。

ChemLLM在化学能力评估中表现如何？

ChemLLM在化学能力评估中明显优于类似规模的一般LLMs，并在9项任务中有6项得分比GPT-4高。

如何部署ChemLLM-7B-chat？

用户可以登录hyper.ai，按照教程选择一键部署ChemLLM-7B-chat的选项进行操作。

🏷️

标签

ChemLLM GPT-4 ai gpt 上海人工智能化学大语言模型

➡️

继续阅读

AI 圈今天最大的瓜：GPT-6 越狱攻击，被 GLM 5.2 揪出了
「GPT-6」为了考试作弊，黑进了别人的服务器#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
涛思数据TDengine升级为AI原生工业数据平台
（全球TMT 2026年07月22日讯）涛思数据宣布TDengine产品重大升级，从高性能时序数据库正式演进为 […]
Building AI infrastructure with the Effingham County community
OpenAI announces Project Camellia in Effingham County, Georgia, with commitme...
AI 成本战的隐性成本与降本五层：从"成功率悖论"到"系统复杂度"（中） - 张善友
今天很多 AI 降本，表面上看是在压 token，本质上是在压复杂度
10 Newsletters Keeping You Ahead in AI
Cut through AI noise with 10 curated newsletters covering daily news, technic...
Meta made its own AI detection system. It should have just used Google’s
IIn March, Meta's Oversight Board called on the company to "meet its ...