GeoGalactica:地质科学领域的科学大型语言模型
原文中文,约500字,阅读约需2分钟。发表于: 。通过使用大型语言模型 (LLMs) 进行地球科学的进一步预训练和监督微调,我们得到了一个包含 300 亿参数的地球科学领域最大的语言模型 GeoGalactica,并且在技术报告中详细介绍了它的各个方面,包括数据收集、数据清洗、基础模型选择、预训练、微调和评估。
最新研究发现,大型语言模型(LLM)GPT-4在科学领域展示出卓越能力,包括药物发现、生物学、计算化学、材料设计和偏微分方程等。这一研究对于揭示GPT-4在各个研究领域中的潜力、加速科学进展和指导未来模型发展具有重要意义。初步探索表明,GPT-4在处理复杂问题和知识整合任务方面有希望的潜力。