本研究探讨了人工智能在药物发现中的应用,特别是大型语言模型的自主代理系统。提出了DO Challenge基准测试,以评估AI代理在药物筛选中的决策能力,Deep Thought系统表现优异。然而,研究也指出设计不足和不稳定性的问题,揭示了AI在该领域的机遇与挑战。
DeepThought-8B是基于LLaMA-3.1的8B推理模型,专注于逐步解决问题、编程和数学任务。它需要16GB VRAM,能够将问题分解为多个步骤并输出详细的JSON文档。尽管在推理任务上表现优于同类模型,但在大型模型如GPT-4o面前仍显不足。用户可自定义推理模式,模型可在Hugging Face或Ruliad网站下载。
完成下面两步后,将自动完成登录并继续当前操作。