小红花·文摘

本研究探讨了人工智能在药物发现中的应用，特别是大型语言模型的自主代理系统。提出了DO Challenge基准测试，以评估AI代理在药物筛选中的决策能力，Deep Thought系统表现优异。然而，研究也指出设计不足和不稳定性的问题，揭示了AI在该领域的机遇与挑战。