机器之心 ·

大语言模型变身软体机器人设计「自然选择器」，GPT、Gemini、Grok争做最佳

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

大型语言模型（LLM）在软体机器人设计中展现出潜力。密歇根大学的研究开发了RoboCrafter-QA基准测试，以评估LLM作为“自然选择器”的能力。研究表明，LLM在简单任务中表现良好，但在处理细微设计差异时仍面临挑战，强调了清晰任务描述的重要性。未来需要改进模型以应对复杂设计选择。

🎯

🔎

软体机器人设计面临诸多挑战，包括自由度、材料特性和系统协调等。与传统刚性机器人相比，软体机器人在复杂环境中具有更好的适应性，但其设计过程复杂，往往依赖专家的直觉和高成本的模拟。这使得AI辅助设计的研究显得尤为重要。

研究表明，清晰的任务描述对LLM的决策能力至关重要。模糊的任务描述会显著降低模型的准确率，强调了在设计选择任务中提供全面信息的必要性。这一发现对未来的AI设计系统开发具有重要指导意义。

LLM在设计初始化阶段表现出色，能够有效迁移知识生成设计。研究显示，具有参考知识的LLM生成的设计有效性高达100%，而无参考知识的设计有效性仅为38%。这表明LLM在零样本设计生成中具有实际应用潜力。

❓

大型语言模型在软体机器人设计中展现出自动化和智能化的潜力，能够作为设计的“自然选择器”。

RoboCrafter-QA基准测试旨在评估大型语言模型在软体机器人设计中的理解和选择能力。

Gemini-1.5-Pro在简单和困难任务中表现最佳，其次是Gemini-2.0-flash和Grok-2。

软体机器人设计面临自由度、材料特性复杂和系统协调等挑战。

模糊的任务描述显著降低了模型的性能，强调了清晰任务描述的重要性。

未来研究需开发针对复杂设计的训练策略和提示框架，以提高模型在细微设计权衡中的性能。

🏷️