机器人语言:我们的新AI模型将视觉和语言转化为机器人行动
原文英文,约800词,阅读约需3分钟。发表于: 。Illustration of a robot arm picking up oranges from a countertop and placing them into a bowl.
近几十年来,人们一直将机器人设想为未来的主角,但机器人技术一直停留在科幻领域。现在,我们推出了一项新的机器人技术进展,使我们更接近一个有用机器人的未来。机器人变形器2(RT-2)是一种首创的视觉-语言-行动(VLA)模型,通过训练网络文本和图像,直接输出机器人行动。RT-2能够“说机器人话”。机器人需要在真实世界中有所基础,识别物体、理解外观,并知道如何操作。历史上的训练方法耗时耗费,不切实际。