小红花·文摘

Loop世界模型论文登顶Hugging Face，来自中国一家初创，周鸿祎陆奇都投了

量子位 ·

英伟达的Jim Fan认为，世界建模将成为新的预训练范式，预计在2026年对机器人和多模态AI领域产生重要影响。通过预测合理的世界状态，世界建模推动物理AI的发展，强调视觉推理的重要性，可能会改变机器人技术的基础。

英伟达Jim Fan：「世界建模」是新一代预训练范式

量子位 ·

本研究提出了新基准Text2World，以解决大型语言模型在生成符号世界模型时的评估问题。经过强化学习训练的推理模型表现优于其他模型，但仍存在能力限制。研究探索了多种策略以提升模型的世界建模能力。

Text2World：大型语言模型符号世界模型生成的基准测试

BriefGPT - AI 论文速递 ·

对大语言模型（LLM）和ChatGPT的怀疑

DEV Community ·

本文介绍了一种基于对抗生成模型的模仿学习算法，能够通过无监督学习推断专家示范中的潜在结构，特别适用于自动驾驶领域。该算法能够准确复现人类驾驶行为，并通过课程学习扩展GAIL，以解决多主体驾驶中的挑战。此外，研究提出了新的世界建模方法和高效的生成模型模拟器，显著提升了自动驾驶系统的性能和安全性。

本文介绍了一种系统性的方法来生成高度逼真、注释的合成数据，以用于计算机视觉任务的深度神经网络的训练。该方法的主要贡献是一种程序性的世界建模方法，能够产生高度可变性和物理准确性的图像合成。我们的方法的优点包括灵活性、物理精确性、可扩展的图像合成、隐式广泛的类和特征覆盖以及完整的数据自检测以进行注释。在本文中，我们以自动驾驶车辆和机器人导航的语义分割为主要应用，使用合成数据对多个深度学习体系结构进行了训练和微调。评估表明，我们的方法提高了神经网络的性能，即使是适度的实施工作也能产生最先进的结果。

PDPK：一种用于制造业的综合流程数据和相应流程知识的框架