量子位 ·

当200位具身从业者被拉进同一个屋子

Q: 具身智能的关注点目前转向了什么？

具身智能的关注点已转向数据模型。

Q: 未来具身智能行业的发展趋势是什么？

未来行业将向明确分工的协作生态发展。

💡 原文中文，约5400字，阅读约需13分钟。

📝

内容提要

具身智能的关注点已转向数据模型，数据采集面临认知对齐的挑战，模型训练需要大量真实数据。评测标准亟需统一，低分不一定代表模型性能差。未来应重视数据质量与复用性，推动无感化数据采集，以提升模型的泛化能力。

🎯

关键要点

具身智能的关注点已转向数据模型，数据采集面临认知对齐的挑战。
模型训练需要大量真实数据，2万小时真机数据用于预训练。
评测标准亟需统一，低分不一定代表模型性能差。
数据质量与复用性应受到重视，推动无感化数据采集。
当前具身模型对数据的利用率较低，需从有限数据中提取更多价值。
未来行业将向明确分工的协作生态发展，仿真与真机数据的关系需进一步明确。

🔎

延伸解读

数据采集的挑战

在具身智能领域，数据采集的最大难点在于认知对齐。算法团队与数据采集人员之间的沟通不畅，可能导致采集到的数据无法满足模型训练的需求。这种认知差异不仅影响数据质量，也可能延误项目进展，企业需重视这一问题，确保双方理解一致。

模型训练的有效性

当前的模型训练效率较低，数据显示，具身智能模型对数据的利用率远未达到理想水平。一个人需要十年的时间才能积累3万小时的交互数据，而儿童却能在较少的数据下完成复杂任务。这提示我们，提升数据利用效率比单纯增加数据量更为重要。

评测标准的必要性

具身智能的评测标准亟需统一，低分并不一定意味着模型性能差。评测基准的设计应考虑到任务的复杂性和多样性，确保能够真实反映模型的能力。建立科学的评测体系，有助于推动行业的健康发展。

❓

延伸问答

具身智能的关注点目前转向了什么？

具身智能的关注点已转向数据模型。

数据采集面临哪些主要挑战？

数据采集面临认知对齐的挑战，让数采员理解算法团队的需求。

模型训练需要多少真实数据进行预训练？

模型训练需要2万小时的真实数据进行预训练。

评测标准为何需要统一？

评测标准需要统一，以确保评测的科学性和有效性。

未来具身智能行业的发展趋势是什么？