工业场景中的主体视角 RGB + 深度行为识别
原文中文,约300字,阅读约需1分钟。发表于: 。我们的研究集中在认识行为,特别是来自以自我为中心视角的行为,并结合深度模态从工业环境中识别行为。针对现实世界中多模态行为发生的困难,我们提出了一种训练策略,并通过后期融合来结合来自每种模态的预测,这在 MECCANO 数据集上明显优于先前的工作,并在 ICIAP 2023 的多模态行为识别挑战中获得第一名。
该研究提出了一种训练策略,用于识别工业环境中的多模态行为,并通过后期融合来结合每种模态的预测。该方法在 MECCANO 数据集上表现优异,并在 ICIAP 2023 的多模态行为识别挑战中获得第一名。