机器学习中,学习多个视图的复杂对象的有意义表示是核心任务。本文提出了多边匹配间隙(M3G),利用多边最优传输(MM-OT)理论工具同时结合所有视图的损失。实验结果显示,M3G 在自监督和多模态任务中比成对损失的多视图扩展具有更好的性能。
该研究提出了两种新方法,用于在拥挤和开放环境下进行人群计数。这些方法利用多个视图收集的信息,结合使用多个相机,以扩大视野并缓解单个相机计数方法常常受到的遮挡的问题。实验结果表明,这些方法能够提供准确的计数结果,但其中一种方法需要解决更复杂的问题,表现出较高的误差率。
完成下面两步后,将自动完成登录并继续当前操作。